Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences)...Ehsan Asgarianمعرفی مفاهیم، کاربردها، تکنیک ها و روشها، ابزارها، فرایندها و برخی تجربیات داده کاوی در ایران
Hadoop Case Studies in the Real World in Persian - کاربردهای هدوپ در دنیای واقعیMobin RanjbarHadoop Case Studies in the Real World in Persian - کاربردهای هدوپ در دنیای واقعی
Big Data Processing in Cloud Computing EnvironmentsFarzad NozarianThis is my Seminar presentation, adopted from a paper with the same name (Big Data Processing in Cloud Computing Environments), and it is about various issues of Big Data, from its definitions and applications to processing it in cloud computing environments. It also addresses the Big Data technologies and focuses on MapReduce and Hadoop.
Introduction to Apache Hadoop in Persian - آشنایی با هدوپMobin Ranjbarآشنایی با هدوپ - مرجع هدوپ ایران - شرکت مهندسی نرم افزار ایده پردازان فرافکر
www.hadoop.ir
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازMobin RanjbarIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
مرجع هدوپ ایران
www.hadoop.ir
دانلود فیلم کارگاه از : download.hadoop.ir
داده، dikw ، داده بزرگ و علم دادهfatemeh zatajamData, DIKW, big data& data science
Gu Jifaa,Zhang Linglingb
استاد: جناب آقای دکتر شقاقی
ترجمه: فاطمه ذات عجم
دانشجوی کارشناسی ارشد علم اطلاعات شهید بهشتی
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهرانFarafekr Technology1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
www.hadoop.ir
Internet of Things Security Challlengesquickheal_co_irاینترنت اشیا و چالش های امنیتی پیش رو
معرفی فناوری اینترنت اشیا و کاربردهای آن و چالش های امنیتی و نحوه مقابله با آنها
فیلم وبینار مربوطه در:
http://www.quickheal.co.ir/webinar/webinar-videos/
عصر کلان داده، چرا و چگونه؟datastackThe document discusses the concept of big data, emphasizing its characteristics such as volume, variety, and velocity, along with the need for new technologies and frameworks like Hadoop for processing large datasets. It explains the evolution from traditional data generation and consumption models to a scenario where individuals actively participate in data generation. Key components of big data solutions, like the Hadoop ecosystem and various types of NoSQL databases, are also highlighted, focusing on their functionalities and advantages.
مروی بر استارترکیتها و پلتفرمهای اینترنت اشیاءstartupIoTارائه شده در اولین پیش-رویداد "آیوتی کاپ"، توسط مهندس علیرضا عبدشاه. دوشنبه 24 اسفند 94، محل برگزاری رویداد: گروه تلگرامی استارتاپ آیوتی
راهنمای سریع گذار به وب ۳ از منظر کلان دادهWeb Standards Schoolدر دنیای اینترنت شاهد متولد شدن کودکی باهوش به نام وب ۳ می باشیم که می توان آنرا به یک شبه انسان تشبیه کرد. اما این کودک به خودی خود باهوش نیست. این هوش را از تحلیل و جمع آوری داده ها کسب می کند و هرچه که این داده ها بیشتر، بهتر و سریعتر جمع آوری و تحلیل شود به هوش بیشتری دست خواهیم یافت. در این ارائه سعی می شود به معرفی و آزمایش روش های جمع آوری و تحلیل داده های کلان که به هوشمندی و گذار به سمت وب ۳ می انجامد پرداخته شود.
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.iraminnezaratمجموعه ارائه های بنده درباره موضوع تکنولوژیهای برنامه نویسی موازی و همگرایی آن با بیگ دیتا
HPC and Big Data
دکتر امین نظارات
aminnezarat@gmail.com
آموزش پایگاه داده ها - بخش یکمfaradarsپایگاه داده ها یکی از دروسی است که دانشجویان رشته کامپیوتر باید در مقطع کارشناسی بگذرانند. در این مجموعه ابتدا مفاهیم اولیه در پایگاه داده تدریس می شود. سپس در فصل دوم مدل رابطه ای و در فصل سوم نمودار ER تدریس می شود.
سرفصل هایی که در این آموزش به آن پرداخته شده است:
درس یکم: تعاریف اولیه سیستم پایگاه داده
درس دوم: ساختار داده ای رابطه ای
درس سوم: مدل ER
درس چهارم: جبر رابطه ایی
...
برای توضیحات بیشتر و تهیه این آموزش لطفا به لینک زیر مراجعه بفرمائید:
http://faradars.org/courses/fvsft105
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازMobin RanjbarIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
مرجع هدوپ ایران
www.hadoop.ir
دانلود فیلم کارگاه از : download.hadoop.ir
داده، dikw ، داده بزرگ و علم دادهfatemeh zatajamData, DIKW, big data& data science
Gu Jifaa,Zhang Linglingb
استاد: جناب آقای دکتر شقاقی
ترجمه: فاطمه ذات عجم
دانشجوی کارشناسی ارشد علم اطلاعات شهید بهشتی
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهرانFarafekr Technology1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
www.hadoop.ir
Internet of Things Security Challlengesquickheal_co_irاینترنت اشیا و چالش های امنیتی پیش رو
معرفی فناوری اینترنت اشیا و کاربردهای آن و چالش های امنیتی و نحوه مقابله با آنها
فیلم وبینار مربوطه در:
http://www.quickheal.co.ir/webinar/webinar-videos/
عصر کلان داده، چرا و چگونه؟datastackThe document discusses the concept of big data, emphasizing its characteristics such as volume, variety, and velocity, along with the need for new technologies and frameworks like Hadoop for processing large datasets. It explains the evolution from traditional data generation and consumption models to a scenario where individuals actively participate in data generation. Key components of big data solutions, like the Hadoop ecosystem and various types of NoSQL databases, are also highlighted, focusing on their functionalities and advantages.
مروی بر استارترکیتها و پلتفرمهای اینترنت اشیاءstartupIoTارائه شده در اولین پیش-رویداد "آیوتی کاپ"، توسط مهندس علیرضا عبدشاه. دوشنبه 24 اسفند 94، محل برگزاری رویداد: گروه تلگرامی استارتاپ آیوتی
راهنمای سریع گذار به وب ۳ از منظر کلان دادهWeb Standards Schoolدر دنیای اینترنت شاهد متولد شدن کودکی باهوش به نام وب ۳ می باشیم که می توان آنرا به یک شبه انسان تشبیه کرد. اما این کودک به خودی خود باهوش نیست. این هوش را از تحلیل و جمع آوری داده ها کسب می کند و هرچه که این داده ها بیشتر، بهتر و سریعتر جمع آوری و تحلیل شود به هوش بیشتری دست خواهیم یافت. در این ارائه سعی می شود به معرفی و آزمایش روش های جمع آوری و تحلیل داده های کلان که به هوشمندی و گذار به سمت وب ۳ می انجامد پرداخته شود.
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.iraminnezaratمجموعه ارائه های بنده درباره موضوع تکنولوژیهای برنامه نویسی موازی و همگرایی آن با بیگ دیتا
HPC and Big Data
دکتر امین نظارات
aminnezarat@gmail.com
آموزش پایگاه داده ها - بخش یکمfaradarsپایگاه داده ها یکی از دروسی است که دانشجویان رشته کامپیوتر باید در مقطع کارشناسی بگذرانند. در این مجموعه ابتدا مفاهیم اولیه در پایگاه داده تدریس می شود. سپس در فصل دوم مدل رابطه ای و در فصل سوم نمودار ER تدریس می شود.
سرفصل هایی که در این آموزش به آن پرداخته شده است:
درس یکم: تعاریف اولیه سیستم پایگاه داده
درس دوم: ساختار داده ای رابطه ای
درس سوم: مدل ER
درس چهارم: جبر رابطه ایی
...
برای توضیحات بیشتر و تهیه این آموزش لطفا به لینک زیر مراجعه بفرمائید:
http://faradars.org/courses/fvsft105
طراحی سیستم های اطلاعاتی بر مبنای قابلیت های Nosql بانک های اطلاعاتی عباس بني اسدي مقدمدر این مقاله روشی جهت طراحی سیستم های اطلاعاتی با استفاده از توع های داده ای در بانک اطلاعاتی پستگرس از جمله
hstore
و
json
ارایه شده است
دادهکاوی و زبان برنامهنویسی Rجشنوارهٔ روز آزادی نرمافزار تهران سرفصلها:
نگاهی اجمالی به ضرورت طرح مبحث دادهکاوی و تاریخچه تکامل آن
کاربردهای دادهکاوی و بررسی مثالهای جهان واقعی
بررسی فرایند دادهکاوی
بررسی مدل CRISP-DM
بررسی انواع دادههای قابل کاوش
معرفی انواع الگوهای قابل کشف
انتخاب روش دادهکاوی مناسب براساس مسئله
نگاهی اجمالی به بحث پیشپردازش دادهها
نگاهی به الگوریتمهای دادهکاوی
فناوریهای قابل استفاده در دادهکاوی
بررسی زبان برنامهنویسی R، و استفاده از آن در دادهکاوی در گامهای مختلف دادهکاوی
Ceph: A Powerful, Scalable, and Flexible Storage SolutionYashar Esmaildokht## Ceph: A Powerful, Scalable, and Flexible Storage Solution
Ceph is an open-source, distributed storage platform that offers a range of features, including object storage, block storage, and file systems. It provides a highly scalable, reliable, and flexible solution for managing your data.
Ceph's Key Components:
* RADOS (Reliable Autonomic Distributed Object Storage): Ceph's core storage component. It provides object storage capabilities and forms the basis for other services.
* RBD (RADOS Block Device): Ceph's block storage service. Allows you to create and manage block devices that can be attached to virtual machines or containers.
* CephFS (Ceph File System): Ceph's distributed file system. Offers scalable and reliable shared file system access for applications and users.
Ceph Backfill:
Backfill is a process used to repopulate data onto newly added OSDs (Object Storage Devices) in a Ceph cluster. Here's how it works:
1. Data Imbalance: When new OSDs are added, the cluster may have an imbalance in data distribution. Some OSDs might have more data than others.
2. Backfill Process: Ceph identifies the underutilized OSDs and starts copying data from overloaded OSDs to these new OSDs.
3. Data Balancing: The backfill process aims to achieve an even distribution of data across all OSDs in the cluster.
Ceph Scrub:
Scrubbing is a data integrity check that Ceph performs to detect and repair errors in stored data. Here's the process:
1. Data Verification: Ceph compares the data stored on different OSDs that hold replicas of the same object.
2. Error Detection: Any discrepancies between the data replicas are flagged as errors.
3. Data Repair: Ceph attempts to repair the errors by copying the correct data from another OSD.
Ceph Erasure Coding (EC):
Erasure coding is a technique used to increase data resilience and reduce storage overhead in a Ceph cluster.
* Data Chunking: Data is divided into smaller chunks, and a parity chunk is generated.
* Data Distribution: These chunks and parity chunks are distributed across multiple OSDs in the cluster.
* Data Recovery: Even if some OSDs fail, the lost data can be recovered from the remaining chunks and parity chunks.
Benefits of EC:
* Increased Data Resilience: Can tolerate more OSD failures without losing data.
* Reduced Storage Overhead: Reduces the total storage capacity required for storing data replicas.
* Improved Performance: Can enhance performance by spreading the data load across more OSDs.
Understanding Ceph, backfill, scrub, and EC is crucial for efficient operation and maintenance of a Ceph cluster. These mechanisms ensure data integrity, availability, and scalability, making Ceph a robust and powerful solution for storage management.
Data Management System- Haseb System CoHamed Ghazanfariابزار حاسبسيستم در طراحي و پيادهسازي سيستمهاي اطلاعاتي: DMS
شركت حاسبسيستم با بهرهگيري از ابزار DMS به طراحي و پيادهسازي سيستمهاي اطلاعاتي سازمانها ميپردازد. DMS ابزاري است جهت توسعه سيستمهاي مبتني بر داده كه با دارا بودن اكثر امكانات لازم براي طراحي و ساخت يك نرم افزار، به تولید نرم افزار در كمترين زمان ممكن ميپردازد.
نمایه سازی ماشینی در گوگلJavad Pourhosainiنحوه نمایه سازی و ایندکسینگ در موتور جستجوی گوگل و دیگر موتورهای جستجو.
به همراه توضیحات تکملی در قسمت Note مربوط به هر اسلاید
تهیه شده در بهار 1395
جواد پورحسینی
3. 9/16/20163
From the dawn of civilization until
2003, humankind generated five
exabytes of data. Now we produce
five exabytes every two days…and
the pace is accelerating.
Eric Schmidt,
Executive Chairman, Google
6. 9/16/20166
The ‘Datafication’
of our World;
• Activities
• Conversations
• Words
• Voice
• Social Media
• Browser logs
• Photos
• Videos
• Sensors
• Etc.
Volume
Variety
Velocity
Analysing
Big Data:
• Text analytics
• Sentiment analysis
• Face recognition
• Voice analytics
• Movement analytics
• Etc.
Value
12. 9/16/201613
Ambari™: A web-based tool for provisioning, managing, and monitoring Apache
Hadoop clusters which includes support for Hadoop HDFS, Hadoop MapReduce, Hive,
HCatalog, HBase, ZooKeeper, Oozie, Pig and Sqoop.
Hue : a web interface for Hadoop projects, supports many of the more widely used
components of the Hadoop ecosystem. It features file browsers for HDFS and HBase
and a job browser for MapReduce/YARN.
ZooKeeper™: is a service for coordination and synchronization of distributed systems.
Mahout™: A Scalable machine learning and data mining library.
37. 9/16/201646
Tehran
MSTT Data
Warehouse
(18M data per
day)
AVL
6M locations a
day
BluetoothS
ensors
1.2M vehicles a
day
SCATS
log files
2M log a day of
1400 approaches
Speed
Cameras
5M vehicles a day
e-Ticket
4M transactions a
day
Traffic Zone
Cameras
300K vehicles a
day
الگ داده هزاران روزانه تولید
شهرسازی سیستمشهرداری
روزانه تولیدداده میلیون چند
مختلف منابع از ترافیکی
تولیدروزانهصدهاداد میلیونه
CDRوADSLدرمخابرات