آموزش کلان داده و پایگاه داده غیر رابطه ای NOSQL
پایگاه داده غیر رابطهای یا NOSQL چیست؟
پایگاه داده غیر رابطهای یا NoSQL به مجموعهای از سیستمهای مدیریت پایگاه داده اطلاق میشود که متمرکز بر ذخیره و بازیابی دادههای غیر رابطهای هستند. در این نوع از پایگاه دادهها، اطلاعات به صورت ساختار یافته نیستند و برای ذخیره و بازیابی دادهها از روشها و فناوریهای مختلف استفاده میشود.
در مقابل رویکرد سنتی پایگاه داده رابطهای، که از مدل رابطهای برای ذخیره و بازیابی دادهها استفاده میکند، پایگاه دادههای غیر رابطهای از مدلهای مختلفی برای نگهداری دادهها استفاده میکنند. این مدلها شامل مدل سلسله مراتبی، مدل شیءگرا، مدل اسنادی، مدل وابستگیهای کلیدی و مدل ستونی هستند.
در پایگاه دادههای غیر رابطهای، از ساختارهای دادهای متفاوتی نظیر سلسله مراتب، آرایه، لیست و متن استفاده میشود. همچنین، در این نوع از پایگاه دادهها، عملیات مانند جستجو، اضافه کردن و حذف دادهها با استفاده از سیستمهای توزیع شده و محاسبات موازی انجام میشود.
یکی از ویژگیهای مهم پایگاه دادههای NoSQL، قابلیت افزایش افقی یا قابلیت مقیاسپذیری آنها است. به این معنی که با افزایش تعداد کاربران و حجم دادهها، میتوان به راحتی سرورها و سیستمهای مدیریت پایگاه داده را افزایش داد. این ویژگی باعث میشود که پایگاه دادههای NoSQL برای پروژههایی که نیازمند قابلیت مقیاسپذیری بالا هستند، مناسب باشند.
به طور کلی، پایگاه دادههای NoSQL در حال حاضر در بسیاری از برنامههای کاربردی استفاده میشوند. از جمله موارد استفاده از این نوع پایگاه دادهها میتوان به برنامههای تحلیل داده، برنامههای شبکهای، برنامههای تحت وب و برنامههای موبایل اشاره کرد.
هرچند که پایگاه دادههای غیر رابطهای مزایا و قابلیتهای منحصر به فرد خود را دارند، اما نیاز به شناخت و آموزش متفاوتی نسبت به پایگاه دادههای رابطهای دارند. همچنین، انتخاب نوع پایگاه داده مناسب باید با توجه به نیازها و الزامات پروژه انجام شود.
چرا باید پایگاه داده غیر رابطهای یا NOSQL را یاد بگیریم؟
در دنیای امروزی که حجم دادهها رو به رشد است، پایگاه دادههای غیر رابطهای یا NOSQL به عنوان یک راه حل جدید برای ذخیره و مدیریت این حجم عظیم از دادهها ظهور کرده است. این نوع پایگاه دادهها از مدل سنتی رابطهای که بر اساس جداول و روابط بین آنها استوار است، تفاوت دارند.
یادگیری پایگاه دادههای غیر رابطهای برای کاربران و توسعهدهندگان بسیار مفید است زیرا این نوع پایگاه دادهها امکانات بسیاری را در اختیار قرار میدهند. از جمله این امکانات میتوان به قابلیت افزایش مقیاس پذیری، عملکرد بهتر در مقابل بار متغیر، امکان استفاده از دادههای ناهمگون و چندساختاره، سرعت بالاتر در عملیات خواندن و نوشتن دادهها و قابلیت پشتیبانی از اپلیکیشنهای بزرگ اشاره کرد.
فهرست سرفصلها و رئوس مطالب مطرح شده در اين مجموعه آموزشی، در ادامه آمده است:
فصل یکم: مروری بر کلان دادهها و پایگاه دادههای غیر رابطهای
- درس یکم: مروری بر محدودیتهای بانک اطلاعاتی رابطهای
- درس دوم: معرفی پایگاه داده غیر رابطهای و کلان داده
فصل دوم: انجام عملیات روی کلان داده با پایگاه داده غیر رابطهای
- درس سوم: آمادهسازی دادهها در پایگاه داده غیر رابطهای
- درس چهارم: مدلسازی بر روی دادهها
فصل سوم: پایگاه دادههای غیر رابطهای مبتنی بر سند
- درس پنجم: مروری بر ساختار مبتنی بر سند و نصب و اجرای MongoDB ،Robomongo و Jupyter
- درس ششم: معرفی دستورات Pymongo برای انجام عملیات روی داده در Jupyter
- درس هفتم: آشنایی با دستورات درج سند و معرفی کلان داده مربوطه
- درس هشتم: کار با کلان داده در MongoDB
- درس نهم: درج اطلاعات کلان داده در MongoDB
- درس دهم: خواندن اطلاعات، دستکاری و اندیسگذاری کلان دادهها در Jupyter
- درس یازدهم: کار با کتابخانه Pandas جهت توصیف دادههای بازیابیشده از MongoDB
فصل چهارم: پایگاه دادههای غیر رابطهای ستونی گسترده
- درس دوازدهم: مروری بر Cassandra و ویژگیهای آن برای کار با کلان دادهها
- درس سیزدهم: نصب Cassandra در ویندوز
- درس چهاردهم: آمادهسازی کلان داده، کار با Cassandra در Jupyter، آشنایی با دستورات CQL و ساخت Keyspace و Table
- درس پانزدهم: ایجاد جدول طبق کلان داده و دسترسی به دادهها در Jupyter
- درس شانزدهم: آمادهسازی و واردکردن تمامی اطلاعات کلان داده به Cassandra در Jupyter و معرفی Spark و مقایسه با Cassandra
فصل پنجم: پایگاه دادههای غیر رابطهای مبتنی بر گراف
- درس هفدهم: معرفی پایگاه داده مبتنی بر گراف
- درس هجدهم: نصب Neo4j، تعریف کاربر و ساخت پایگاه داده در Neo4j
- درس نوزدهم: ساخت گره و لینک به کمک دستورات Cypher در Neo4j و آشنایی با دستورات Create ،Merge ،Delete ،Update و Match
- درس بیستم: آمادهسازی و واردکردن اطلاعات کلان داده به Neo4j در Jupyter
- درس بیستویکم: اتصال به پایگاه داده Neo4j در Jupyter، ذخیرهسازی دیتاست در پایگاه داده و خواندن اطلاعات در Jupyter
- درس بیستودوم: ساخت گراف (گره و لینک) در Neo4j با Jupyter
- درس بیستوسوم: بررسی و مقایسه انواع پایگاه داده غیر رابطهای در کاربرد کلان داده
فصل ششم: راهنمایی ادامه مسیر
- درس بیستوچهارم: جمعبندی و نتیجه مباحث
- درس بیستوپنجم: ادامه یادگیری
دیدگاهتان را بنویسید