طرح درس دادهکاوی پیشرفته
فعالیتهای
کلاسی و تکالیف |
اهداف آموزشی |
موضوع |
هفته |
مطالعه فصل
اول کتاب و معرفی ابزارهای دادهکاوی |
آشنایی با مفاهیم
اولیه، تاریخچه و کاربردهای دادهکاوی |
مقدمهای بر
دادهکاوی پیشرفته |
هفته 1 |
انجام تمرین
پیشپردازش دادهها بر روی یک مجموعه داده ساده و پیاده سازی با نرم افزار R |
تکنیکهای پاکسازی، کاهش، و نرمالسازی
دادهها |
جمعآوری و پیشپردازش دادهها |
هفته 2 |
اجرای تمرین
بر روی مجموعه داده نامتوازن |
بررسی روشهای
نمونهبرداری و تکنیکهای تعادلسازی دادهها |
روشهای نمونهبرداری
و تنظیم دادهها |
هفته 3 |
پیادهسازی
الگوریتم دستهبندی با نرم
افزار R |
معرفی و پیادهسازی الگوریتمهای K-نزدیکترین همسایه و درخت تصمیم |
الگوریتمهای دستهبندی پایهای |
هفته 4 |
تمرین و
پروژه دستهبندی با دادههای واقعی و پیاده سازی با نرم افزار R |
بررسی جنگل
تصادفی، ماشین بردار پشتیبان (SVM) و
درختهای تقویتی |
الگوریتمهای
دستهبندی پیشرفته |
هفته 5 |
انجام یک
پروژه عملی ارزیابی مدل با Cross-Validation |
معرفی معیارهای ارزیابی مدلها و تکنیکهای
اعتبارسنجی |
ارزیابی و اعتبارسنجی مدلها |
هفته 6 |
پیادهسازی
و تحلیل خوشهبندی با ابزارهای دادهکاوی |
بررسی K-Means، و خوشهبندی سلسلهمراتبی |
الگوریتمهای
خوشهبندی پایهای |
هفته 7 |
پروژه خوشهبندی
پیشرفته با استفاده از دادههای پیچیده |
بررسی الگوریتمهای DBSCAN و خوشهبندی طیفی |
الگوریتمهای خوشهبندی پیشرفته |
هفته 8 |
تمرین کاهش
ابعاد و تحلیل نتایج |
بررسی روشهای PCA و LDA برای کاهش ابعاد |
کاهش ابعاد
و انتخاب ویژگیها |
هفته 9 |
پیادهسازی PCA بر روی دادههای پیچیده و پیاده سازی با نرم افزار R |
بررسی کاربردهای PCA و روشهای انتخاب ویژگی در دادههای
بزرگ |
تحلیل مولفههای اصلی و کاربردها |
هفته 10 |
پروژه کوچک
دادهکاوی متن و تحلیل وب |
تکنیکهای تحلیل
متن، وبکاوی و استخراج اطلاعات |
روشهای دادهکاوی
در متن و وب |
هفته 11 |
پیاده سازی
با نرم افزار R |
تکنیکهای تحلیل متن، وبکاوی و استخراج
اطلاعات |
ادامه روشهای دادهکاوی در متن و وب |
هفته 12 |
تمرین با
ابزارهای یادگیری عمیق مانند TensorFlow |
معرفی شبکههای
عصبی و روشهای یادگیری عمیق |
یادگیری عمیق
و شبکههای عصبی |
هفته 13 |
ارائه و بحث
در کلاس پیاده سازی با نرم افزار R |
تحلیل موردی پروژههای موفق دادهکاوی
پیشرفته |
مطالعات موردی و بررسیهای عملی |
هفته 14 |
ارائه و
بحث در کلاس پیاده سازی با نرم افزار R |
تحلیل موردی
پروژههای موفق دادهکاوی پیشرفته |
ادامه مطالعات
موردی و بررسیهای عملی |
هفته 15 |
انجام پروژه
پایانی و بررسی آن در کلاس و گرفتن آزمون عملی |
مرور مباحث تدریس شده و آمادهسازی برای
امتحان پایانترم |
مرور، جمعبندی و آزمون عملی |
هفته 16 |
منابع
پیشنهادی:
1. Data Mining: Concepts and Techniques, Jiawei Han, Micheline
Kamber, Jian Pei.
Third Edition
2. R and Data Mining: Examples and Case Studies. Yanchang Zhao.