پروژه پایانی داده کاوی برای رشته کامپیوتر
فصل ۱
مروری بر دادهکاوی
۱-۱: تعریف دادهکاوی:
۲-۱: تاریخچه دادهکاوی
۳-۱- چه چیزی سبب پیدایش دادهکاوی شده است؟
۴-۱- اجزای سیستم دادهکاوی:
۵-۱- جایگاه دادهکاوی در میان علوم مختلف
۶-۱- قابلیتهای دادهکاوی
۷-۱- چرا به دادهکاوی نیاز داریم؟
۸-۱- دادهکاوی چه کارهایی نمیتواند انجام دهد؟
۹-۱- کاربردهای دادهکاوی
۱-۹-۱-کاربردهای پیشبینی کننده :
۲-۹-۱-کاربردهای توصیفکننده :
۱۰-۱- ابزارهای تجاری دادهکاوی (Data Mining Commercial Tools):
۱۱-۱- داده کاوی و انبار دادهها
۱-۱۱-۱- تعاریف انبار داده:
۲-۱۱-۱- چهار خصوصیت اصلی انبار داده
۳-۱۱-۱- موارد تفاوت انبار داده و پایگاه داده
۱۲-۱- دادهکاوی و OLAP
۱-۱۲-۱- OLAP:
۱-۱۲-۱- انواع OLAP:
۱۳-۱- مراحل فرایند کشف دانش از پایگاه دادهها
۱-۱۳-۱- انبارش دادهها
۲-۱۳-۱- انتخاب دادهها
۳-۱۳-۱- پاکسازی – پیش پردازش- آماده سازی
۴-۱۳-۱ – تبدیل دادهها
۵-۱۳-۱- کاوش در دادهها (Data Mining)
۶-۱۳-۱- تفسیر نتیجه
فصل ۲
قوانین ارتباطی
۱-۲- قوانین ارتباطی:
۲-۲- اصول پایه
۱-۲-۲- شرح مشکل جدی
۲-۲-۲- پیمایش فضای جستجو[۱]
۳-۲-۲- مشخص کردن درجه حمایت مجموعه اقلام
۳-۲- الگوریتمهای عمومی:
۱-۳-۲- دستهبندی:
۲-۳-۲- BFS و شمارش رویدادها:
۳-۳-۲ – BFS ، دو نیمسازی TID-List:
۴-۳-۲- DFS و شمارش رویدادها
۵-۳-۲- DFS و دونیم سازی TID-List
۴-۲- الگوریتم Apriori:
۱-۴-۲- مفاهیم کلیدی:
۲-۴-۲- پیاده سازی الگوریتم Apriori:
۵-۲- الگوریتم رشد الگوی تکرار شونده(FP-growth)
۱-۵-۲ چرا رشد الگوی تکرار سریع است؟
۶-۲-مقایسه دوالگوریتم Apriori و FD Growth
فصل سوم
وبکاوی و متنکاوی
۱-۳-کاوش وب (وبکاری)[۲]
۱-۱-۳- الگوریتم های هیتس[۳] ولاگسام[۴]
۲-۱-۳ کاوش الگوهای پیمایش مسیر
۳-۳ متنکاوی[۵]
۱-۲-۳ کاربردهای متنکاوی
۱-۱-۲-۳ جستجو و بازیابی
۲-۱-۲-۳ گروهبندی و طبقهبندی داده
۳-۱-۲-۳ خلاصهسازی
۴-۱-۲-۳ روابط میان مفاهیم
۵-۱-۲-۳ یافتن و تحلیل گرایشات
۶-۱-۲-۳ برچسب زدن نحوی[۶] (POS)
۷-۱-۲-۳ ایجاد Thesaurus و آنتولوژی بصورت اتوماتیک
۲-۲-۳ فرآیند متنکاوی
۳-۳-۳ روشهای متنکاوی
اصطلاح Data Mining همانطور که از ترجمه آن به دادهکاوی مشخص میشود، به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از دادههای یک یا چند بانک اطلاعاتی بزرگ است. اطلاعات استخراج شده در تعریف Data Mining بطور ضمنی به معنی اطلاعاتی است که بر اساس آن بتوان به نتایجی دست یافت که بطور معمول ملموس نیستند. در این تعریف بر بزرگ بودن بانکهای اطلاعاتی و یا حجم زیاد دادههای مورد پردازش تاکید میشود. علت این است که از نظر آماری و تئوری اطلاعات، تجزیه و تحلیل دادهها و یا آنطور که در این اصطلاح تعبیر میشود، کاوش در حجم کم دادههای یک بانک به نتایج قابل قبولی منجر نمیشود. به کمک ابزارهای Data Mining میتوان مقادیر متغیرهای را پیشبینی و توصیف نمود. این ابزارها در فرایندهای تصمیمگیری متکی بر اطلاعات و دانش [۱] کاربر فراوان دارند و فعالیتهای تجاری نوین و مدرن امروزه به شدت بر آن متکی است. فرایند Data Mining را نباید با روشهای متداول آنالیز داده و اطلاعات و سیستمهای تصمیمگیری معمولی یکی دانست. به کمک روشهای Data Mining میتوان به پرسشهایی (عمدتاً تجاری) پاسخ گفت که بطور سنتی عملاً امکان وجود ندارد.