پروژه پایانی داده کاوی برای رشته کامپیوتر

فصل ۱

مروری بر داده­کاوی

۱-۱: تعریف داده­کاوی:

۲-۱: تاریخچه داده­کاوی

۳-۱- چه چیزی سبب پیدایش داده­کاوی شده است؟

۴-۱- اجزای سیستم داده­کاوی:

۵-۱- جایگاه داده­کاوی در میان علوم مختلف

۶-۱- قابلیتهای داده­کاوی

۷-۱- چرا به داده­کاوی نیاز داریم؟

۸-۱- داده­کاوی چه کارهایی نمی‌تواند انجام دهد؟

۹-۱- کاربردهای داده­کاوی

۱-۹-۱-کاربرد­های پیش­بینی کننده :

۲-۹-۱-کاربردهای توصیف­کننده :

۱۰-۱- ابزارهای تجاری داده­کاوی (Data Mining Commercial Tools):

۱۱-۱- داده کاوی و انبار داده‌ها

۱-۱۱-۱- تعاریف انبار داده:

۲-۱۱-۱- چهار خصوصیت اصلی انبار داده

۳-۱۱-۱- موارد تفاوت انبار داده و پایگاه داده

۱۲-۱- داده­کاوی و OLAP

۱-۱۲-۱- OLAP:

۱-۱۲-۱- انواع OLAP:

۱۳-۱- مراحل فرایند کشف دانش از پایگاه داده‌ها

۱-۱۳-۱- انبارش داده‌ها

۲-۱۳-۱- انتخاب داده‌ها

۳-۱۳-۱- پاکسازی – پیش پردازش- آماده سازی

۴-۱۳-۱ – تبدیل داده‌ها

۵-۱۳-۱- کاوش در داده‌ها (Data Mining)

۶-۱۳-۱- تفسیر نتیجه

فصل ۲

      قوانین ارتباطی

۱-۲- قوانین ارتباطی:

۲-۲- اصول پایه

۱-۲-۲- شرح مشکل جدی

۲-۲-۲- پیمایش فضای جستجو[۱]

۳-۲-۲- مشخص کردن درجه حمایت مجموعه اقلام

۳-۲- الگوریتم‌های عمومی:

۱-۳-۲- دسته­بندی:

۲-۳-۲- BFS و شمارش رویدادها:

۳-۳-۲ – BFS ، دو نیم‌سازی TID-List:

۴-۳-۲- DFS و شمارش رویدادها

۵-۳-۲- DFS و دونیم سازی TID-List

۴-۲- الگوریتم Apriori:

۱-۴-۲- مفاهیم کلیدی:

۲-۴-۲- پیاده سازی الگوریتم Apriori:

۵-۲- الگوریتم رشد الگوی تکرار شونده(FP-growth)

۱-۵-۲ چرا رشد الگوی تکرار سریع است؟

۶-۲-مقایسه دوالگوریتم Apriori و FD Growth

فصل سوم

      وب­کاوی و متن­کاوی

۱-۳-کاوش وب (وب­کاری)[۲]

۱-۱-۳- الگوریتم های هیتس[۳] ولاگسام[۴]

۲-۱-۳ کاوش الگوهای پیمایش مسیر

۳-۳ متن­کاوی[۵]

۱-۲-۳ کاربردهای متن­کاوی

۱-۱-۲-۳ جستجو و بازیابی

۲-۱-۲-۳ گروه­بندی و طبقه‌بندی داده

۳-۱-۲-۳ خلاصه­سازی

۴-۱-۲-۳ روابط میان مفاهیم

۵-۱-۲-۳ یافتن و تحلیل گرایشات

۶-۱-۲-۳ برچسب زدن نحوی[۶] (POS)

۷-۱-۲-۳ ایجاد Thesaurus و آنتولوژی بصورت اتوماتیک

۲-۲-۳ فرآیند متن­کاوی

۳-۳-۳ روشهای متن­کاوی

اصطلاح Data Mining همانطور که از ترجمه آن به داده­کاوی مشخص می­شود، به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از داده‌های یک یا چند بانک اطلاعاتی بزرگ است. اطلاعات استخراج شده در تعریف Data Mining بطور ضمنی به معنی اطلاعاتی است که بر اساس آن بتوان به نتایجی دست یافت که بطور معمول ملموس نیستند. در این تعریف بر بزرگ بودن بانکهای اطلاعاتی و یا حجم زیاد داده‌های مورد پردازش تاکید می‌شود. علت این است که از نظر آماری و تئوری اطلاعات، تجزیه و تحلیل داده‌ها و یا آنطور که در این اصطلاح تعبیر می‌شود، کاوش در حجم کم داده­های یک بانک به نتایج قابل قبولی منجر نمی‌شود. به کمک ابزارهای Data Mining می‌توان مقادیر متغیرهای را پیش­بینی و توصیف نمود. این ابزارها در فرایندهای تصمیم‌گیری متکی بر اطلاعات و دانش [۱] کاربر فراوان دارند و فعالیت­های تجاری نوین و مدرن امروزه به شدت بر آن متکی است. فرایند Data Mining را نباید با روش‌های متداول آنالیز داده و اطلاعات و سیستم­های تصمیم‌گیری معمولی یکی دانست. به کمک روش‌های Data Mining می‌توان به پرسش­هایی (عمدتاً تجاری) پاسخ گفت که بطور سنتی عملاً امکان وجود ندارد.

 

مطالب مرتبط
اتیسماتیسم 17 آبان 93
آزمایش SPTآزمایش SPT 30 تیر 94

دیدگاهی بنویسید.

بهتر است دیدگاه شما در ارتباط با همین مطلب باشد.