پیاده سازی الگوریتم FP Growth و روش Apriori در قواعد انجمنی
پیاده سازی الگوریتم FP Growth و روش Apriori در قواعد انجمنی ، هدف از انجام این پروژه پیاده سازی بخشی از مفهوم FP Growth و روش Apriori بر روی یک مجموعه داده می باشد.
پیاده سازی الگوریتم FP Growth و روش Apriori :
این پروژه مربوط به رسم درخت آیتم های پرتکرار FP-Tree و روش Apriori برای کشف الگوهای پرتکرار در مجموعه داده مورد بررسی می باشد.مجموعه داده مذکور تعداد ۱۰٫۰۰۰ رکورد دارد که به صورت کلی شامل ۲۰ نوع آیتم است و هر کدام از این رکورد ها شامل تعدادی آیتم بودند.حجم مجموعه داده مورد بررسی بسیار زیاد بوده به همین دلیل بخشی از آیتم ها را حذف کرده ایم.
در این پیاده سازی هر کدام از رکورد ها به منزله ی یک تراکنش هستند و قصد ما این بوده است که درخت مربوطه یا FP-Tree را برای تمامی این تراکنش ها تشکیل دهیم.توجه داریم که به صورت کلی الگوریتم FP Growth شامل ساخت FP-Tree ، ساخت Conditional Pattern و همچنین پیدا کردن Frequent Patterns می باشد اما در این پروژه برای ساده کردن پیاده سازی تنها به ساخت FP-Tree برای مجموعه داده بسنده کرده ایم.در گزارش این پروژژه ما نتایجی همچون درخت پرتکرار، زمان اجرا ، قوانین بدست آمده و مینیمم ساپورت و مینیمم کانفیدنس را مورد نظر قرار داده ایم.
رسم درخت fp-tree :
اگر به صورت کلی با روال FP Growth آشنا باشید با مثال ساده ای که در ادامه آورده ایم بهتر پیاده سازی انجام شده را درک خواهید کرد.
دو رکورد یا تراکنش زیر که از مجموعه داده انتخاب شده اند را در نظر بگیرید:
۱۶ ۱۳ ۱۳ ۶ ۲ ۲
۱۷ ۱۶ ۱۱ ۹ ۷
فرض نمایید که Min_Sup را در این مثال برابر با ۲ درنظر بگیریم ، در این صورت اگر بر روی این دو رکورد به تنهایی عملیات مربوطه را اجرا نماییم و FP-Tree آن را رسم نماییم ، شکل نهایی به این صورت خواهد شد:
همانگونه که بیان شد ، رسم درخت fp-tree بخشی از الگوریتم FP Growth است. همانگونه که ذکر شد حجم مجموعه داده مورد بررسی بسیار زیاد بوده و ما آیتم های ۱۰ الی ۱۹ را جهت ساده شدن کار حذف کردیم. لذا درخت حاصله از مجموعه داده اصلاح شده به صورت زیر شده است:
همانگونه که پیداست، این درخت بسیار حجیم بوده و همه ی موارد آن واضح نمی باشد.در گزارش پروژه رسم درخت ها را با تعداد آیتم های ۲۰ و ۱۰۰ و ۱۰۰۰ قرار داده ایم تا شکل واضح تری از درخت معین گردد.
پیاده سازی روش Apriori :
ما از بین روش های Eclat و Apriori روش Apriori را برای پیاده سازی انتخاب کردیم. و سعی کرده ایم با تغییر MST و MCT نتایج بدست آمده همانند مدت زمان اجرای الگوریتم و تعداد قوانین به دست آمده را مورد بررسی قرار دادیم که نتایج این بررسی در گزارش پروژه آورده شده است.
نکات مربوط به پیاده سازی :
این پروژه مربوط به مبحث داده کاوی می باشد و در نرم افزار متلب پیاده سازی شده است.
ساختار FP-Tree به صورت کامل پیاده سازی شده است و در خروجی پیاده سازی به قابل مشاهده می باشد.
روش Apriori پیاده سازی شده است و خروجی قابل مشاهده می باشد.
کارشناسان وب سایت MATLABDL قادر به انجام پروژه در زمینه های مشابه (پروژه های داده کاوی و…) نیز می باشند.
قیمت پروژه : ۱۴۰۰۰۰تومان
حجم : ۴٫۳۶ مگابایت
توضیحات : پیاده سازی در نرم افزار متلب انجام شده است.
منبع : مطلب دی ال
رمز فایل : www.matlabdl.com
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.