این پروژه بروی
دیتاست مربوط به کاربران که شامل 6040 رکورد کاربر است. عملیات خوشه بندی با
استفاده از الگوریتم k-means
انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به کاربران را به
نرم افزار داده کاوی رپید ماینر وارد نموده، سپس داده ها را جهت افزایش دقت خوشه
بندی نرمال سازی می کنیم. پس از نرمال سازی داده ها الگوریتم k-means بروی داده های نرمال شده اعمال می گردد و خروجی را در قالب یک
فایل اکسل با اضافه نمودن برچسپ خوشه(Cluster)
تولید می کند. ویژگی های مربوط به کاربران عبارتند از :
- کد کاربر
- جنسیت
- شغل
- کد پستی
الگوریتم استفاده شده جهت خوشه بندی کاربران k-means است. معیار خوشه بندی بر اساس
اطلاعات دموگرافیک کاربران بوده و از فاسله اقلیدوسی جهت خوشه بندی کاربران
استفاده می شود. در این پروژه تعداد خوشه ها را می توان به صورت پویا تعیین نموده
و نتایج را مورد بررسی قرار داد.