فهرست مطالب
خلاصه................................................................................................................................................. 3
مراحل انجام پروژه ................................................................................................................................. 4
جداسازی دیتاها ................................................................................................................................... 4
کلاس بندی دیتاها ................................................................................................................................ 4
حذف missvalueها و اعمال فیلترهای موردنیاز............................................................................................ 4
بدست آوردن گین اتریبیوتها ................................................................................................................... 11
کلاسیفای کردن دیتاها.......................................................................................................................... 11
نتیجه گیری......................................................................................................................................... 19
توضیحات بیشتر:
دراین مقاله داده های مربوط به سرطان روده بزرگ که از SEERدر دسترس است را آنالیز میکنیم. هدف این مقاله توسعه دقت مدل های پیش بینی بقای سرطان روده بزرگ است. در مراحل preproccesingکه به دقت انجام می شود صفاتی در دو مرحله حذف می شوند ، در مرحله اول صفات به 58می رسند و در مرحله دوم به صفت13 ) رویsynthetic minority over-sampling technique( smote می رسند. و بعد از آن هم فیلتر13
اعمال می شود،این برای تعادل بین کلاسهای بقا و عدم بقا است. و در این جا سه روش پیش بینی بهتر باتوجه به دقت پیش بینی و نمودار ROCمشخص می شوند. همچنین مدل های پیش بینی برای کلاسهای یک سال بقا ، دوسال بقا و 5سال بقا روی یک مجموعه که بعد از پاکسازی داده ها 58اتریبیوت است، و بعد از انتخاب صفت های برتر به 13رسید ، ارزیابی میشوند. و در گام بعدی فیلتر smoteروس 13صفت برتر اعمال می
شود.در این پژوهش از سه نرم افزار داده کاوی Weka ،Knimeو rapidminerاستفاده شده است. مراحل preprocessingبا استفاده از Knimeو مرحله کلاسیفای کردن بااستفاده از wekaو بدست آوردن گین اتریبیوتها بااستفاده از نرم افزار rapidminerاست.
امکانات اضافه:
- داکیومنت
- سورس کارهای انجام شده با نایم
- نتایج تجربی
این پروژه نیز با وکا، رپیدماینر و SPSS Modeller نیز انجام شده است که در صورت نیاز می توانید به صورت جداگانه سفارش دهید.