تشخیص سرطان با استفاده از نمونه برداری طبقه بندی متوازن با rapidminer

درخواست انجام پروژه مشابه

- از این طریق میتواندی پروژه مشابه ای را با
زبان برنامه نویسی دلخواه سفارش دهید .

آموزش آنلاین این پروژه

- مطابق درخواست شما، بصورت آنلاین طریقه
ساخت این پروژه به شما آموزش داده خواهد شد.

- در صورت نیاز به آموزش آنلاین نحوه ساخت این پروژه توسط نرم افزارهای آموزش راه دور و یا درخواست تهیه پروژه مشابه، کافیست با شماره تماس 09179221734 یا آدرس ایمیل behnam.h1368@gmail.com هماهنگی های لازم را انجام دهید.

توضیحات تکمیلی پروژه :

این پروژه با استفاده از نرم افزار رپیدماینر یا rapidminer با توجه به یک سری داده که در قالب فایل اکسل و متنی موجود هست ، بیماری سرطان را با استفاده از نمونه برداری طبقه بندی متوازن تشخیص میدهد.

در این پروژه که مربوط به درس داده کاوی یا مباحث پیشرفته در مقطع کارشناسی ارشد میباشد از 3 نوع داده با تعداد بالای 100 هزار نمونه استفاده شده اند. این داده ها مربوط به انواع سرطانهای سینه، سرطان ریوی و ترکیبی از این دو نوع دیتا.

لذا داده های فوق با استفاده از نرم افزار داده کاوی Rapidminer مدل سازی شده است . در این پروژه از 3 نوع نمونه برداری یا sampling استفاده شده است که عبارتند از :

·         Random Sampling

·         Stratified Sampling

·         Balance Stratified Sampling

کلیه ی داده ها با استفاده از 3 نمونه برداری فوق و با بکار گیری از انواع الگوریتم های طبقه بندی، مدل سازی شده و دقت هر کدام در قالب جداولی که در داکیومنت مربوطه میباشد مورد ارزیابی قرار گرفته اند.

در این پروژه به طور کلی سه نوع کلاس بندی داریم که عبارتند از کلاسهای Survival , stage , metastasis که برای هر کدام میبایست یک دیتاست مجزا تولید نمود .

با توجه به مفروضات و بیانات مقاله، به ترتیب کلاسهای Survival , stage , metastasis دارای تعداد نوع کلاس 10 و 4 و 2 میباشد . نوع کلاس نیز از نوع عددی میباشد که هر عدد بیانگر مفهوم مربوط به خود میباشد.

در این پروژه اهداف اصلی در قالب موارد ذیل میباشد که عبارتند از :

v      جدا سازی داده ها با استفاده از توضیحات موجود در فایل راهنمای مربوطه

v      حذف خصوصیات بلا استفاده از داده های اصلی

v      تعیین عنوان برای هر فیچر

v      ترکیب داده های بیماران سرطانی و تنفسی

v      نمونه برداری بروش تصادفی

v      نمونه برداری بروش طبقه بندی شده

v      نمونه برداری بروش طبه بندی متوازن

v      مدل سازی و طبقه بندی داده های آموزشی به سه روش زیر

o        Decision Tree

o        Naïve Bayes

o        KNN

v      پیش بینی و ارزیابی داده های تست

v      مقایسه روش ها

v      نتیحه گیری

تجزیه و تحلیل داده ها و داده های بزرگ امروزه در پژوهشهای صنعتی ، تحقیقات دانشگاهی ، صنعت و غیره بسیار مورد استفاده قرار میگیرد که استفاده از تکنیک های داده کاوی ، کاوش بروی داده و شناخت داده ها را برای ما بسیار آسان کرده است.

بیماری سرطان دومین عامل مرگ و میر در دنیای امروزی میباشد. لذا در این مقاله با استفاده از تکنیک های محتلف طبقه بندی در داده کاوی سعی بر این داریم که بهترین دقت و پیش بینی را در بیماریهای سرطانی داشته باشیم.

این پروژه مناسب درس مباحث پیشرفته یا داده کاوی پیشرفته در مقطع ارشد و سایر دروس مرتبط میباشد.

امکانات پروژه :

crestor

crestor happydrink.hu

1.      تحویل کلیه دیتاهای سرطانی، تنفسی و ترکیبی

2.      تحویل یک داکیومنت در قالب فتیل word , PDF

3.      تحویل فایل های مدل سازی شده با نرم افزار داده کاوی rapidminer

4.      تحویل مقاله مربوطه

5.      تحویل فایل راهنمای اجرای پروژه

برچسپ ها :

نرم افزار داده کاوی rapidminer ,آموزش نرم افزار رپیدماینر,داده های سرطانی, دیتاست سرطان ریه, پروژه تشخیص سرطان با rapidminer , مدل سازی در rapidminer , داده کاوی در داده های سرطانی ,داده کاوی در دیتاست سرطان تنفسی, تشخیص سرطان با الگوریتم درخت تصمیم, تشخیص سرطان با الگوریتم decision tree, تشخیص سرطان با الگوریتم naïve bayes , تشخیص سرطان با الگوریتم نایوبیز , تشخیص سرطان با الگوریتم KNN , مدل سازی در rapidminer , خوشه بندی در rapidminer , پروژه با رپیدماینر, ناب پروژه,نمونه برداری Random در rapidminer ,نمونه برداری Stratified در رپیدماینر, نمونه برداری balance Stratified در رپید ماینر, آموزش نمونه برداری در رپید ماینر