در این پروژه که
با نرم افزار داده کاوی رپید ماینر تهیه شده است، عملیات طبقه بندی را با استفاده
از درخت تصمیم یا الگوریتم decision
tree انجام داده و ضمن رسم درخت نتایج را نیز نمایش می دهد. روال کار
بدین صورت است که ابتدا با توجه به حجم داده های مربوط به پروتئینی که در اختیار
داریم، 30% از داده ها را به عنوان داده های Test یا داده های ازمایشی در نظر گرفته و 70% از داده ها را نیز به
عنوان داده های Train یا داده های
آموزشی در نظر می گیریم. سپس ابتدا داده های train را به مدل مربوطه ایمپورت کرده و مدل تولید شده با درخت تصمیم را آموزش می دهیم. پس از
اینکه مدل با توجه به داده های آموزشی، آموزش داده شده داده های test مه 30% از داده ها را تشکیل می دهد را حهت ارزیابی و جاسبه دقت به
مدل نیز ایمپورت میکنیم. مدل آموزش دیده تک به تک نمونه ها را ارزیابی نموده و ضمن
رسم درخت تصمیم تهیه شده بر اساس متد Information
Gain نتایج طبقه بندی پروتئین ها و دقت روش را محاسبه نموده ونمایش می
دهد.