طراحی ربات با استفاده از یادگیری ماشین با matlab

درخواست انجام پروژه مشابه

- از این طریق میتواندی پروژه مشابه ای را با
زبان برنامه نویسی دلخواه سفارش دهید .

آموزش آنلاین این پروژه

- مطابق درخواست شما، بصورت آنلاین طریقه
ساخت این پروژه به شما آموزش داده خواهد شد.

- در صورت نیاز به آموزش آنلاین نحوه ساخت این پروژه توسط نرم افزارهای آموزش راه دور و یا درخواست تهیه پروژه مشابه، کافیست با شماره تماس 09179221734 یا آدرس ایمیل behnam.h1368@gmail.com هماهنگی های لازم را انجام دهید.

توضیحات تکمیلی پروژه :

در این قسمت توضیحاتی در مورد نحوه ی اجرای برنامه ارائه خواهیم داد:
برای اجرای برنامه از میان فایل های موجود، روی فایل robo_ctrl_panel.m دابل کلیک کنید. پس از اجرای برنامه، پنجره اصلی آن همانند شکل بالا نمایش داده میشود. این پنجره، پنجره اصلی برنامه بوده که کنترل رباط مورد بررسی با استفاده از آن صورت میگیرد. برای اجرای برنامه نیاز است که یک رباط از طریق پورت سریال COM3 به دستگاه رایانه متصل شود. پس از اتصال، میتوان از منوی اصلی، رباط را با استفاده از دکمه¬های پیش بینی شده کنترل کرد.

از میان توابع موجود، مهمترین تابع، REINFORCEMENT_LEARNING است که عمل یادگیری تقویتی رباط با استفاده از آن صورت می-گیرد. یادگیری تقویتی (Reinforcement Learning) یکی از روش های یادگیری در سیستم های هوشمند است که براساس رابطه ی علت و معلولی عمل می کند. در این روش یادگیری عامل هوشمند (Agent) با توجه به وضعیتی که در محیط دارد، عملی را بر روی محیط انجام می دهد و منتظر نتیجه ی عملش می ماند. این نتیجه می تواند در قالب یک پاداش یا تنبیه باشد. اگر نتیجه در قالب پاداش باشد، عمل انجام شده مطلوب بوده و عامل به هدفی که در آن محیط دارد نزدیک شده است. ولی اگر نتیجه در قالب تنبیه باشد، عمل انجام شده نامطلوب بوده و عامل از هدفش دور شده است. عامل باید یاد بگیرید که چه اعمالی را انجام دهد تا پاداش بیش تری را کسب کند و در نهایت به هدفش برسد.

همه ی ما در کودکی با الگویی مشابه یادگیری تقویتی راه رفتن را آموختیم. زمانی که پس از چندین گام برداشتن به زمین می خوردیم (تنبیه)، سعی می کردیم اعمال حرکتی خود را به گونه ای اصلاح کنیم تا تعادل خود را به هنگام راه رفتن حفظ کنیم (پاداش). در نهایت هم به هدف خود که راه رفتن بود رسیدیم. در واقع در یادگیری تقویتی بازخوردی  به صورت عبارات کمکی مثبت (پاداش) یا منفی (جریمه) به عامل یادگیرنده داده می شود. غالبا پاداش ها مقادیر اسکالری همچون 1- برای یک کار بد و +1 برای یک کار خوب هستنند.

امکانات پروژه :

diprolene

diprolene power-hosting.nl
  1.       پیاده سازی گرافیکی مسئله ربات

  2.       داکیومنت مختصری از نحوه ی پیاده سازی

  3.       کدها در حد امکان کامنت گذاری شده  اند

  4.       مقاله مورد نظر که پیاده سازی شده است موجود میباشد

برچسپ ها :

پیاده سازی ربات با متلب , پروژه ربات با روش یادگیری ماشین , ربات هوشمند با matlab , پیاده سازی مقاله ربات بروش یادگیری ماشین, شبیه سازی ربات با متلب , دانلود پروژه ربات هوشمند, یادگیری ماشین با ربات هوشمند در متلب , پیاده سازی ربات بروش یادگیری تقویتی در matlab , ناب پروژه