دانلود رایگان مقالات انگلیسی در مورد یادگیری تقویتی (Reinforcement Learning) با فرمت pdf به همراه ترجمه تخصصی به زبان فارسی با فرمت پی دی اف و ورد با قابلیت ویرایش متن
کیو-یادگیری: تکنیک یادگیری تقویتی است که با یادگیری یک تابع اقدام/مقدار، سیاست مشخصی را برای انجام حرکات مختلف در وضعیت های مختلف دنبال می کند. یکی ازنقاط قوت این روش، توانایی یادگیری تابع مذکور بدون داشتن مدل معینی ازمحیط می باشد. اخیراً در این روش اصلاحی با نام کیو-یادگیری تاخیری انجام شده که بهبود قابل توجهی ایجاد نموده است. در روش اخیر یادگیری PAC با فراینده های تصمیم مارکوف ترکیب شده اند.
رشته های مرتبط: مهندسی کامپیوتر