الملخص لقد تم دراسة التعلم المعزز (RL) على نطاق واسع كفئة فعالة من طرق تعلم الآلة للتحكم الأمثل التكيفي في ظل حالات عدم اليقين. في السنوات الأخيرة، حظيت تطبيقات التعلم المعزز في اتخاذ القرارات المحسنة والتحكم في حركة المركبات الذكية باهتمام متزايد. نظرًا لبيئات التشغيل المعقدة والديناميكية للمركبات الذكية، من الضروري تحسين كفاءة التعلم وقدرة التعميم لخوارزميات اتخاذ القرار والتحكم المعتمدة على التعلم المعزز تحت ظروف مختلفة. يستعرض هذا المسح بشكل منهجي الأسس النظرية والتقدمات الخوارزمية والتحديات العملية لتطبيق التعلم المعزز على أنظمة المركبات الذكية العاملة في بيئات معقدة وديناميكية. يتم أولاً تقديم الأطر الخوارزمية الرئيسية للتعلم المعزز، ومراجعة التقدمات الحديثة في اتخاذ القرار والتحكم المعتمدة على التعلم المعزز للمركبات الذكية. بالإضافة إلى مناهج اتخاذ القرار والتحكم ذات التعلم الذاتي باستخدام قياسات الحالة، يتم تلخيص تطورات طرق التعلم المعزز العميق للتحكم بالقيادة من البداية إلى النهاية في المركبات الذكية. كما تُناقش المشكلات المفتوحة والاتجاهات لأعمال البحث المستقبلية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yixing Lan
Xin Xu
Jiahang Liu
CAAI Transactions on Intelligence Technology
National University of Defense Technology
Academy of Military Medical Sciences
Building similarity graph...
Analyzing shared references across papers
Loading...
درس لان وآخرون (الخميس) هذا السؤال.
www.synapsesocial.com/papers/690e8b75a5b062d7a4e73767 — DOI: https://doi.org/10.1049/cit2.70073
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: