مع التطور السريع لنماذج اللغة الكبيرة (LLMs)، تم اعتماد الوكلاء القائمين على LLMs على نطاق واسع في مختلف المجالات، ليصبحوا ضروريين لاتخاذ القرار الذاتي والمهام التفاعلية. ومع ذلك، يعتمد العمل الحالي عادةً على تصميم التنبيهات أو استراتيجيات الضبط الدقيق المطبقة على نماذج LLMs التقليدية، والتي غالبًا ما تؤدي إلى فعالية محدودة في بيئات الوكلاء المعقدة. بالرغم من أن العديد من الدراسات الحديثة استكشفت استراتيجيات متنوعة لتحسين الوكلاء القائمين على LLMs لمهام الوكلاء المعقدة، إلا أن مراجعة منهجية تلخص وتقارن هذه الأساليب من منظور شامل لا تزال مفقودة. في هذا المسح، نقدم مراجعة شاملة لنهج تحسين الوكلاء القائمين على LLM، مصنفين إياها إلى طرق تعتمد على المعاملات وبدون معاملات. نركز أولاً على تحسين يعتمد على المعاملات، متضمنًا تحسينات قائمة على الضبط الدقيق، وتحسينات قائمة على التعلم التعزيزي، واستراتيجيات هجينة، مع تحليل الجوانب الرئيسية مثل بناء بيانات المسار، وتصميم دالة المكافأة، وخوارزميات التحسين. بالإضافة إلى ذلك، نناقش بإيجاز استراتيجيات بدون معاملات تحسن سلوك الوكيل من خلال هندسة التنبيهات واسترجاع المعرفة الخارجية. أخيرًا، نلخص تقييم الوكلاء، ونراجع التطبيقات الرئيسية للوكلاء القائمين على LLM، ونتناول التحديات الكبرى والاتجاهات المستقبلية الواعدة. تم توفير مجموعة مختارة من الأعمال المراجعة على https://github.com/YoungDubbyDu/LLM-Agent-Optimization.
Building similarity graph...
Analyzing shared references across papers
Loading...
درس دو وآخرون (Sat,) هذا السؤال.
www.synapsesocial.com/papers/697703d3722626c4468e8cc6 — DOI: https://doi.org/10.1145/3789261
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:
Shangheng Du
Dan Wang
Jinxin Shi
ACM Computing Surveys
East China Normal University
Donghua University
Building similarity graph...
Analyzing shared references across papers
Loading...