What question did this study set out to answer?

يهدف هذا المسح إلى تصنيف ومقارنة طرق تحسين الوكلاء القائمين على نماذج اللغة الكبيرة في بيئات معقدة.

January 26, 2026

مسح حول تحسين الوكلاء القائمين على نماذج اللغة الكبيرة

Key Points

يهدف هذا المسح إلى تصنيف ومقارنة طرق تحسين الوكلاء القائمين على نماذج اللغة الكبيرة في بيئات معقدة.
أُجريت مراجعة منهجية لنهج تحسين الوكلاء القائمين على LLM.
صنفت الطرق إلى استراتيجيات تعتمد على المعاملات واستراتيجيات بدون معاملات.
حللت جوانب مثل تصميم دالة المكافأة وخوارزميات التحسين.
نوقشت هندسة التنبيه واسترجاع المعرفة الخارجية للاستراتيجيات بدون معاملات.
تم تحديد تقنيات التحسين الرئيسية بما في ذلك الضبط الدقيق والتعلم التعزيزي.
قدمت لمحة شاملة عن الاستراتيجيات والتطبيقات القائمة للوكلاء القائمين على LLM.
سلطت الضوء على التحديات والاتجاهات المستقبلية لتحسين فعالية الوكلاء القائمين على LLM.

Abstract

مع التطور السريع لنماذج اللغة الكبيرة (LLMs)، تم اعتماد الوكلاء القائمين على LLMs على نطاق واسع في مختلف المجالات، ليصبحوا ضروريين لاتخاذ القرار الذاتي والمهام التفاعلية. ومع ذلك، يعتمد العمل الحالي عادةً على تصميم التنبيهات أو استراتيجيات الضبط الدقيق المطبقة على نماذج LLMs التقليدية، والتي غالبًا ما تؤدي إلى فعالية محدودة في بيئات الوكلاء المعقدة. بالرغم من أن العديد من الدراسات الحديثة استكشفت استراتيجيات متنوعة لتحسين الوكلاء القائمين على LLMs لمهام الوكلاء المعقدة، إلا أن مراجعة منهجية تلخص وتقارن هذه الأساليب من منظور شامل لا تزال مفقودة. في هذا المسح، نقدم مراجعة شاملة لنهج تحسين الوكلاء القائمين على LLM، مصنفين إياها إلى طرق تعتمد على المعاملات وبدون معاملات. نركز أولاً على تحسين يعتمد على المعاملات، متضمنًا تحسينات قائمة على الضبط الدقيق، وتحسينات قائمة على التعلم التعزيزي، واستراتيجيات هجينة، مع تحليل الجوانب الرئيسية مثل بناء بيانات المسار، وتصميم دالة المكافأة، وخوارزميات التحسين. بالإضافة إلى ذلك، نناقش بإيجاز استراتيجيات بدون معاملات تحسن سلوك الوكيل من خلال هندسة التنبيهات واسترجاع المعرفة الخارجية. أخيرًا، نلخص تقييم الوكلاء، ونراجع التطبيقات الرئيسية للوكلاء القائمين على LLM، ونتناول التحديات الكبرى والاتجاهات المستقبلية الواعدة. تم توفير مجموعة مختارة من الأعمال المراجعة على https://github.com/YoungDubbyDu/LLM-Agent-Optimization.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

درس دو وآخرون (Sat,) هذا السؤال.

www.synapsesocial.com/papers/697703d3722626c4468e8cc6 — DOI: https://doi.org/10.1145/3789261

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Multi-Agent Reinforcement Learning: A Review of Challenges and Applications· 2021 · 354 citations
ATLAS: Agent Tuning via Learning Critical Steps· 2025 · 1 citations
Self-Reflection in Large Language Model Agents: Effects on Problem-Solving Performance· 2024 · 43 citations
A survey on LoRA of large language models· 2024 · 77 citations
Sage: Self-Evolving Agents with Reflective and Memory-Augmented Abilities· 2025 · 5 citations

Authors

Shangheng Du

Dan Wang

Jinxin Shi

Journals

ACM Computing Surveys

Actions

Institutions

East China Normal University

Donghua University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

مسح حول تحسين الوكلاء القائمين على نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion