Key points are not available for this paper at this time.
لقد أصبحت المحولات النموذج المعياري في الذكاء الاصطناعي منذ عام 2017 على الرغم من العديد من العيوب التي تتراوح من عدم كفاءة الطاقة إلى الهلوسات. لقد أحرز البحث تقدمًا كبيرًا في تحسين عناصر المحولات، وبشكل أعم في التعلم العميق، مما تجلى في العديد من الاقتراحات للمعماريات والطبقات وأهداف التحسين وتقنيات التحسين. من الصعب على الباحثين متابعة هذه التطورات على مستوى أوسع. نوفر نظرة شاملة على العديد من الأعمال الحديثة المهمة في هذه المجالات لأولئك الذين لديهم فهم أساسي للتعلم العميق. يختلف تركيزنا عن الأعمال الأخرى، حيث نستهدف بشكل خاص النهج الجديدة والبديلة التي قد تحدث تحولاً في المحولات، فضلاً عن الأفكار الناجحة في التعلم العميق الحديث. نأمل أن يساعد هذا المعالج الشامل والموحد للأعمال المؤثرة والأفكار الحديثة الباحثين في تكوين روابط جديدة بين مجالات التعلم العميق المتنوعة. نحدد ونناقش عدة أنماط تلخص الاستراتيجيات الرئيسية للابتكارات الناجحة خلال العقد الماضي وكذلك الأعمال التي يمكن اعتبارها نجوماً صاعدة. خاصة، نناقش المحاولات لتحسين المحولات، متضمنة طرقًا مثبتة جزئيًا مثل نماذج الفضاء الحالة، وأفكارًا بعيدة المدى في التعلم العميق تبدو واعدة رغم عدم تحقيقها لنتائج متقدمة. نغطي أيضًا نقاشًا حول النماذج الحديثة المتقدمة مثل سلسلة GPT من OpenAI ونماذج LLama من Meta، وعائلة نموذج Gemini من Google.
Building similarity graph...
Analyzing shared references across papers
Loading...
Johannes Schneider
Building similarity graph...
Analyzing shared references across papers
Loading...
درس يوهانس شنايدر (الخميس) هذا السؤال.
www.synapsesocial.com/papers/68e5dc5db6db64358757226f — DOI: https://doi.org/10.48550/arxiv.2408.00386