July 10, 2024Open Access

ما وراء المقارنة المرجعية: نموذج جديد لتقييم وتقويم نماذج اللغة الكبيرة

Key Points

Key points are not available for this paper at this time.

Abstract

في مقاييس التقييم الحالية لنماذج اللغة الكبيرة (LLMs)، توجد مشاكل مثل تقييد محتوى التقييم، والتحديثات غير الملائمة في الوقت المناسب، ونقص التوجيه الأمثل. في هذا الورق، نقترح نموذجًا جديدًا لقياس نماذج اللغة الكبيرة: المقارنة المرجعية - التقييم - التقويم. يُحوّل نموذجنا "مكان" تقييم نماذج اللغة الكبيرة من "غرفة الامتحان" إلى "المستشفى". من خلال إجراء "الفحص الطبي" على نماذج اللغة الكبيرة، يستخدم حل المهام المحددة كمحتوى للتقييم، ويُجري تحليلًا عميقًا للمشكلات القائمة داخل نماذج اللغة الكبيرة، ويقدم توصيات للتحسين.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jin Liu

Qingquan Li

Wenlong Du

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

ما وراء المقارنة المرجعية: نموذج جديد لتقييم وتقويم نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider