Key points are not available for this paper at this time.
نماذج اللغة الكبيرة المدربة مسبقًا مثل بيرت قد أدت إلى تحسينات كبيرة في تطبيقات معالجة اللغة الطبيعية. ومع ذلك، فهي معروفة أيضًا بأنها بطيئة في الاستدلال، مما يجعل من الصعب نشرها في التطبيقات اللحظية. نقترح طريقة بسيطة لكنها فعالة، دي بيرت، لتسريع استدلال بيرت. تتيح طريقتنا للعينات الخروج مبكرًا دون المرور عبر النموذج بأكمله. تظهر التجارب أن دي بيرت قادر على توفير ما يصل إلى 40% من وقت الاستدلال مع تدهور طفيف جدًا في جودة النموذج. تظهر تحليلات أخرى سلوكيات مختلفة في طبقات المحول في بيرت وتكشف أيضًا عن تكرارها. يوفر عملنا أفكارًا جديدة لتطبيق النماذج العميقة المبنية على المحولات بكفاءة على المهام الثانوية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ji Xin
Raphael Tang
Jaejun Lee
University of Waterloo
Vector Institute
Building similarity graph...
Analyzing shared references across papers
Loading...
درس شين وآخرون هذا السؤال.
www.synapsesocial.com/papers/69dd605d80eea7d3f699c3eb — DOI: https://doi.org/10.18653/v1/2020.acl-main.204
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: