August 5, 2025Open Access

Bewertung großer Sprachmodelle bei biomedizinischen Data-Science-Herausforderungen durch ein Klassenzimmer-Experiment

Key Points

LLMs zeigten Potenzial bei der Lösung biomedizinischer Data-Science-Herausforderungen, erreichten jedoch nicht die Spitzenplätze auf den Kaggle-Bestenlisten.
Die von den Teilnehmern generierten LLM-Einreichungen kamen den führenden menschlichen Ergebnissen nahe, was auf eine starke Leistung hinweist.
Die Selbstverfeinerung war die effektivste Prompting-Strategie und verbesserte die anfänglichen Lösungen der LLMs.
Diese Ergebnisse legen nahe, dass LLMs wettbewerbsfähige maschinelle Lernlösungen für Nicht-Experten bereitstellen können.

Abstract

ZUSAMMENFASSUNG Große Sprachmodelle haben bemerkenswerte Fähigkeiten im Algorithmendesign gezeigt, doch ihre Effektivität bei der Lösung von Data-Science-Herausforderungen ist bislang wenig verstanden. Wir führten ein Klassenzimmer-Experiment durch, bei dem Graduiertenstudenten große Sprachmodelle (LLMs) nutzten, um biomedizinische Data-Science-Herausforderungen auf Kaggle zu lösen. Obwohl ihre Einreichungen nicht die Bestenlisten anführten, lagen ihre Vorhersagewerte häufig nahe an denen führender menschlicher Teilnehmer. LLMs empfahlen häufig Gradient-Boosting-Methoden, die mit einer besseren Leistung verbunden waren. Unter den Prompting-Strategien war die Selbstverfeinerung, bei der das LLM seine eigene Anfangslösung verbessert, die effektivste, ein Ergebnis, das mit zusätzlichen LLMs validiert wurde. Diese Ergebnisse zeigen, dass LLMs wettbewerbsfähige maschinelle Lernlösungen entwerfen können, auch wenn sie von Nicht-Experten verwendet werden.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Cairui Yan

Zhicheng Ji

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Bewertung großer Sprachmodelle bei biomedizinischen Data-Science-Herausforderungen durch ein Klassenzimmer-Experiment

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study