ZUSAMMENFASSUNG Große Sprachmodelle haben bemerkenswerte Fähigkeiten im Algorithmendesign gezeigt, doch ihre Effektivität bei der Lösung von Data-Science-Herausforderungen ist bislang wenig verstanden. Wir führten ein Klassenzimmer-Experiment durch, bei dem Graduiertenstudenten große Sprachmodelle (LLMs) nutzten, um biomedizinische Data-Science-Herausforderungen auf Kaggle zu lösen. Obwohl ihre Einreichungen nicht die Bestenlisten anführten, lagen ihre Vorhersagewerte häufig nahe an denen führender menschlicher Teilnehmer. LLMs empfahlen häufig Gradient-Boosting-Methoden, die mit einer besseren Leistung verbunden waren. Unter den Prompting-Strategien war die Selbstverfeinerung, bei der das LLM seine eigene Anfangslösung verbessert, die effektivste, ein Ergebnis, das mit zusätzlichen LLMs validiert wurde. Diese Ergebnisse zeigen, dass LLMs wettbewerbsfähige maschinelle Lernlösungen entwerfen können, auch wenn sie von Nicht-Experten verwendet werden.
Building similarity graph...
Analyzing shared references across papers
Loading...
Cairui Yan
Zhicheng Ji
Building similarity graph...
Analyzing shared references across papers
Loading...
Yan et al. (Thu,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/689a0f93e6551bb0af8d130b — DOI: https://doi.org/10.1101/2025.07.12.664517