Dieses Papier präsentiert einen umfassenden Überblick über die Entwicklung der Data Science von einer statistikzentrierten Disziplin zu einem durch maschinelles Lernen geprägten Fachgebiet, das in der aktuellen Integration großer Sprachmodelle (LLMs) gipfelt. Es identifiziert wesentliche Einschränkungen traditioneller LLM-Anwendungen – wie begrenzte domänenübergreifende Anpassungsfähigkeit, fehlende Interpretierbarkeit und Workflow-Rigidität – und untersucht jüngste Innovationen, die diese Herausforderungen adressieren. Drei repräsentative Frameworks – R&D-Agent, SPIO und Agent Laboratory – veranschaulichen den Übergang von LLMs von assistiven Werkzeugen zu autonomen Agenten, die in der Lage sind, komplette Data-Science-Workflows zu planen, auszuführen und zu optimieren. Diese Systeme nutzen die Zusammenarbeit von Doppelagenten, modulare Architekturen und selbstkorrigierende Fähigkeiten, um die Leistung in End-to-End-Datenanalysen und wissenschaftlicher Forschung zu verbessern. Das Papier schließt mit der Darstellung zukünftiger Prioritäten, darunter domänenspezifische Anpassungen, standardisierte Agentenbewertung und verbesserte Interpretierbarkeit, die alle für die nächste Generation intelligenter, autonomer Data-Science-Systeme unerlässlich sind.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xinyou Yin
Advances in Engineering Technology Research
Building similarity graph...
Analyzing shared references across papers
Loading...
Xinyou Yin (Sat,) untersuchte diese Fragestellung.
www.synapsesocial.com/papers/68c1a76954b1d3bfb60e03b7 — DOI: https://doi.org/10.56028/aetr.14.1.1582.2025