Key points are not available for this paper at this time.
Es gibt in verschiedenen Teilbereichen der KI die Tendenz, eine kleine Auswahl einflussreicher Benchmarks aufzuwerten. Diese Benchmarks fungieren als Stellvertreter für eine Reihe von anerkannten gemeinsamen Problemen, die häufig als grundlegende Meilensteine auf dem Weg zu flexiblen und generalisierbaren KI-Systemen dargestellt werden. Der Stand-der-Technik-Stand bei diesen Benchmarks wird allgemein als Indikator für Fortschritte hin zu diesen langfristigen Zielen verstanden. In diesem Positionspapier untersuchen wir die Grenzen solcher Benchmarks, um die Validitätsprobleme in ihrer Darstellung als funktional „allgemeine“ breite Fortschrittsmaße, zu enthüllen, für die sie konzipiert sind.
Building similarity graph...
Analyzing shared references across papers
Loading...
Inioluwa Deborah Raji
Emily M. Bender
Amandalynne Paullada
University of Washington
Google (United States)
Seattle University
Building similarity graph...
Analyzing shared references across papers
Loading...
Raji et al. (Fri,) haben diese Frage untersucht.
www.synapsesocial.com/papers/6a07fa897ad161a3abfe0eee — DOI: https://doi.org/10.48550/arxiv.2111.15366