Key points are not available for this paper at this time.
Há uma tendência em diferentes subcampos da IA de valorizar uma pequena coleção de benchmarks influentes. Esses benchmarks funcionam como representantes de uma variedade de problemas consagrados que frequentemente são apresentados como marcos fundamentais no caminho para sistemas de IA flexíveis e generalizáveis. O desempenho de vanguarda nesses benchmarks é amplamente entendido como indicativo de progresso em direção a esses objetivos de longo prazo. Neste artigo de posicionamento, exploramos os limites desses benchmarks para revelar problemas de validade de construto na forma como são enquadrados como medidas amplas e funcionalmente "gerais" de progresso que se propõem a ser.
Building similarity graph...
Analyzing shared references across papers
Loading...
Inioluwa Deborah Raji
Emily M. Bender
Amandalynne Paullada
University of Washington
Google (United States)
Seattle University
Building similarity graph...
Analyzing shared references across papers
Loading...
Raji et al. (Sex,) estudaram essa questão.
www.synapsesocial.com/papers/6a07fa897ad161a3abfe0eee — DOI: https://doi.org/10.48550/arxiv.2111.15366