January 1, 2018Open Access

Savoir ce que vous ne savez pas : questions sans réponse pour SQuAD

Key Points

Key points are not available for this paper at this time.

Abstract

Les systèmes de compréhension de lecture extractive peuvent souvent localiser la bonne réponse à une question dans un document contextuel, mais ils ont aussi tendance à faire des suppositions peu fiables sur des questions dont la réponse correcte n'est pas mentionnée dans le contexte. Les jeux de données existants se concentrent soit exclusivement sur des questions répondables, soit utilisent des questions non répondables générées automatiquement et faciles à identifier. Pour pallier ces faiblesses, nous présentons SQUADRUN, un nouveau jeu de données qui combine le Stanford Question Answering Dataset (SQuAD) existant avec plus de 50 000 questions non répondables rédigées de manière adversariale par des travailleurs de foule pour ressembler à des questions répondables. Pour bien réussir sur SQUADRUN, les systèmes doivent non seulement répondre aux questions quand c'est possible, mais aussi déterminer quand aucune réponse n’est soutenue par le paragraphe et s’abstenir de répondre. SQUADRUN est une tâche difficile de compréhension du langage naturel pour les modèles existants : un système neuronal performant obtenant 86 % de F1 sur SQuAD n'atteint que 66 % de F1 sur SQUADRUN. Nous publions SQUADRUN à la communauté comme successeur de SQuAD.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Pranav Rajpurkar

Robin Jia

Percy Liang

Actions

Institutions

Stanford University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Savoir ce que vous ne savez pas : questions sans réponse pour SQuAD

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider