June 14, 2024Open Access

Geführte Abfragen über Videos mit Autovervollständigungsvorschlägen

Key Points

Key points are not available for this paper at this time.

Abstract

Eine zentrale Herausforderung bei der Abfrage von Videodaten besteht darin, dass der Benutzer oft den Inhalt des Videos, seine Struktur und die genaue Terminologie für die Abfrage nicht kennt. Während diese Probleme bei explorativen Abfragen über traditionelle strukturierte Daten bestehen, verschärfen sie sich bei Videodaten, bei denen die Informationen aus menschlich annotierten Metadaten oder aus Computervisionsmodellen stammen, die über das Video laufen. Ohne jegliche Orientierung ist der Mensch ratlos, wo er die Abfragesitzung beginnen oder wie er die Abfrage konstruieren soll. Hier sind Benutzeroberflächen mit Autovervollständigung zu einer beliebten und weit verbreiteten Methode der interaktiven, zeichenweisen Abfrageführung geworden. Um den Benutzer durch den Abfragekonstruktionsprozess zu leiten, entwickeln wir Methoden, die Vision-Language-Modelle und Large-Language-Modelle kombinieren, um Abfragevorschläge zu generieren, die für autovervollständigungsbasierte Benutzeroberflächen geeignet sind. Durch quantitative Bewertungen über reale Datensätze zeigen wir, dass unser Ansatz einen bedeutenden Vorteil bei der Konstruktion von Videoabfragen bietet.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Hojin Yoo

Arnab Nandi

Actions

Institutions

The Ohio State University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Geführte Abfragen über Videos mit Autovervollständigungsvorschlägen

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider