Key points are not available for this paper at this time.
مع مشاهدة ما يقرب من مليار فيديو عبر الإنترنت يوميًا، يُعد التعرف والبحث في الفيديو مجالًا جديدًا ناشئًا في أبحاث الرؤية الحاسوبية. بينما تم تخصيص الكثير من الجهود لجمع وتعليم مجموعات بيانات الصور الثابتة الكبيرة والقابلة للتطوير والتي تحتوي على آلاف فئات الصور، فإن مجموعات بيانات أفعال الإنسان ما زالت متأخرة كثيرًا. تحتوي قواعد بيانات التعرف على الأفعال الحالية على حوالي عشر فئات مختلفة من الأفعال تم جمعها تحت ظروف مضبوطة إلى حد ما. الأداء المتقدم في هذه المجموعات البيانات يقترب الآن من الحد الأقصى، وبالتالي هناك حاجة لتصميم وإنشاء معايير جديدة. لمعالجة هذه القضية، جمعنا أكبر قاعدة بيانات فيديو للأفعال حتى الآن تحتوي على 51 فئة من الأفعال، والتي تحتوي إجمالاً على حوالي 7000 مقطع معلم يدويًا تم اقتباسها من مصادر متنوعة تتراوح بين الأفلام المرقمنة وYouTube. نستخدم هذه القاعدة لتقييم أداء نظامين ممثلين للرؤية الحاسوبية للتعرف على الأفعال واستكشاف متانة هذه الطرق تحت ظروف مختلفة مثل حركة الكاميرا، وجهة النظر، جودة الفيديو والاعاقة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Hilde Kuehne
Hueihan Jhuang
Estíbaliz Garrote
Massachusetts Institute of Technology
Brown University
Karlsruhe Institute of Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Kuehne وآخرون هذا السؤال.
www.synapsesocial.com/papers/69d8993605ee2ba81dbefd46 — DOI: https://doi.org/10.1109/iccv.2011.6126543
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: