요약 비디오 분석(VA) 시스템은 점점 더 딥뉴럴네트워크 기반 객체 감지에 의존하고 있으며, 이때 해상도, 비트레이트, 양자화와 같은 비디오 압축 매개변수가 추론 정확도에 크게 영향을 미칩니다. 본 논문은 Fast R-CNN, EfficientDet, YOLOv5, YOLOv8, DETR 등 다섯 가지 객체 감지 모델에 대해 세 가지 인코더 정의 비디오 품질 수준(고, 중, 저)을 이용한 벤치마킹 연구를 제시합니다. 성능 평가는 비트레이트(Mbps), 최고신호대잡음비(PSNR, dB), 감지 정확도를 기준으로 하여 압축으로 인한 성능 변화를 분석하는 재현 가능한 프레임워크를 제공합니다. 실험 결과 PSNR은 비트레이트에 따라 거의 선형적으로 증가하며, 감지 정확도는 고비트레이트 구간에서 포화되어 수익 감소 현상을 보였습니다. YOLOv5가 압축에 가장 강인성을 보였고, 다음으로 Fast R-CNN과 DETR이 뒤를 이었으며, EfficientDet과 YOLOv8은 품질 저하에 다소 민감한 것으로 나타났습니다. 본 연구는 정확도와 대역폭 효율성의 균형을 맞출 수 있는 실용적인 운영 지점을 제시하여 감시 및 스마트시티 VA 응용에서 모델-코덱 공동 설계를 위한 실질적 지침을 제공합니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Kholidiyah Masykuroh
Hendrawan
Eueung Mulyana
ETRI Journal
Bandung Institute of Technology
Telkom University
Building similarity graph...
Analyzing shared references across papers
Loading...
Masykuroh 등(화,)이 이 질문을 연구했습니다.
www.synapsesocial.com/papers/69b3abc502a1e69014cccdcc — DOI: https://doi.org/10.4218/etrij.2025-0363
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: