モバイル拡張現実(AR)アプリケーションは、没入型でコンテキスト認識可能なユーザー体験を可能にするために、ピクセルレベルの深度やセマンティクスを含む高品質でリアルタイムの視覚予測を必要とします。近年、Vision Foundation Models(VFM)は多様で未見のデータに対する高い汎化能力を示し、スケーラブルなモバイルAR体験をサポートしています。しかし、モバイルデバイス上でのVFMの展開は計算資源の制約により困難であり、特に予測精度とリアルタイム性能の両立が課題です。本記事では、VFMのデバイス内推論加速を可能にする初のシステムであるARIA 3を紹介します。ARIAはモバイルプロセッサの異種性を活かした並列かつ選択的な推論スキームを採用しており、高並列性のあるGPUのようなプロセッサに対して全フレーム予測を周期的にオフロードし、動的領域に対してはNPUのような専門アクセラレータで低レイテンシの更新を実施します。モバイルデバイスで実装・評価した結果、ARIAは実際のモバイルARシナリオにおいて精度と期限成功率で大幅な改善を達成しました。
Building similarity graph...
Analyzing shared references across papers
Jeho Lee
C.R. Jung
Gunjoong Kim
GetMobile Mobile Computing and Communications
Uppsala University
Yonsei University
Building similarity graph...
Analyzing shared references across papers
Leeら(Mon,)はこの問題を研究しました。
www.synapsesocial.com/papers/697460acbb9d90c67120a8d2 — DOI: https://doi.org/10.1145/3793236.3793246
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: