深層学習の進歩により、近年、深度に基づく三次元(3D)手のポーズ推定手法は大きな進展を遂げていますが、高精度を達成するためには依然として大量のラベル付き訓練データが必要です。しかし、このようなデータの収集はコストと時間がかかります。この課題に対処するために、ラベル付き訓練データへの依存を大幅に減らす半教師あり深層学習手法を提案します。本提案手法は、教員ネットワークと生徒ネットワークの2つの同一のネットワークを共同で訓練します。教員ネットワークは利用可能なラベル付きおよび未ラベルサンプルの両方を使用して訓練されます。未ラベルサンプルは、一連のアフィン変換下で推定の等変性を促進する損失関数を用いて活用されます。生徒ネットワークは、教員ネットワークが提供する擬似ラベル付き未ラベルサンプルを用いて訓練されます。推論時には生徒ネットワークのみを使用します。ICVL、NYU、MSRAという厳しいベンチマークでの広範な実験により、提案手法の有効性が示されました。特に、本アプローチはすべてのデータセットで最先端の半教師あり手法を大幅に上回ります。重要なのは、利用可能なラベル付きデータの25%のみを使用しても、100%ラベル付きデータで訓練された完全教師ありの最先端手法と同等以上の精度を達成したことです。さらに1%のラベルでも、本手法は従来の半教師あり技術を上回り、ICVLおよびNYUでそれぞれ平均距離誤差6.94mmおよび8.71mmを達成しました。これらの結果は注釈付けの必要性を大幅に削減し、高精度な3D手のポーズ推定の実用性とアクセス性を高めることを示しています。
Building similarity graph...
Analyzing shared references across papers
Loading...
Rezaeiらが本課題を研究しました。
www.synapsesocial.com/papers/6987eb5df6bacdd2fe8fca6c — DOI: https://doi.org/10.1007/s11042-026-21305-7
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context:
Mohammad Rezaei
Farnaz Farahanipad
Alex Dillhoff
Multimedia Tools and Applications
Building similarity graph...
Analyzing shared references across papers
Loading...