What does this research mean for the field?

Integrating optimized feature selection and temporal attention mechanisms into a Long Short-Term Memory (LSTM) network significantly improves speech emotion recognition accuracy for the low-resource Kashmiri language, achieving 90.2% accuracy. Novelty: ClaimNovelty.METHODOLOGICAL. Consensus alignment: ConsensusAlignment.ESTABLISHES_NEW_DIRECTION.

March 18, 2026Open Access

感情認識を最適化するためのBi-LSTM分類器による高度な特徴選択と時間的注意メカニズムを用いたカシミール語の音声分析

Key Points

Key points are not available for this paper at this time.

Abstract

この研究では、最適化された特徴選択を活用し、Long Short-Term Memory (LSTM)ネットワークに時間的注意メカニズムを統合することにより、カシミール語の感情認識を強化するための高度な方法論を紹介します。注意深い特徴選択プロセスにより、Mel周波数ケプストラム係数（MFCC）、線形予測コーディング（LPC）、および感情分類に最適なその他の関連記述子を含む主要な音響特徴が特定されました。時間的注意層の導入により、モデルが音声データ内の複雑な感情パターンと時間的ダイナミクスを捉える能力が大幅に向上しました。提案された注意拡張LSTMモデルは90.2%の精度を達成し、ベースラインLSTMモデルの86%の精度を上回りました。複数の感情カテゴリーにわたる精度、再現率、F1スコアの顕著な改善は、微妙な感情の変化を捉える上で注意メカニズムの有効性をさらに強調しています。性能向上に加え、この研究は注意ベースの時間的モデリングがカシミール語のような資源の限られた言語にもたらす利益を示すことで、明確な研究方向を提供します。これにより、言語的および抑揚的な手がかりが広く研究されている言語とは大きく異なるカシミール語において、研究の方法論的ベースラインが確立されます。したがって、これらの発見はデジタル領域、チャットベースのシステム、感情を意識したエージェント、その他のヒューマンマシンインターフェースでの未来の感情認識（SER）展開を支援します。これらの発見は、モデルが感情認識システムの感度と特異度の両方を向上させる能力を強調しており、音声ベースの感情分析のための頑健で効率的なフレームワークを提供します。将来的な研究は、提案された方法論を多言語設定に拡張し、マルチモーダル情報を組み込むことで、多様な言語的および文化的文脈における感情表現の深い分析を可能にします。

感情認識を最適化するためのBi-LSTM分類器による高度な特徴選択と時間的注意メカニズムを用いたカシミール語の音声分析

Key Points

Abstract

Cite This Study