カザフ語、ウズベク語、タタール語などのトルコ語族言語向け並列音声コーパスの開発は、多言語音声合成、音声認識システム、機械翻訳の開発において大きな課題となっています。これらの言語は音声技術においてリソースが乏しく、現代の認識、合成、理解システムに不可欠な整合した文字起こし付きの十分な大規模音声データセットを欠いています。本稿では、トルコ語族言語に焦点を当てた音声コーパスの開発および実験的評価を紹介し、音声合成および自動翻訳タスクでの利用を目的としています。主な目的は、人工知能とテキスト読み上げ(TTS)技術を組み合わせて音声とテキストの双方を生成するカスケード型生成法を用いて並列音声コーパスを作成し、生成データの品質と適合性を評価することです。合成音声の品質評価には、自然さ、イントネーション、表現力、言語的適切さを測定する指標を適用しました。その結果、高品質なカザフ語の自然音声と文字起こしおよび翻訳を組み合わせたマルチモーダル(カザフ語–トルコ語、カザフ語–タタール語、カザフ語–ウズベク語)コーパスが作成され、トルコ語、タタール語、ウズベク語の合成音声も含まれています。これらのコーパスは音声およびテキスト処理研究のための独自の資源を提供し、ASR、MT、TTS、音声から音声への翻訳(STS)の統合を可能にします。
Building similarity graph...
Analyzing shared references across papers
Loading...
Aidana Karibayeva
Vladislav Karyukin
Ualsher Tukeyev
Applied Sciences
Al-Farabi Kazakh National University
Building similarity graph...
Analyzing shared references across papers
Loading...
Karibayeva et al.(Fri,)はこの問題を研究しました。
www.synapsesocial.com/papers/694022532d562116f28fc3ad — DOI: https://doi.org/10.3390/app152412880
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: