December 5, 2025Open Access

低リソースのトルコ語族言語向け多言語音声コーパスの開発と実験的評価

Key Points

低リソースのトルコ語族言語向けに並列音声コーパスを作成し、音声合成能力を向上させました。
合成音声の評価はカザフ語、ウズベク語、タタール語に注目し、自然さや表現力の品質指標を測定しました。
人工知能とテキスト読み上げ技術を用いて、カザフ語の音声と翻訳を含むマルチモーダルコーパスを開発しました。
この資源は自動翻訳や関連音声技術の進展を支え、より広範な応用の可能性を示しています。

Abstract

カザフ語、ウズベク語、タタール語などのトルコ語族言語向け並列音声コーパスの開発は、多言語音声合成、音声認識システム、機械翻訳の開発において大きな課題となっています。これらの言語は音声技術においてリソースが乏しく、現代の認識、合成、理解システムに不可欠な整合した文字起こし付きの十分な大規模音声データセットを欠いています。本稿では、トルコ語族言語に焦点を当てた音声コーパスの開発および実験的評価を紹介し、音声合成および自動翻訳タスクでの利用を目的としています。主な目的は、人工知能とテキスト読み上げ（TTS）技術を組み合わせて音声とテキストの双方を生成するカスケード型生成法を用いて並列音声コーパスを作成し、生成データの品質と適合性を評価することです。合成音声の品質評価には、自然さ、イントネーション、表現力、言語的適切さを測定する指標を適用しました。その結果、高品質なカザフ語の自然音声と文字起こしおよび翻訳を組み合わせたマルチモーダル（カザフ語–トルコ語、カザフ語–タタール語、カザフ語–ウズベク語）コーパスが作成され、トルコ語、タタール語、ウズベク語の合成音声も含まれています。これらのコーパスは音声およびテキスト処理研究のための独自の資源を提供し、ASR、MT、TTS、音声から音声への翻訳（STS）の統合を可能にします。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Aidana Karibayeva

Vladislav Karyukin

Ualsher Tukeyev

Journals

Applied Sciences

Actions

Institutions

Al-Farabi Kazakh National University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

低リソースのトルコ語族言語向け多言語音声コーパスの開発と実験的評価

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider