인공 지능 기반 기술의 발전으로 chatGPT, Gemini 등의 대화형 인공 지능 음성 처리 기술 등이 널리 이용되고 있다. 그러나 지속적으로 발생하는 사용 환경의 잡음, 불규칙한 발음과 연음에 대한 인식 문제로 음성 인식에 대한 성능 저하의 문제가 계속적으로 발생된다. 음성 인식을 위한 인공지능 학습 모델 훈련 방법에서 발생하는 음성 인식률 향상 방법으로 본 논문에서는 개선된 SFN(Silence Feature Normalization)을 이용한 음성인식 성능 향상 방법을 제안한다. 본 연구에서는 높은 신호 대 SNR에서 음성의 특징에 대한 잡음이 적게 영향을 받고, 낮은 SNR에서는 음성과 비음성의 특징 분포 특성을 이용하여 인식률을 향상하였다. 잡음에 대한 사용자의 음성 인식 정확도를 평가하기 위해 SNR에 대한 Noise Reduction Rate와 PHR(Pause Hit Ratio)을 사용한 정확도를 분석하여 향상된 인식률을 확인하였다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Sang-Yeob Oh
The Journal of Korean Institute of Information Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Sang-Yeob Oh (Tue,) studied this question.
www.synapsesocial.com/papers/69d893896c1944d70ce0476d — DOI: https://doi.org/10.14801/jkiit.2026.24.3.183