본문 바로가기

딥러닝/소리데이터

[서울대 지능정보 세미나 - 이교구 교수] (2) TTS - Text - to - Speech

해당 세미나를 듣고 내용을 요약하고 유튭링크나 다른 내용을 좀더 추가했습니다.

혹시라도 저작권 문제로인해 삭제 해야한다면 nhj1124@icloud.com 메일로 알려주세요 

https://youtu.be/BiDXrqWUt0w


TTS (TEXT TO Speech) : 음성 합성 기술

꽤 오래된 기술 

TTS 의 예시를 볼 수 있습니다. 

https://youtu.be/40y39FvAkeY

TTS (Text - to - Speech )기술은

- 시각/청각 장애인들을 위한 활용방안이 많습니다. 

- 정보나, 사실관계를 전달하는데에는 문제가 없습니다. : 네비게이션, 날씨 전달, 시리 등 

- 문장을 읽어내는 능력이 뛰어납니다. (글자의 발음능력 또한 뛰어납니다. ) : 예를들면 김주하 AI 앵커 

https://youtu.be/IZg4YL2yaM0

그렇지만 TTS 에도 한계점이 존재하는데요 

- 목소리의 어색함이 존재합니다. 

- 현재 발음은 잘 훈련되어 완벽하지만, 발성의 톤이라던지, 감정표현력에는 한계가 존재합니다. 

   이러한 한계점은 영화나 드라마 감정을 표현해야만 하는 곳에서는 상업화 하기 어렵다는 점이 있습니다.