해당 세미나를 듣고 내용을 요약하고 유튭링크나 다른 내용을 좀더 추가했습니다.
혹시라도 저작권 문제로인해 삭제 해야한다면 nhj1124@icloud.com 메일로 알려주세요
TTS (TEXT TO Speech) : 음성 합성 기술
꽤 오래된 기술
TTS 의 예시를 볼 수 있습니다.
TTS (Text - to - Speech )기술은
- 시각/청각 장애인들을 위한 활용방안이 많습니다.
- 정보나, 사실관계를 전달하는데에는 문제가 없습니다. : 네비게이션, 날씨 전달, 시리 등
- 문장을 읽어내는 능력이 뛰어납니다. (글자의 발음능력 또한 뛰어납니다. ) : 예를들면 김주하 AI 앵커
그렇지만 TTS 에도 한계점이 존재하는데요
- 목소리의 어색함이 존재합니다.
- 현재 발음은 잘 훈련되어 완벽하지만, 발성의 톤이라던지, 감정표현력에는 한계가 존재합니다.
이러한 한계점은 영화나 드라마 감정을 표현해야만 하는 곳에서는 상업화 하기 어렵다는 점이 있습니다.
'딥러닝 > 소리데이터' 카테고리의 다른 글
[서울대 지능정보 세미나 - 이교구 교수] (4) NASY : Neural Analysis and Synthesis 신경망 기반 음성 분석 및 합성 (0) | 2022.10.19 |
---|---|
[서울대 지능정보 세미나 - 이교구 교수] (3) SVS (Singing Voice Synthesis) : 가창 합성 : 김광석 & 터틀맨 제작 과정 (0) | 2022.10.18 |
[서울대 지능정보 세미나 - 이교구 교수] (1) Sound 컨텐츠 시장의 리스크 & 베토벤 미완성 교향곡 10번 (도이치 텔레콤) (0) | 2022.10.18 |
music 21 사용하기 & 에러 해결 .show() (0) | 2022.05.01 |
음성데이터의 기초적인 이해 (MFCC, zero crossing rate) (0) | 2022.04.30 |