NEC日前宣佈,成功開發可利用語調節奏、自然不造作地讀出文字的文字語音合成技術。
本技術係從大量的聲音資料庫中抽取出語調及節奏等聲音元素,透過該聲音元素將以往總是單調死板而不自然的電子語音,改良為可輕鬆理解其內容的高品質語音。本技術可廣泛應用至電話自動答錄裝置或車載設備等場合,幫助收聽語音者在聽取語音時更容易理解內容。
本次開發的語音合成技術特點如下:
1. 使用從聲音資料庫中抽取出的原始聲音語調節奏資訊
從大量的聲音資料庫中,以前後單字及文章長度為基準,抽取出可將單字以精確的語調及節奏發音的語音資訊。在合成語音時,配合既有以人工方式完成的樣本規則,便能產生自然而富有情感的合成語音。
2. 使用可表現多樣化語調節奏的豐富聲音元素
將聲音資料庫中抽取出的聲音元素,以及聲音資料庫中沒有的聲音元素,依據唇部與聲帶振動等人類發音所需的構造變化為基準,產生其語音內容。將這些聲音元素做最適當的選擇並加以整合,便能產生高品質語調節奏的合成語音。
NEC未來將持續積極進行文字語音合成技術相關應用的研究與開發,並且致力創造更便利、更人性化的理想資訊社會。
全站熱搜
留言列表