日本電報電話公司(NTT)9月7日正式宣布,它成功開發(fā)出了比人類聲音毫不遜色的自然歌聲合成技術。該技術可以生動再現(xiàn)人類歌聲中豐富的名為“倍音”的高音調。只要使用者輸入歌詞和歌譜,安裝該軟件的PC就會輕松地讀譜歌唱。該技術有望在游戲及卡通方面有優(yōu)秀表現(xiàn)。目前NTT東西地方公司和NTT通信公司等正在研究該技術的實用化問題。
該技術在采集合成歌聲素材創(chuàng)建人類聲音數(shù)據(jù)庫時,對人類聲音按波形整齊與否進行分類,波形整齊的成分與波形不整齊的成分按類存放。在合成過程中,該技術首先利用正弦波自動合成“倍音”,然后進行其他迭加。僅靠這種手段合成的聲音還有樂器的味道,不夠自然。這時候就需要加入一些特地保存的相應的噪音成分,這樣一來,比較自然的、接近人類聲音的歌聲就實現(xiàn)了。