首頁>>廠商>>語音板卡開發(fā)商>>Aculab

Aculab的TTS(文語轉(zhuǎn)換)技術(shù)

2004/04/28

  Aculab的V3.0版TTS性能明顯提升,包括對W3C標(biāo)準(zhǔn)語音合成標(biāo)記語言(SSML)的支持、對新增的巴西葡萄牙語和意大利語的支持以及更新的英國英語男聲和西班牙語的女聲、對所有支持語言發(fā)音和韻律的改善處理,以及發(fā)聲字典工具的提供。Aculab的基于主機(jī)TTS,采用的是完全可伸縮的、運(yùn)行快速且準(zhǔn)確的波形拼接語音合成算法,具有占用內(nèi)存小、通道容量大和采用客戶機(jī)/服務(wù)器結(jié)構(gòu)等特點(diǎn)。

  Aculab的TTS和Prosody DSP資源卡一起工作。Prosody板卡除了擔(dān)當(dāng)合成的音頻信號放音功能外,還能同時(shí)啟動(dòng)其他DSP資源的運(yùn)行。據(jù)此,開發(fā)商可以采用Aculab的統(tǒng)一API,把TTS`、語音識別及其他不同的語音處理算法結(jié)合起來,從而提高語音增值業(yè)務(wù)的性能。當(dāng)和Prosody板卡一起使用時(shí),TTS可以在Aculab的網(wǎng)站上免費(fèi)下載。

語音技術(shù)

  隨著近來語音和語言處理技術(shù)的快速發(fā)展,采用Aculab TTS和Prosody板卡可以創(chuàng)建更為復(fù)雜的、具有創(chuàng)新意義的應(yīng)用解決方案,來滿足多元化市場的需求。例如,用戶接通統(tǒng)一消息應(yīng)用后,就可以用電話訪問并聽取具有電子格式的文本消息。這類應(yīng)用對于那些不在辦公室、卻又需要及時(shí)收取電子郵件的人來講意義非凡。在呼叫中心環(huán)境里,采用TTS可以把文字信息念給呼叫用戶聽,企業(yè)或其他機(jī)構(gòu)可以在不增加業(yè)務(wù)人員的前提下,改善客服的質(zhì)量。

  這類語音應(yīng)用都需要把文字信息念出來,在文字信息頻繁更新或預(yù)先錄制語音成本過于昂貴的情況下,TTS的價(jià)值尤其顯著。

  Acualb TTS技術(shù)是因此類應(yīng)用應(yīng)運(yùn)而生的。他的獨(dú)特之處是在技術(shù)開發(fā)過程中已充分考慮到了電話網(wǎng)絡(luò)帶來的局限,如有限的帶寬、嘈雜的電話接聽環(huán)境以及應(yīng)用對高通道密度的需求。Aculab的TTS即使在處理很長的文本段落時(shí),也能合成出一致性強(qiáng)和智能化的電話語音。

TTS系統(tǒng)結(jié)構(gòu)

  Aculab的TTS和Prosody板卡配合使用,無論是PCI還是cPCI格式的Prosody板卡都能通過E1或T1網(wǎng)絡(luò)接口輸出合成的語音信號。這個(gè)TTS軟件和任何一種Aculab的、支持64Kbit/s速率放音的語音算法固件都兼容。Aculab的TTS也可以在一個(gè)DSP處理器內(nèi),同時(shí)運(yùn)行其他語音處理算法,如錄音、回波抵消,以支持語音識別所需的"barge-in"。

  所有這一切意味著:開發(fā)商可以受益于多種Prosody語音技術(shù)的靈活組合,來構(gòu)建可靠性強(qiáng)的、高性能的和可擴(kuò)展的應(yīng)用系統(tǒng)。

SSML支持

  Aculab現(xiàn)在支持W3C的SSML標(biāo)準(zhǔn),更進(jìn)一步地提高了應(yīng)用中的靈活性。

  允許在給定的文本內(nèi)進(jìn)行語音學(xué)標(biāo)注,可以為易于混淆的詞提供正確的發(fā)音,如:把"Smyth"讀成"Smith"而不是"Smythe"。

  SSML標(biāo)準(zhǔn)提供的標(biāo)記能改善文本預(yù)處理的性能。加上簡單的標(biāo)記,就可以很容易地判定數(shù)字1956是讀成年份、整型數(shù)還是一個(gè)數(shù)字串。

  有了對SSML的支持,Aculab的TTS可以在文本內(nèi)改變聲音或語言特性,并能控制基頻、語音速率、停頓和重音等。當(dāng)合成的和預(yù)錄的語音混合使用,或需要為特定的聽眾定制聲音播放時(shí),這些特性更有用。

通道容量

  TTS應(yīng)用里,文本需要通過電話線路傳輸然后讀出來,所以應(yīng)用中要考慮一些特殊的因素:包括中繼線的數(shù)量、DSP的處理能力以及主機(jī)負(fù)載和處理能力等。采用基本的Intel Pentium III / 700MHz的客戶機(jī),配合具有兩個(gè)DSP處理器和PM4模塊的Prosody板卡,就可以利用Aculab的TTS輕松地同時(shí)向120個(gè)呼叫用戶播放根據(jù)文本轉(zhuǎn)換來的語音。所以,開發(fā)商可以放心地實(shí)施高密度的語音解決方案,來提高競爭能力。

特性總結(jié)

·支持的語言
  可以動(dòng)態(tài)改變。支持的語言包括:英國英語、美國英語、法語、德語、歐洲西班牙語、巴西葡萄牙語、意大利語和拉丁美洲西班牙語等。

·聲音變化
  每種語言都有預(yù)配置的聲音類型。Aculab的新版TTS允許開發(fā)商選擇多達(dá)十種的語音變種。

·操作系統(tǒng)
  支持Windows NT 4.0,Windows XP/2000,Linux和Sun SPARC Solaris等。

·免費(fèi)的許可證
  不收取按通道計(jì)算的使用許可證費(fèi)用,可以隨時(shí)隨地在Aculab網(wǎng)站上下載。

·文本輸入格式
  Unicode和XML / SSML。

·E-mail預(yù)處理
  這是一個(gè)可選的模塊,用來處理e-mail里特定的文本,如郵件地址、消息頭和URL等。V3.0 TTS擴(kuò)充了這部分功能,使得e-mail消息的處理更加自然和準(zhǔn)確。

·文本的歸一化
  鑒別和適當(dāng)擴(kuò)充某些特殊文本域,包括日期、時(shí)間、貨幣、銀行賬號、電話號碼、縮略語以及一些標(biāo)點(diǎn)符號(如引號、括號、星號等)。

·語調(diào)、重音和間隔
  由于Aculab的TTS采用了更為復(fù)雜的語言模型來提高合成聲音的自然度和韻律特征,所以這些指標(biāo)都有顯著改善。合成的語音能準(zhǔn)確地依參數(shù)而改變,確保了合成語音的可懂度。

·詞典管理
  為了滿足開發(fā)商調(diào)整發(fā)音或增加新詞的需要,Aculab開發(fā)了具有圖形用戶界面、和平臺(tái)無關(guān)(Java)的詞典管理器。新版的此工具能用TTS把輸入字典的詞語讀出來。

·采樣率
  和電話帶寬相應(yīng),TTS合成系統(tǒng)采用8KHz的采樣率。

·向兼容
  采用TTS API,可以方便地控制音量、基頻和語音速率等。新增的SSML特性能更有力地控制這些TTS輸出涉及的語音特性。

Aculab公司供稿 CTI論壇編輯



相關(guān)鏈接:
Aculab增強(qiáng)對Asterisk商業(yè)版的支持 2006-11-21
信令與媒體網(wǎng)關(guān)GroomerII的卓越IP和SS7處理能力 2006-11-17
Aculab產(chǎn)品的七號信令監(jiān)控功能 2006-10-11
Aculab公司的最新產(chǎn)品研發(fā) 2006-09-19
Aculab發(fā)布最新產(chǎn)品——Prosody X PCIe板卡 2006-09-14

分類信息:     技術(shù)_語音板卡_新聞   技術(shù)_語音板卡_文摘