語(yǔ)音識(shí)別,就是讓機(jī)器通過(guò)分析和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的尖端技術(shù)。語(yǔ)音識(shí)別是一門交叉學(xué)科,所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺(jué)機(jī)理、人工智能等等。語(yǔ)音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)一同成為實(shí)現(xiàn)人機(jī)語(yǔ)音通信,建立有聽和講能力的語(yǔ)音系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)。
捷通華聲ASR核心引擎是針對(duì)特定語(yǔ)言的識(shí)別軟件模塊,該軟件模塊是整個(gè)ASR軟件的核心模塊。核心模塊接收其他模塊的設(shè)置,并根據(jù)設(shè)置內(nèi)容對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行識(shí)別,并將識(shí)別結(jié)果列表返回給調(diào)用模塊。返回的識(shí)別結(jié)果列表,包含一組識(shí)別結(jié)果--識(shí)別信心值對(duì),以供調(diào)用模塊使用。
捷通華聲ASR語(yǔ)音識(shí)別技術(shù)具有以下特點(diǎn):
- 支持語(yǔ)種:廣泛支持中英文識(shí)別;
- 識(shí)別率:高針對(duì)漢語(yǔ)普通話,連續(xù)語(yǔ)音識(shí)別率可以達(dá)到90%以上,支持語(yǔ)音打斷功能與端點(diǎn)檢測(cè)功能;
- 識(shí)別速度:采用實(shí)時(shí)識(shí)別方式,實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)的傳輸和識(shí)別的同步,實(shí)時(shí)率可達(dá)0.5以下。
- 可定制:定制模型的識(shí)別率可達(dá)到95%以上
- 詞表長(zhǎng)度:大詞表長(zhǎng)度可達(dá)到百萬(wàn)以上(可根據(jù)需要擴(kuò)展);
- 音頻格式:用于進(jìn)行語(yǔ)音識(shí)別的輸入語(yǔ)音格式為:16K*8Bit A-Law、16K*8 Bit u-Law、16K*16 Bit PCM;
- 識(shí)別方式:支持詞表識(shí)別、語(yǔ)法識(shí)別和自由說(shuō)識(shí)別。
- 語(yǔ)法功能:可以在加載多個(gè)語(yǔ)法文件的情況下,同時(shí)激活多個(gè)語(yǔ)法文件,讀取單個(gè)詞條,從多個(gè)語(yǔ)法文件中得出單個(gè)詞條的識(shí)別結(jié)果。
- 支持云端識(shí)別和本地端識(shí)別。