
新一代靈云語音識別演示(建議全屏觀看)
此次靈云語音識別技術的升級,是捷通華聲在CTC算法的基礎上,對建模單元粗粒度、模型訓練方法、解碼幀率進行創(chuàng)新優(yōu)化。有效提升了語音識別引擎的執(zhí)行效率、魯棒性,增強了口音、語速適配能力,大幅提升了多人對講、遠場講話等場景中的語音識別率。
調用云端語音識別服務就上靈云平臺
新一代靈云語音識別技術已上線靈云平臺,開發(fā)者可以去靈云開發(fā)者社區(qū)(aicloud.com/dev/)申請調用。

開發(fā)者將靈云語音識別SDK集成到ISO、JAVA、安卓、Windows等軟件應用中后,填寫申請到的靈云平臺語音識別服務地址、授權信息,便可免費調用靈云平臺的語音識別服務。
目前,靈云平臺上的語音識別技術已服務包括打車軟件、輸入法、翻譯APP、手機銀行客戶端等各類數(shù)十萬應用,覆蓋數(shù)億終端用戶。
靈云ASR能力平臺為政企單位提供私有、專業(yè)的語音識別能力
在提供公有云ASR能力的同時,捷通華聲一直在為Callcenter、會議、公安等場景提供私有化的語音識別能力。
其中,在Callcenter電話信道8K語音識別場景,捷通華聲已服務眾多大型銀行客服中心、客服BPO中心,將海量語音實時轉寫為文字,為智能質檢、智能客服、智能外呼、數(shù)據(jù)分析等提供私有云的語音識別能力。
在會議、司法、醫(yī)療等16k語音識別場景,捷通華聲積累了大量聲學、語言數(shù)據(jù),分別推出了會議、審訊、醫(yī)療各科室等行業(yè)版的語音識別能力平臺,為政企客戶提供專業(yè)、私有、更安全的語音識別能力。
十多年來,捷通華聲始終堅持核心技術自主研發(fā)。隨著此次靈云語音識別技術的跨越式提升,捷通華聲將為公有云開發(fā)者、政企客戶提供識別率更高、更優(yōu)質的語音識別能力與服務。