語(yǔ)音識(shí)別引擎結(jié)合媒體服務(wù)器實(shí)現(xiàn)智能客服集成是很多企業(yè)用戶的需求之一。如果API或者M(jìn)RCP接口調(diào)用商業(yè)語(yǔ)音識(shí)別引擎平臺(tái)的接口費(fèi)用比較高昂,很多多離線識(shí)別和小型終端的支持也不太友好。Vosk是開(kāi)源的語(yǔ)音識(shí)別開(kāi)發(fā)套件,可以支持多種語(yǔ)言,并且可以和開(kāi)源媒體服務(wù)器Asterisk,F(xiàn)reeSWITCH,unimrcp和Jigasi集成(開(kāi)源jitsi 視頻會(huì)議服務(wù)器的SIP接口)實(shí)現(xiàn)離線識(shí)別。其語(yǔ)音識(shí)別引擎使用的是基于開(kāi)源語(yǔ)音識(shí)別引擎kaldi實(shí)現(xiàn)。其應(yīng)用場(chǎng)景包括輕量級(jí)的離線語(yǔ)音識(shí)別,支持安卓,樹(shù)莓派等終端設(shè)備。
關(guān)于MRCP的語(yǔ)音識(shí)別詳解,搜索歷史文檔MRCP協(xié)議,筆者發(fā)布了完整MRCP的完整規(guī)范。
參考文檔:
https://alphacephei.com/vosk/server
https://github.com/alphacep/vosk-server