秉持創(chuàng)新引領(lǐng)、數(shù)據(jù)賦能和服務高效的理念,國內(nèi)某省攜手捷通華聲,打造省級智能會議系統(tǒng),為各市、縣區(qū)黨委、政府、政協(xié)提供實時語音轉(zhuǎn)錄、投屏、雙語互譯、會議記錄管理等一系列服務,助力政府提升辦公效能。

語音識別是智能會議系統(tǒng)的核心技術(shù),除核心算法還需要豐富的語料訓練,綜合能力直接影響轉(zhuǎn)寫速率以及對方言口音、行業(yè)術(shù)語、敏感詞等內(nèi)容的轉(zhuǎn)寫成功率,是部署省級會議系統(tǒng)的關(guān)鍵指標。
捷通華聲在近20年的人工智能技術(shù)研發(fā)與產(chǎn)業(yè)化應用過程中,語音識別技術(shù)持續(xù)保持行業(yè)領(lǐng)先,同時積累了定制化服務經(jīng)驗。
在聲學模型方面,通過采集大量真實錄音數(shù)據(jù),對不同方言、語種發(fā)音習慣,如兒化音、聲調(diào)等,進行學習訓練,提高模型精度和識別率。
在語言模型方面,對各地方言、語種的特有詞匯進行專門訓練,有效提升了語音識別引擎對口音、詞匯的適配能力。
實際會議場景中,無論發(fā)言人說的是普通話還是地方方言,靈云智能會議系統(tǒng)都能對這些發(fā)言分角色進行精準識別轉(zhuǎn)寫,快速生成會議紀要。
而且基于最新的神經(jīng)網(wǎng)絡算法,系統(tǒng)能夠?qū)Ω鞯貐^(qū)、各場景的語音進行不斷地學習與適應,增強口音、語速適配能力,持續(xù)提升多人對講、遠場講話等場景中的語音識別率。
針對會議交流過程中,普遍存在的“嗯”“啊”“是吧”等大量助詞,靈云智能會議系統(tǒng)專門提供了語氣詞過濾功能,確保輸出的會議紀要更符合文字版要求。
投屏是政府會議普遍會使用的功能,通過大屏將領(lǐng)導講話實時展示出來,方便所有與會成員準確獲取會議信息,特別是對方言差異比較大的情況。
除了會場實時語音轉(zhuǎn)寫,靈云智能會議系統(tǒng)也支持錄音離線轉(zhuǎn)寫,方便書記員整理領(lǐng)導外出講話。此外,會議紀律、會議公告等內(nèi)容,也可用系統(tǒng)的語音合成功能播報,為管理人員提供全方位的會議工具。
關(guān)于會議保密性,靈云智能會議系統(tǒng)采用私有云的方式進行部署,并提供完整的軟硬件環(huán)境。數(shù)據(jù)信息完全保存在企業(yè)內(nèi)部,外界無法收集和查看,做到在物理上管理可控,在軟件上確保數(shù)據(jù)信息的私密性與安全性。