
因應(yīng)語音辨識蔚為風(fēng)潮,Mozilla宣布啟動第一個旨在訓(xùn)練語音辨識app的開源資料集的群眾募資計畫Common Voice。
這項專案在6月間釋出,目前已開始訓(xùn)練階段。Mozilla指出,現(xiàn)今許多軟件大廠,包括Google、蘋果及亞馬遜都各自推出了語音辨識服務(wù),喊了個指令就可以開始作業(yè),似乎很方便,但是這種大廠控制的語音辨識生態(tài)圈卻可能扼殺了創(chuàng)新者的進(jìn)入。
一來,大廠只會著重特定英文、中文、西文等等主流語言,而忽略了使用者較少的其他語言。二者,這些生態(tài)圈產(chǎn)生的資料集也為大廠控制,使得也有意開發(fā)語音控制裝置的學(xué)生、新創(chuàng)公司及研究人員能存取的資料相當(dāng)有限。
Common Voice專案現(xiàn)在開始到秋天,邀請開發(fā)人員大聲誦讀句子以協(xié)助語音辨識引擎的訓(xùn)練,貢獻(xiàn)量沒有上限,該計劃預(yù)計匯集1萬小時的語音錄音檔,也可協(xié)助聽取驗(yàn)證錄音檔的準(zhǔn)確性。
Mozilla表示,資料量足夠后,預(yù)計2017年下半可以將Common Voice資料庫開源釋出,用以支援語音辨識裝置、app及作業(yè)系統(tǒng)的開發(fā)。