
在全球人工智能技術(shù)大會現(xiàn)場,科大訊飛展出人工智能在城市、教育、醫(yī)療、工業(yè)、辦公、生活等場景的豐富應用,帶領(lǐng)觀眾暢享智能應用未來。其中,榮獲國家工業(yè)領(lǐng)域最高獎項的訊飛圖聆工業(yè)云平臺廣受關(guān)注,聽聲辨障、釋放工業(yè)六感,刷新大眾對智能工業(yè)的想象。

人工智能核心技術(shù)突破
萬物智能互聯(lián)時代到來
以人工智能為代表的新興科技快速發(fā)展,推動著人類正進入人、機、物三元融合的萬物智能互聯(lián)時代。人機交互模式日益替代觸控模式,語音交互、視覺識別越來越成為人機交互模式發(fā)展的大勢所趨。
結(jié)合當下時代背景,劉慶峰認為,國內(nèi)產(chǎn)業(yè)發(fā)展將從過去的人口紅利期過渡為人才紅利期,最終進入人工智能的應用紅利階段。“通過人工智能大幅提高社會生產(chǎn)效率,提升產(chǎn)品質(zhì)量?梢哉f,人工智能,既是未來建設幸福中國必不可少的手段,也是實現(xiàn)工業(yè)強國的核心支撐。”例如,訊飛推出的銀發(fā)智能服務平臺可以對老人進行24小時關(guān)懷,訊飛圖聆工業(yè)云平臺可以有效提升工業(yè)降本增效。
劉慶峰表示,兌現(xiàn)人工智能產(chǎn)業(yè)紅利,首先要掌握人工智能核心技術(shù)并持續(xù)突破。近三年來,科大訊飛持續(xù)深耕技術(shù)研發(fā),在語音識別、語音合成、語義理解等領(lǐng)域不斷取得成果,在國際人工智能領(lǐng)域的相關(guān)比賽上獲得了30余項世界冠軍。

人工智能核心技術(shù)的逐漸成熟推動智能產(chǎn)品的落地,以語音識別為主的人機交互技術(shù)正成為萬物互聯(lián)時代的入口。2020年,科大訊飛智慧家庭的語音模組出貨量達4750萬,過去三年的年化增長率達到了150%,呈現(xiàn)出爆發(fā)增長的狀態(tài)。科大訊飛虛擬主播亮相央視,得到“國字號”認可。由科大訊飛提供技術(shù)支持的多音色語音播報功能惠及9000萬學習強國用戶?拼笥嶏w開放平臺每天為聽障、視障人士提供5000萬次輔助服務……
人工智能核心技術(shù)的進步,也使得用更小數(shù)據(jù)獲得更佳效果成為可能。比如在語音識別上,基于語音合成和自訓練的半監(jiān)督語音識別框架,把有監(jiān)督的數(shù)據(jù)和語音合成出的數(shù)據(jù)以及語音識別自動標注的數(shù)據(jù)融合在一起,實現(xiàn)更好的語音識別效果。
“100小時內(nèi)有監(jiān)督數(shù)據(jù),加上1萬小時的無標注語音,再加上大量文本數(shù)據(jù)合成的語音,進行融合訓練,就可以達到原來1萬小時有監(jiān)督數(shù)據(jù)訓練的效果。”劉慶峰指出,這使得人工智能在用更小的數(shù)據(jù)實現(xiàn)更好的效果上邁出非常大的一步。
從單點技術(shù)突破到系統(tǒng)性創(chuàng)新
人工智能深度賦能社會剛需
單點技術(shù)的突破,是人工智能向前邁進的重要推力。但要真正應對社會重大命題,解決社會剛需,還要通過系統(tǒng)性創(chuàng)新破局。在部署系統(tǒng)創(chuàng)新戰(zhàn)略中,科大訊飛已在教育、醫(yī)療、工業(yè)和企業(yè)數(shù)字化轉(zhuǎn)型等領(lǐng)域中深度實踐。

如在智慧教育領(lǐng)域,要做到針對每個孩子因材施教,就必須利用多個單點技術(shù)的系統(tǒng)性融合。以科大訊飛的智慧教育應用為例——OCR技術(shù)可對學生的課堂、作業(yè)表現(xiàn)以及考試數(shù)據(jù)進行分析;自動評分技術(shù)對客觀題和主觀題進行評分,總結(jié)學生知識學習情況,分析出學習路徑規(guī)劃;語音識別和語義理解技術(shù)幫助學生回顧課堂、進行思維訓練……多個關(guān)鍵技術(shù)的結(jié)合,形成了智慧教育產(chǎn)品的內(nèi)在運行邏輯。

智慧醫(yī)療也不例外?拼笥嶏w智醫(yī)助理在學習大量醫(yī)學知識和案例后,通過了國家執(zhí)業(yè)醫(yī)師資格考試,分數(shù)超全國96.3%的人類考生。在基層醫(yī)療機構(gòu)投入使用后,智醫(yī)助理已累計進行2億多次的輔助診療,服務3萬多名基層醫(yī)生,有效提升基層醫(yī)生的診斷準確率。劉慶峰強調(diào):“這背后不僅僅是一個簡單的機器在后臺運作,而是從單點技術(shù)突破到輔助診療的系統(tǒng)性創(chuàng)新。”

同樣,憑借系統(tǒng)性創(chuàng)新,人工智能在工業(yè)領(lǐng)域中也取得突破。訊飛圖聆工業(yè)云平臺融合聲紋識別、機器學習、聲源定位等技術(shù),實現(xiàn)設備預測維護、產(chǎn)品質(zhì)檢、安全生產(chǎn)等。由平臺衍生出的工業(yè)聽診器能夠自動聽出工業(yè)生產(chǎn)線有無故障;訊飛聲學照相機能快速確定設備異響位置,提升巡檢效率和檢修速度。
在促進企業(yè)數(shù)字化轉(zhuǎn)型中,人工智能的系統(tǒng)性創(chuàng)新也賦能著企業(yè)客服、營銷、行政、財務等多個方面。如科大訊飛內(nèi)部使用的財務系統(tǒng),免去了手寫票據(jù)的繁瑣,利用自動的OCR識別技術(shù)、語義理解技術(shù)和成像技術(shù),就能夠在3分鐘內(nèi)完成原先需要15分鐘的報銷單填寫和審核。
劉慶峰總結(jié),實現(xiàn)系統(tǒng)性創(chuàng)新有三大關(guān)鍵要素:關(guān)鍵的核心技術(shù)效果要跨越技術(shù)鴻溝,達到應用門檻;深度融合創(chuàng)新鏈條上的各個關(guān)鍵技術(shù),激發(fā)創(chuàng)新能力;針對重大的歷史命題社會命題進行系統(tǒng)性解析,并將其轉(zhuǎn)化為科學問題。
三大趨勢洞悉AI未來
人機共存建設美好世界
談及人工智能未來十年的前景,劉慶峰表示,人工智能將呈現(xiàn)三大發(fā)展趨勢:
一是深度學習的“黑盒”變“白盒”。讓深度學習從關(guān)注程序外部結(jié)果到深入程序內(nèi)部邏輯結(jié)構(gòu),從數(shù)據(jù)結(jié)構(gòu)化、網(wǎng)絡可視化到推理過程化,衍生出“具有可解釋性的人工智能”,這樣的需求是當下十分迫切、也是未來人工智能的攻堅方向。
二是人機共存時代到來,人機共存更加和諧、自然,人機交互將更加以人為本,人工智能將更加順應每個人的發(fā)展,包括多模態(tài)感知和呈現(xiàn)、可編輯的人工智能人設、場景自適應的交互等。
三是人工智能和多學科交叉研究,將加速促進人工智能在更多行業(yè)中引發(fā)顛覆式的革新。如人工智能和腦科學的結(jié)合,人工智能的基本算法在材料科學和生物制藥領(lǐng)域都將起到巨大作用。
借由三大趨勢洞悉人工智能未來十年發(fā)展,人工智能紅利兌現(xiàn)近在眼前。與此同時,劉慶峰強調(diào),人工智能的紅利兌現(xiàn)絕不代表人工智能將替代人類。即使人工智能擁有了全世界的知識,但它不具備同理心、想象、感動、熱愛這些只有人類具備的特質(zhì)。
“我相信未來一定是屬于掌握了人工智能的新人類。用人工智能建設美好世界需要社會各界全方位的協(xié)同,這是一個偉大的歷史進程,需要我們共同攜手。”