【導語】讓機器擁有人類的思考能力,讓智能語音命令更加順暢,讓機器更智能地人類提供服務是智能語音的目標,然而要賦予機器以上功能必須制作一款可以深度模擬人類大腦的計算機軟件模型。近日,浪潮和國內某知名公司合作,通過GPU加速方案實現了該模型的運算效率的提升,使其能更接近人腦的運算能耗比,從而為該公司的智能語音技術帶來突破。
智能和互聯(lián)如今是科技產業(yè)的熱點“名詞”,很多專家都認為智能語音識別技術是未來10年間信息技術領域十大重要的科技發(fā)展技術之一,只有在電影中才有的、擁有語言天賦的機器將在不久的未來變成現實,智能語音技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產品等各個領域。
IT巨頭的難題,人腦能耗比=200萬倍天河2號
智能語音目前主要依靠深度學習的技術實現,作為機器學習的一個重要分支,深度學習在于建立、模擬人腦進行分析學習的神經網絡,使得機器能從大量歷史數據中學習規(guī)律,從而對新的樣本做智能識別或對未來做預測,以達到具有人類一樣的思考能力。目前,Facebook、Google、IBM、蘋果、微軟、百度、科大訊飛等均在此方面做了多種嘗試。
深度學習技術有很多支撐的計算機算法,而目前最常用的是DNN算法,它能比較好地模擬人腦神經元多層深度傳遞的過程,解決智能語音中的復雜問題。然而,要模擬人腦絕非易事,人腦的計算能耗比是世界上最快的超級計算機天河2號的200萬倍,眾所周知,人類大腦大致有1000億神經元,每個神經元有大約5000個神經突觸。要使機器無限接近人類的思考能力意味著要模擬出更多的神經元和神經突觸,這就會帶來巨大的計算挑戰(zhàn)。
迎難而上,某公司宣布要初步實現人類思考能力
即使世界IT巨頭都無法徹底解決這一問題,但是某公司依舊宣布要實現基于類人神經網絡的認知智能引擎,預期成果是實現世界上第一個中文認知智能計算引擎。目前,該公司已經集結了在認知智能領域最強研究團隊,將在知識圖譜構建與推理、人工神經網絡模擬、人腦原理分析模擬幾個方向展開研究。為了搶占國內智能語音市場先機,某公司計劃將模擬人腦神經元的1/10,以期讓該公司的智能語音設備擁有初步的人類思考能力。
巧婦能為無米之炊,浪潮巧用GPU實現性能騰飛
要實現人腦神經元的1/10的深度模擬,這也就意味著該公司需要非常高計算性能的高性能計算集群。然而天河二號只有一部,如何設計一套占地面積小、計算性能高、又綠色節(jié)能的高性能計算集群成為該公司面臨的問題。
針對這一問題,浪潮和該公司合作,利用GPU加速技術為該公司設計構建了一套GPU集群,雙方聯(lián)合設計了針對DNN算法特點的GPU集群并行計算框架,采用了每個計算節(jié)點配置雙路CPU和4塊NVIDIA Tesla K20m GPU,以及一塊HCA卡的方案,通過GPU提高計算能力、通過IB網絡提速節(jié)點之間的通信速度,最終完成GPU集群版的DNN并行算法,大幅減低了DNN的計算時間,從而為該公司下一步的智能語音計劃提供助力。
作為中國異構高性能計算技術的領先者,浪潮一直致力于推動GPU和MIC的應用發(fā)展和人才培養(yǎng),推動異構技術的產業(yè)生態(tài)環(huán)境建設。目前,浪潮已經分別與英特爾和英偉達成立聯(lián)合并行計算實驗室,合作開發(fā)優(yōu)化基于MIC和GPU的并行應用。浪潮-英特爾中國并行計算聯(lián)合實驗室首席工程師張清介紹:“浪潮目前已經建立了一套非常完善的高性能計算集群解決方案,將不僅為用戶提供好用的高性能計算集群,還會針對每一個用戶的應用特點量身定制集群解決方案,這也就說明未來浪潮將跟用戶在應用測試、集群搭建、加速優(yōu)化等各方面展開合作,把用戶的需求看作是浪潮設計構建集群的根本要求。”