首頁>>廠商>>語音識別與合成>>得意音通

得十分利予人七分 得意傾心產業(yè)聯(lián)盟

2004/07/01

核心技術產業(yè)化

  "我們現(xiàn)在正在尋找合適的合作伙伴。"北京得意音通技術有限責任公司市場副總裁鄧永強說。雖然公司員工不多,但鄧永強對公司技術實力頗感自信。得意公司的技術以及管理團隊來自清華大學、美國南加州大學等著名學府,有著深厚的技術積累。

  得意公司成立于2002年4月,公司定位為"語音與語言技術開發(fā)商和技術提供商"。得意公司擁有語音識別、聲紋識別和自然語言理解三大領域的核心技術。這幾項技術屬于人工智能范疇,是中文信息處理的重要分支。

  與之相對應的是,目前國內進行相關技術研究的科研機構屈指可數(shù),而得意公司是惟一在以上三大領域都具備完全自主知識產權,而且在商業(yè)化取得成功的企業(yè)。

  有關領域被公認為未來的朝陽產業(yè),比爾·蓋茨說過:"人類計算的未來是讓計算機能夠看、聽、學,能用自然語言與人類進行交流。"IBM、微軟等IT巨頭都投入重金強將進行研究開發(fā)。但是語音與語言技術難度大、投入高,比如連續(xù)語音識別,雖然國內外很多研究機構和商業(yè)公司已經投入了大量的精力和資源,目前技術上仍不夠成熟。

  可喜的是,得意公司經過兩年多的艱苦創(chuàng)業(yè),技術取得了很多進展,市場得到了很好的開拓,其成熟度達到了商用化的要求。鄧永強向記者介紹,得意公司的聲紋識別技術和產品,可以為公安、國防等高端領域服務,也可以在民用領域大有作為。

  聲紋識別技術屬于生物識別技術的一種,是一項根據語音波形中所蘊涵的說話人信息,自動識別說話人身份的技術。公安系統(tǒng)在調查某些人時,可以把他的聲音與聲音庫中的樣本進行對比而確認其身份;同樣,聲紋加密鎖、門禁系統(tǒng)、電話/網絡身份認證系統(tǒng)等民品中也可以通過聲音進行身份確認?梢哉f,現(xiàn)代社會無處不在的身份驗證、加密鎖等設備中,都有聲紋識別的用武之地。

  鄧永強介紹,得意公司在國際上首創(chuàng)的"聲紋加密鎖",即利用了聲紋識別技術,實現(xiàn)了更方便和更安全的身份認證。在演示中記者看到,只要合法用戶對著話筒說大約2秒到4秒的任何語言、任何話語,經聲紋識別確認無誤后,電腦就會把管理權交給該用戶,而其他人則無法訪問經過加密的電腦文件。

  據得意公司技術人員介紹,聲紋識別技術分為兩類,即聲紋辨認和聲紋確認。其中,聲紋辨認(又稱說話人辨認)技術用于判斷某段語音是若干人中的哪一個所說的,是"多選一"問題;聲紋確認(又稱說話人確認)用以確認某段語音是否為指定的某個人所說的,是"一對一判別"問題。即使用錄音機等設備錄制的原聲,都不會被系統(tǒng)確認通過,因為在錄制以及播放過程中,這些發(fā)音經過了與訓練時不一致的信道轉換,因此能被系統(tǒng)安全可靠地鑒別出來是真人發(fā)音還是錄音重放;谶@個特性,可以保證只有當事人才能打開聲紋加密鎖,確保了安全性。

  鄧永強告訴記者,目前得意公司的聲紋識別技術已經被應用于很多領域和一些重要客戶,為公司帶來了良好的收益。得意公司希望這一技術能更加廣泛地應用和推廣,迅速形成產業(yè)規(guī)模。

做好產業(yè)鏈的最上游

  鄧永強認為,聲紋識別技術要實現(xiàn)更大規(guī)模的產業(yè)化,提供更多樣化的產品形態(tài)、為更多領域服務的工作很重要,比如研發(fā)和生產嵌入式系統(tǒng)或者芯片。嵌入式產品適用范圍更廣泛,包括手機、門禁、汽車、取款機甚至智能式信用卡等需要身份認證的設備和場合。實現(xiàn)了嵌入式系統(tǒng)和芯片的開發(fā),在給別人打開方便安全的大門同時,也打開了得意公司走向財富的大門。

  但鄧永強也同樣知道,要把聲紋識別技術移植到嵌入式系統(tǒng)和芯片中,得意公司不但需要資金支持,還需要與有相關經驗和有獨特眼光與遠見的廠商合作。

  "園區(qū)的所有優(yōu)惠政策,我們基本都享受到了,并得到了不少的資金支持。"鄧永強說。但對于一個技術研發(fā)型的企業(yè)來說,這些資金以及優(yōu)惠遠遠不夠。得意公司是一個快速發(fā)展的企業(yè),與中關村所有有著良好的技術背景的研發(fā)企業(yè)一樣,得意公司也面臨著共同的問題:高速發(fā)展的期望與資金緊張的現(xiàn)實之間的矛盾。

  對于得意公司來說,它迫切需要能夠實現(xiàn)技術產業(yè)化的合作伙伴,得意公司有成型的技術產品,希望與有實力的合作伙伴一起,構造上下游分工合理、利益共享的產業(yè)關系,打造現(xiàn)代產業(yè)鏈,分工協(xié)作,把技術產品大規(guī)模地應用到海內外市場。而一些新型系統(tǒng)集成商正好可以完成這個工作--把得意公司的技術整合在整個系統(tǒng)中,進行進一步的應用開發(fā)。但可惜的是,雖然系統(tǒng)集成商自救的呼聲漸高,但目前國內的大部分系統(tǒng)集成商們仍然在簡單地重復搬箱子、裝電腦的工作,技術能力的增長,特別是產業(yè)理念的更新,不是短時間之內就能實現(xiàn)的。

  得意音通的另一項技術--自然語言理解技術已經初步形成了產業(yè)鏈,進入良性循環(huán)。自然語言理解是把文字轉化為語義的過程,該應用最常見的例子就是智能聊天機器人。得意公司與電信系統(tǒng)集成商深圳傲天的合作,實現(xiàn)了智能短信服務系統(tǒng),應用于中國移動、中國聯(lián)通等電信運營商網絡平臺。這個系統(tǒng)加入相關的資料數(shù)據,即可方便、智能地實現(xiàn)該領域智能短信服務,比如添入商家數(shù)據庫,它就可以完成黃頁智能查詢功能;而加入城市生活數(shù)據庫,它就可以完成餐飲推薦、交通路線、生活指南等多種實用功能。

  得意公司的自我定位是研發(fā)型的技術企業(yè),不會進行終端產品和應用的開發(fā),而只是向合作伙伴提供技術。因此,在整個產業(yè)鏈中,得意公司處于最頂端。

  當然,對于融資或者合作伙伴的選擇,鄧永強也有著自己的想法和理解。

  "在語音技術領域,我們自己不開發(fā)語音合成。"鄧永強說。語音識別與語音合成相輔相成,因此,鄧永強認為這兩種技術應該互相合作,共同培育市場蛋糕。

  "得十分利,予人七分",這是道家的境界。與小而全的中關村許多中小企業(yè)相比,得意公司選擇了集中精力,做好上游的技術提供商。給整個產業(yè)鏈讓出七分利,才能獲得最好的合作伙伴,這一理念,是眾多企業(yè)所需要思考的。

得意音通公司供稿 原文刊登于《中關村周刊》



相關鏈接:
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20
北京軟件產品質量檢測檢驗中心對《海量語音文件的目標說話人篩選系統(tǒng)》進行測試 2009-06-25
廣東政府和清華大學舉行了全面開展產學研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術_語音合成_新聞   技術_語音識別_新聞