賈磊:百度語音開放降低移動互聯開發者門檻
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以軟件引領信息消費,助力經濟轉型升級為主題,充分展示軟件業在促進信息消費、提高百姓生活質量、提升社會各行各業信息化水平等方面的
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以“軟件引領信息消費,助力經濟轉型升級”為主題,充分展示軟件業在促進信息消費、提高百姓生活質量、提升社會各行各業信息化水平等方面的最新成果。百度語音首席研究員賈磊做了題為《開放的百度語音云》的主題演講。
百度語音首席研究員 賈磊
以下是演講實錄:
各位來賓大家好,感謝組委會給我這個機會給大家匯報一下開放云相關的工作。百度近期有一系列技術上舉措,我們在國外聘請了專家來到百度,對外開放了一系列的技術,百度開放技術的目的是什么?大家使用百度開放技術的時候還不放心,在PC時代技術相對成熟,人們做一個網站運營相關的網站成本是比較低的,但是移動時代開發者面對移動互聯開發瓶頸做一個應用,壓力是很大的,百度幫助開發者更好建立自己的應用,建立自己的APP,和生態環境,讓所有開發者都行動起來。我們也希望開發者通過百度的技術開發自己的應用,最終實現生態轉移。百度語音開放是降低移動互聯時代開發者的門檻,我們開發是語音識別技術,這個語音識別技術是簡單的識別過程,我們首先有自己的語音識別系統,大家用我們客戶端軟件或者直接傳語音到服務器,我們針對手機廠商和汽車廠商,只要大家去百度申請就能免費拿到我們做語音識別所有的技術。
同時,我們還開放了個體定制化語音識別需求,我們幫助大家做自己的應用,大家可以上傳自己的語義語法要求,在后臺定制自己的語音識別器,從而實現完全無縫連接和捆綁,在開放語音識別技術之后,我們又開放了自己的語音合成技術,嵌入式HTS語音合成系統,高保真的合成,在互聯網模式下合成語音,幫助大家開發自己的互聯網應用。在語音識別背后我們開放了百度語音文件技術,有多達35類的語義需求都可以得到滿足。同時我們開放了語義理解,這些資源會隨著整個過程對開發者展開。首先我介紹百度語音識別開放,我們強調是場景化識別和自選語言模型,我們開放的長文本,短熱詞,交互式對話垂直領域識別技術,語音糾錯技術,我們從金融、醫療、衛生逼我們互聯網在文本時代積累的文本處理技術都進行定制化選擇,用戶使用我們語音識別選擇自己的語音領域,如果在現有開放領域找不到適合自己的領域,用戶可以定制化自己的語音識別。
下面我簡單介紹一下我們語音識別技術,百度采用的是數萬小時聲學訓練語料,百度搜索引擎技術積累的海量文本語料,線上語言模型體積100G,使語音識別更適合應用,我們還有聽覺感知DNN聲學建模技術,更高的識別率。最后我們有高速的解碼技術,使我們語音識別技術達到國際先進水平。
這里對技術講起來很枯燥,首先我們有SDK,我們在網上放SDK,可以做很微量的工作就可以實現自己移動的APP在安卓上進行語音識別,自己的開發量只要按照我們工作手冊去操作,很容易讓APP都具備識別的能力,最終實現高精準的語音識別。用戶定制化識別也是我們的特長,用戶可以上傳自己的語料,實現最精準的語音識別。
我介紹一下我們語音合成開放,我們能實現任意文本的語音播報。這個過程其實可以直接連我們語音合成的語音服務,我們把你們通篇上傳的文字轉化為語音,高保真,而且清晰自然。我們的拼接合成技術也對外發布了,這里不再贅述。我們嵌入式語音識別技術也會對外開放,在你們移動產品中嵌入百度的語音何澄功能,任何時間任何地方都可以實現文本的播報。語音合成我們支持安卓和IOS兩個平臺,我們支持多種音頻編碼滿足大家的需要。
百度的語義理解我們在互聯網上支持語義的結構化的數據,大家會拿到一個語義的解析內容,跟我們后臺的模塊是配合的,這樣我們支持35個垂直領域定制化解析,平均準確率都超過85%以上。我們針對用戶主要場合,文化場合做很多的解釋,如果有方言表達的文體不一定能夠準確解釋的情況下,用戶可以定制化自己的語義解析,改善語義理解。目前百度后臺資源跟語義理解模塊是對應的,我們從時間結果,語義理解,然后返回語音解析內容。我們多個對話功能也在網上進行開放,大家在語音識別過程,不是單純一個名詞中轉換,我們還支持多個名詞之間的邏輯關聯,我們給“去哪兒”的經典語音交互案例,語音識別語義理解深度定制。最后我們介紹一下百度的資源優勢,我們集成了百度所有產品和服務,搜索、地圖、音樂、百科在后臺都是開放的,把文字轉化為聲音的播報功能而且還能拿到后臺的資源,都對大家敞開,進行免費服務。我們開放的有三級權限,第一是語音識別、語音合成。這是為了滿足開發者只是要用語音識別功能,不需要太多資源。我們直接得到了語音識別和語音合成的能力,這個能力又分為聯網和不聯網,如果不聯網,大家在百度注冊平臺注冊申請就可以了。在二級權限中,我們除了開放語音識別和語義合成以外,最重要的是語義理解,大家根據自己應用的要求,定制自己理解的定制化語義解析。后臺大家有多自己的服務,不一定用百度資源和服務,比如你們開放數字電視,大家說我想看什么電視頻道,用戶可以切換到自己的電視頻道。在三級權限中我們把百度后臺的資源都對大家開放,中小開發者說我做一個查詢,周邊的查詢,我的核心要點是查飯店,有的用戶查周圍的咖啡屋,我看到飯店跟咖啡屋是關聯的我們百度后臺是支持的,大家可以訪問百度后臺的資源。我們把三級開放抽象為這樣的圖,我們身份識別、語音喚醒,打造不一樣的人機交互。語義理解,我們主要設置的是你說,我想!理解用戶意圖,完成需求分發,整合系統資源。我們還有一些重磅產品介紹,我們跟很多公司,有的是互聯網公司,有的是IT公司進行合作,向他們提供我們語音識別能力和解決方案等等。
后面我宣傳一下我們語音開放的聯系方式,我們有新浪官方微博,大家搜索百度語音就能找到我們所有的服務,我們還有騰訊QQ群,大家可以對自己的問題尋求我們的解答。我們百度內部的聊天方式廣大用戶不太熟悉,所有的技術問題是有技術人員實時解答的,主流的媒體頻道了解到我們內部的hi群,都是我們技術人員在線為大家解答問題。最后是我非常感謝大家有機會花時間來聽我的報告,很感謝大家!謝謝大家!
責任編輯:葉雨田
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
杜祥琬:創新觀念,推動能源高質量發展
2020-09-28能源,創新,觀點
-
PPT丨王繼業:電力系統儲能發展與挑戰
2020-10-14儲能,電力儲能,儲能應用 -
奮斗姿態書寫人生底色 銀隆儲能“小哥哥”的職場進擊姿勢
2020-10-12銀隆新能源,儲能,新能源汽車 -
鄒驥:通過發展清潔能源 提高中國公信力
2020-06-28鄒驥,清潔能源,綠色低碳能源
-
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備 -
重磅 | 發改委發文7月起電價降5%
2020-06-29國家發改委,企業,用電成本,電費 -
李克強:放寬配售電業務市場準入 推動建立市場決定能源價格機制
2019-10-12配售電業務市場準入