要讓人類聽懂動物的語言,AI還需克服哪些難題?
對于寵物翻譯器的需求與肯定。
如果按斯洛波奇科夫教授所說的,這項技術(shù)能在十年內(nèi)成為現(xiàn)實,小范圍滿足的是人與寵物的交流溝通,大范圍可能是人類一統(tǒng)動物世界的溫和策略與夢想。
自動語音識別技術(shù)和語音翻譯技術(shù)助力,寵物情緒傳達不再是鏡中花、水中月
智能相對論發(fā)現(xiàn),低配版寵物翻譯器運用的技術(shù)原理就是對狗狗的叫聲、動作等生物信號進行采樣,對獲取的數(shù)據(jù)進行頻譜分析,對姿勢動作DSP運算數(shù)字化處理,把得到的翻譯語言以中文形式語音播報出來,但是由于采樣的范圍和機器內(nèi)存等的局限性,這種低配寵物翻譯器在翻譯的準確度和豐富性方面尚有待提高。
不過,現(xiàn)在也有了好消息,為實現(xiàn)人狗溝通而設(shè)計的“No More Woof”耳機就是其一。
“No More Woof“是由北歐發(fā)明與發(fā)現(xiàn)協(xié)會( NCID )開發(fā)的,應用的是三個不同技術(shù)領(lǐng)域的最新技術(shù)的組合,即腦電圖( EEG )傳感、微計算和專用腦-機接口(BCI)軟件,主要由腦電圖耳機、Raspberry Pi 處理器和一款便攜音箱組成。
這些傳感器是腦電圖記錄器,可以降低讀數(shù),減少離子電流在狗腦中的電壓波動。然后由微型計算機拾取波動,在這種情況下形成一個覆盆子pi,并對它們作出解釋。
例如,大腦中有一種特定的電信號來定義疲勞感,還有一些最容易被發(fā)現(xiàn)的神經(jīng)模式:“我餓了”,“我累了”,“我很好奇那是誰?”,“我想尿尿”……耳機中的傳感器會捕捉這種特殊的電信號,并將它們轉(zhuǎn)化為人們能夠聽懂的語言。
再結(jié)合基礎(chǔ)的自動語音識別技術(shù)和語音翻譯技術(shù),計算機算法可以大致地分辨出寵物的情緒,這是短時間內(nèi)寵物語言翻譯能達到的制高點,至于要通過寵物翻譯器來了解動物伙伴們真正的內(nèi)心世界,還期待人類進一步的大動作。
如要完成精確翻譯,還需要解決哪些問題
需要指出的是,動物的大腦并不如人類的大腦復雜,人腦的活動通常有一個明確的目標導向,動物的大腦卻不一定,人的各種語言之間的轉(zhuǎn)換也具有相對窄范圍的對應關(guān)系,而動物的語言與人類的語言則對應范圍很寬。
比如,狗會發(fā)出急促的叫聲,可能是因為想要向主人乞食,也可能是因為警惕陌生人,還可能是對主人不陪自己玩的責怪。如果它想表達的是這一種,而AI的翻譯器卻傳達為另一種,那么就容易將人和寵物之間的溝通引入“歧途”,從而完全喪失了寵語翻譯的意義了。
那么有沒有可能通過AI實現(xiàn)完全精準的寵物語言翻譯呢?目前來說還有一定難度,在智能相對論看來,AI在寵物語言翻譯上如要突破,就還得克服這些:
1. 數(shù)據(jù)關(guān),要明確動物語言所表達的具體意義,需要先對動物的叫聲和即時腦電波動進行完整的采樣比對,再在這些數(shù)據(jù)的基礎(chǔ)上建立數(shù)據(jù)庫。
而這兩種數(shù)據(jù)都存在著廣泛性和多樣性,以犬類為例,不同的犬種聲帶粗細寬窄各不相同,針對同一情景發(fā)出的叫聲分貝高低和尖細情況也不同,而刺激犬類發(fā)出叫聲的場景又是難以窮盡的,單單收集犬類的聲音樣本就是一個無比巨大的工程了,數(shù)據(jù)庫自然也難以完善。
2. 技術(shù)關(guān),一個AI翻譯產(chǎn)品做到翻譯精確至少需要攻破幾個難題:形式端,拍譯要攻克圖像識別,同聲翻譯要攻克語音識別:內(nèi)容端,攻克文本語言分析、大數(shù)據(jù)。而AI還沒有發(fā)展到能夠極為精確地處理這些問題的階段,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷。
如搜狗搜索在2017年6月的分享會上發(fā)布了創(chuàng)新產(chǎn)品搜狗翻譯APP,應用了基于生物學習的神經(jīng)網(wǎng)絡機器翻譯(NMT)系統(tǒng),將翻譯精確度提升到一個前所未有的高水準,然而在翻譯效果的“信達雅”上,仍然只做到了“信” 的層面,對語言背后的幽默、情感等豐富含義的解讀離人們所期待的水準還有些距離。
3.語義關(guān),語料積累、場景收集和副語言與文化背景成痛癢之地。AI翻譯在文本或語言的寓意分析方面還強差人意。與人類語言相比,動物語言都是即時信號,信息內(nèi)容全部關(guān)于當下,或示威,或示警,或示愛……從中看不到用語言來激起對過去的聯(lián)想的跡象,并且單個個體能發(fā)出的聲音形式太單一了,蘊含在其中的豐富信息難以明確表達。
寵物翻譯的難點不僅在于聲音的收集,更在于聲音背后具體含義的對應。
這種對應是寬范圍的,難以精確的,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷,無法精確理解語音所表達的內(nèi)涵,甚至在這個方面還比不上人類對動物語言的理解,人可以根據(jù)生活經(jīng)驗來理解動物語言,比如看到狗狗沖著陌生人吠叫,人們可以推測它是在防備這個陌生人,而機器可能就沒辦法很好地理解這個畫面,從而做出錯誤的判斷。
4. “歷史包袱”,AI難以跟上生命體的學習進程。狗的叫聲在一定歷史時期并不是一成不變的,狗憑借自身的靈性以及主人的后天馴養(yǎng),具備有學習能力,例如狗類中智商排名第一的邊境牧羊犬智力水平已經(jīng)相當于6—8歲的小孩,經(jīng)過學習,在放牧時它會用不同的叫聲來驅(qū)使羊群,控制羊群走向。
還有一些寵物狗,甚至會在人類的刻意訓練下發(fā)出類似“媽媽”的叫聲,寵物語言在日新月異的變化,計算機卻很難抖掉語言的“歷史包袱”,這些也造成了AI寵物翻譯的困境。
總之,AI所能做的,是不斷改進自身的功能,用科學手段完善數(shù)據(jù)庫、內(nèi)容、語料和場景,形式和內(nèi)容雙管齊下,在堅實的地基上建立起實現(xiàn)人和動物“有效溝通”的“巴別塔”。

責任編輯:任我行
- 相關(guān)閱讀
- 碳交易
- 節(jié)能環(huán)保
- 電力法律
- 電力金融
- 綠色電力證書
-
碳中和戰(zhàn)略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
國家發(fā)改委、國家能源局:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè)
-
碳中和戰(zhàn)略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監(jiān)管與當量協(xié)同的碳市場框架設(shè)計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉(zhuǎn)型與經(jīng)濟發(fā)展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
國家發(fā)改委、國家能源局:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
2020年二季度福建省統(tǒng)調(diào)燃煤電廠節(jié)能減排信息披露
2020-07-21火電環(huán)保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規(guī)范法律問題研究(上)
2019-10-31能源替代規(guī)范法律 -
區(qū)域鏈結(jié)構(gòu)對于數(shù)據(jù)中心有什么影響?這個影響是好是壞呢!