健康有益:一張圖看懂AI與大數據
近幾年隨著AlphaGO的驕人戰績,人工智能和大數據備受追捧,熱度空前。而在實際接觸中,大家對人工智能和大數據的認知普遍是“只知其名不知其意”,因此對企業而言,獵頭的推薦也往往與崗位匹配度不高。那么被人們認為高深莫測的AI和大數據的關系究竟是怎樣的? 下圖清晰表達了其邏輯及關聯性。
上圖中主要是三大塊內容,分別是大數據,AI技術和解決問題,他們的關系如下:
- 大數據層 -
主要分為數據采集、數據存儲及數據訪問三個步驟。
Ø 數據采集
主要通過智能手環、智能手表、智能手機等各類智能硬件,重力傳感器、溫度傳感器、濕度傳感器等各類傳感器以及攝像頭、話筒等多種手段來采集各種所需數據。
Ø 數據存儲
主要是將采集數據存儲到數據庫中。大數據的存儲方式與傳統的數據存儲有很大不同。主要體現在存儲格式、存儲結構、以及分布式存儲等方面。而分布式存儲、共享存儲則是數據存儲中重要的核心技術。
Ø 數據訪問
主要解決如何讓AI技術層能夠快速的獲取所需數據。該層是大數據技術與AI技術的重要承接層,其最核心的技術為負載均衡。該技術解決了數據訪問中的大數據并發、網絡負荷過重等問題。
- AI技術層 -
分為基礎算法、AI算法、AI框架和AI技術四個步驟,目的是獲取數據之后,利用人工智能的算法和技術對數據進行分析。
Ø 基礎算法層
基礎算法層主要包含高等數學、矩陣分析、數值分析、概率統計分析等,是AI算法的奠基層。而AI算法來自于基礎算法的支撐。我們對基礎算法理解越深刻,對AI算法理解的也會更透徹。好像蓋大樓的地基,地基打的越深,大樓才能蓋的越高。
Ø AI算法層
AI算法層是在基礎算法層之上構建的解決人類問題的人工智能算法層。
人類遇到的問題通常是由單一問題合并組成的復雜問題,解決問題的路徑為將復雜問題拆解成多個單一問題后逐一進行解決。AI算法層即解決單一問題的通用方法層。比如拍照計算食物熱量實際上包含食物識別、體積計算、質量計算、熱量計算等四個子問題,而四個子問題則由各自組成的通用方法來解決。經過長達半個多世紀的發展,AI算法層已經研究出了一些通用方法即算法,包含分類算法、聚類算法、回歸算法、優化算法、降維算法、深度學習算法等等。
Ø AI框架層
AI框架主要是對AI算法層的單個算法進行重新封裝,它定義了很多類、方法、接口,使用者只需要調整相關參數即可實現算法,而不需要將算法完全實現出來,這樣節省了大量的時間,使得應用算法來解決問題的AI研發人員更加專注于解決問題本身。目前常見的分類、聚類等傳統的人工智能算法框架有SkLearn、Pandas等等,深度學習框架有Tensorflow、Caffe、Torch、PaddlePaddle。
Ø AI技術層
AI技術層主要是針對利用AI算法解決專業領域問題而提出的專用方法和算法。這種算法不具有通用性,是為解決某個領域的問題而定制研發的方法。目前AI技術主要包含自然語言處理(NLP)、機器視覺、語音識別、知識圖譜、數據挖掘、分析決策。大家耳熟能詳的技術都出自該層,也是AI技術層的最頂層。
² 自然語言處理(NLP)
自然語言處理領域主要是語義識別,開放域對話聊天,基于任務的對話,自動翻譯(例如中翻英,英翻中)等。
² 機器視覺
機器視覺主要分為圖像識別(識別圖像或視頻中的物體是什么),圖像跟蹤(視頻中跟蹤某個物體),三維重建(通過2D圖片進行3D物體的構建)。
² 語音識別
該技術通俗的講就是對人說的話轉化成文字。
² 知識圖譜
該技術是用來構建知識的網狀結構,將一個個看似沒有關系的知識點,通過該技術建立他們之間的關聯關系,比如包含關系、并列關系、最終構建各個領域的知識網。然后再根據這個知識網解決用戶的問答、推薦、預測、推理等問題。
² 數據挖掘
數據挖掘主要是對數據進行分類、聚類、預測等處理。
² 分析決策
主要是做策略制定,通過多維度收集的數據進行某個領域的決策并給出答案。
- 解決問題 -
基于大數據與AI技術的結合,能夠真正實現為人類解決各種各樣的問題。將這些問題進行歸類匯總成幾大類問題,常見的有聚類、分類、預測、推薦等問題。
Ø 分類問題
分類問題主要是判別某個物體屬于哪個類別,比如橘子屬于水果類、白菜屬于蔬菜類。分類又分為二分類、多分類問題;二分類即是與不是的問題,比如這個物體不是香蕉,這個物體是香蕉;多分類問題,比如多種食物,一種食物是蔬菜,一種食物是水果,一種食物是肉。
Ø 聚類問題
聚類問題主要是將一批數據自動分成幾類,比如說網站的用戶群,自動分為活躍用戶群、忠誠用戶群、沉默用戶群,這種用戶群的確定是通過人工智能算法算的,而不是通過人工篩選的。
Ø 預測問題
預測問題主要是對某個趨勢進行預測,比如房價趨勢預測、網站的流量預測等等。
Ø 推薦問題
推薦問題主要是推薦同類偏好。比如A用戶喜歡旅游,且是戶外愛好者,而戶外愛好者除了喜歡旅游,還喜歡戶外裝備,那就可以向A用戶推薦戶外裝備,這就是典型的網站推薦邏輯。
責任編輯:馬麗芳