2018年,你應該關注的全球十大開源AI項目
近年來,人工智能(AI)與機器學習可謂不絕于耳。根據IDC公司2017年9月發布的預測,2017年全球在認知與人工智能解決方案領域的支出總額約為120億美元。到2021年,這一總和可能將以50.1%的復合年增長率提升,意味著屆時市場將迎來高達576億美元。
在2018年的預測當中,Forrester Research公司預計新的一年內,“AI將重塑分析與業務創新的面貌”,且“AI將在兩成企業中承擔起制定決策與提供實時指令的職能”。不過該公司同時提醒稱,“2018年也將成為CIO們意識到要發揮AI這類新技術的潛能,必須投入巨大努力的一年。”
2018年,你最應該跟蹤的全球十大開源AI項目
對于多數企業而言,其中最艱苦的工作在于首先掌握機器學習與人工智能框架。根據Gartner公司的觀點,“59%的企業仍在努力收集信息以構建其人工智能戰略。”
其中大部分信息收集工作可能都將圍繞著開源解決方案展開。多種領先的人工智能工具都可立足開源許可下獲取,而大量尖端研究與開發工作也正基于這些開源項目進行。
那么,企業IT管理者們應該研究哪些開源AI解決方案呢?今天的文章將著重介紹十種最具人氣的開源AI與機器學習工具。
1. TensorFlow
2018年,你最應該跟蹤的全球十大開源AI項目
由谷歌公司打造的TensorFlow已經成為當前使用范圍最廣的機器學習框架之一。該項目的GitHub(一個面向開源及私有軟件項目的托管平臺)頁面擁有87700顆星評,fork(計算機程序設計中的分叉函數)數量超過42700次。2017年發布的GitHub Octoverse報告指出,TensorFlow這款開源AI工具擁有數量最高的fork,貢獻者數量位列第五,評論數量排名第十。其能夠很好地適應基于云的應用程序,且目前Amazon Web Services、微軟Auzre以及Google Cloud Platform都為其提供支持及/或服務。根據項目網站,其企業客戶包括愛彼迎、英偉達、優步、SAP、Dropbox、eBay、谷歌、英特爾、可口可樂以及Twitter等等。
2. Scikit-Learn
2018年,你最應該跟蹤的全球十大開源AI項目
基于其它三個開源項目(NumPy、SciPy以及matplotlibe)的Scikit-learn是一款基于Python的機器學習工具,主要強調數據挖掘與數據分析。其提供多種算法以實現分類、回歸、聚類、降維、模型選擇以及預處理等等。其用戶包括Spotify、Evernote、OKCupid以及Change.org等等。其最初屬于谷歌Summer of Code項目,并在隨后的發展當中得到了多個組織機構的資助——具體包括INRIA、Paris-Saclay數據科學中心、紐約大學、Télécom Paristech、哥倫比亞大學、Alfred P. Sloan基金會與悉尼大學等。該項目在GitHub上擁有超過25300顆星評與超過12900次fork。
3. Caffe
2018年,你最應該跟蹤的全球十大開源AI項目
Caffe誕生于Yangqing Jia手中,在開發此項目時其尚在加州大學伯克利分校攻讀博士學位。伯克利大學AI研究(簡稱BAIR)部門目前正負責該項目的開發工作。項目網站指出,其屬于“以表達、速度與容模為基礎的深度學習框架。”其主要功能包括表現性架構、可擴展代碼、出色的性能表現以及龐大的學術與行業用戶禰。在GitHub上,該項目擁有22600多顆星評與超過13800次fork。
4. 微軟Cognitive Toolkit
2018年,你最應該跟蹤的全球十大開源AI項目
微軟Cognitive Toolkit(原名為CNTK)將自身描述為一款“免費、易于使用的開源商業級工具包,可用于訓練深度學習算法以通過類似于人腦的方式實現學習。”這套AI解決方案由微軟公司內部開發完成,并于2016年以開源許可形式進行發布。該工具的主要特征包括支持Python、C++以及BrainScript; 支持強化學習、生成對抗網絡以及有監督與無監督學習; 高效的資源利用能力; 與NumPy間的互操作性; 且可與微軟Azure相集成。此項目在GitHub上擁有超過13700顆星評與3600多次fork。
5. PredictionIO
2018年,你最應該跟蹤的全球十大開源AI項目
作為Apache項目,PredictionIO是一款開源機器學習服務器,并能夠利用Hadoop、HBase以及Spark等多種其它Apache大數據工具。企業經常利用它來實現lambda架構,其官方網站還提供一整套全面的機器學習堆棧,其中囊括Apache Spark、MLlib、HBase、Spray以及ELasticsearch。該項目的目標在于幫助數據科學家與開發者們快速創建預測引擎,并將其以Web服務的形式進行部署。此項目的GitHub頁面顯示,其擁有超過10900顆星評以及超過1777次fork。
6. Deeplearn.js
2018年,你最應該跟蹤的全球十大開源AI項目
顧名思義,deeplearn.js是一套面向深度學習的JavaScript庫。其允許用戶在瀏覽器當中訓練神經網絡。與本份清單中提到的其它幾款開源AI項目一樣,它同樣源自谷歌Brain小組之后,且谷歌公司一直在為該項目的發展提供助力。Deeplearn.js當中包含兩個獨立API:一個負責實現與NumPy類似的急切執行模式,另一個則提供類似于TensorFlow的延遲執行模式。在GitHub上,該項目擁有6000多顆星評與超過550次fork。
7. Pattern
2018年,你最應該跟蹤的全球十大開源AI項目
Pattern由安特衛普大學計算語言學與心理語言學(簡稱CLiPS)研究中心所打造。其提供多種人工智能功能,具體包括數據挖掘、自然語言處理、機器學習、網絡分析以及可視化。其基于Python,且捆綁有50多個示例與350多項單元測試。GitHub用戶為其給出了超過6000個星評,fork次數亦超過1100次。
8. Turi Create
2018年,你最應該跟蹤的全球十大開源AI項目
Turi Create允許非技術專家創建屬于自己的機器學習模型,且無需編寫大量代碼。其適用于創建推薦引擎、圖像分析工具以及文本分類引擎,且提供多種算法以實現分類、回歸、圖形分析、聚類、最近鄰、主題模式等等。盡管剛剛由蘋果公司發布在GitHub上(2017年12月),但其仍然快速吸引到人們的關注,目前擁有超過5700顆星評以及490多次fork。
9. Aerosolve
2018年,你最應該跟蹤的全球十大開源AI項目
由愛彼迎創建的Aerosolve是一款人工智能工具,特別擅長處理地理數據。之所以聲名大噪,是因為其擁有“人性化”的設計思路。其主要功能包括基于資源節約理念的特征表達、特征轉換語言、可調試模型、Java與Scala支持以及圖像內容分析代碼。在GitHub頁面中,該項目擁有超過4200顆星評與550多次fork。
10. DSSTNE
2018年,你最應該跟蹤的全球十大開源AI項目
由Amazon公司打造的DSSTNE(發音為‘Destiny’)代表著“深層可擴展稀疏張量網絡引擎”。網絡購物巨頭利用它來創建自己的推薦引擎,但其出色的能力也引起了其它零售商與在線企業的關注。根據開發人員所言,其在機器學習訓練數據稀缺類用例當中發揮著巨大的作用。在GitHub上,該項目擁有4000多顆星評與超過660次fork。
責任編輯:任我行
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!