www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

讓FPGA替代GPU,你會有怎樣的顧慮?

2018-01-23 10:09:24 e-works   點擊量: 評論 (0)
這幾天,已經退役的AlphaGo又強行刷了一波頭條,不是又跟哪位世界高手對決,而是新狗通過無監督式學習,僅用3天時間就戰勝了李世石版的
  

   顧慮二:FPGA的計算性能能不能滿足我的需求?
    與CPU和GPU不同,FPGA是一種典型的非諾依曼架構,是硬件適配軟件的模式,它能夠根據系統資源和算法特征靈活的調整并行度,達到最優的適配,因此能效比高于CPU和GPU。
    以浪潮F10A為例,這是目前業界支持OpenCL的最高密度最高性能的FPGA加速設備,基于Altera的Arria10芯片,單芯片峰值運算能力達到了1.5TFlops,功耗卻只需35W,每瓦特性能達到42GFlops。同時,F10A設計為高密度的半高半長PCI-E插卡,同時具有靈活的板卡內存配置,最大支持32G雙通道內存,是業內同等FPGA卡內存容量的4-8倍。此外,F10A支持2個10Gb光口,可以實現數據直接從網絡到板卡處理,無需經過CPU,大大減低了傳輸延時。
    測試數據顯示,在語音識別應用下,浪潮F10A較CPU性能加速2.87倍,而功耗相當于CPU的15.7%,性能功耗比提升18倍。
    顧慮三:FPGA的開發周期得1年以上吧,這不能滿足我的業務上線需求?
    傳統的FPGA的開發類似于芯片的開發,采用硬件描述語言(HDL)開發,HDL開發帶來的問題就會像芯片設計一樣周期會比較長,從架構設計、到仿真驗證、再到最終完成,需要一年左右的開發時間。
    但是互聯網的業務迭代速度極快,在幾個月時間內就可能完成龐大用戶群的積累,因此業務對于數據中心的要求是“快”—計算力平臺的升級要盡量快地滿足業務的發展,因此FPGA的傳統開發模式動輒以半年或年為單位的開發周期難以滿足需求。
    為此浪潮嘗試通過OpenCL高級語言開發方式,它把底層的硬件如總線、IO接口、訪存控制器等和底層軟件如驅動、函數調用等全部封裝,變成標準單元提供上層支持,用戶只需要關注算法本身,OpenCL開發的邏輯通過編譯工具直接映射到FPGA中,開發周期從至少1年縮短至4個月以內。
    顧慮四:對于O經驗的公司,怎樣快速上線FPGA應用?
    或許你還是有些顧慮,即時開發效率大幅提升、開發周期大大縮短,但是對于技術和團隊儲備不足的中小型AI企業來說,FPGA仍是“高不可攀”的AI加速部件。如果,有一種方案能夠將軟件、算法和硬件板卡整合,以軟硬一體化的形式,提供FaaS(FPGAasaService)服務。你還有什么顧慮么?
    目前,浪潮正在針對市場上需求最迫切的幾種應用場景進行算法的移植開發,在圖像壓縮、文本數據壓縮及神經網絡加速等應用開發出業界領先的IP,省去客戶的算法開發周期,最小化FPGA落地門檻、最大化FPGA落地效率。
    神經網絡加速方案:基于浪潮F10A的AI線上推理加速方案,針對CNN卷積神經網絡的相關算法進行優化和固化,可加速ResNet等神經網絡,能夠應用于圖片分類、對象檢測和人臉識別等應用場景。
    實測數據顯示,在進行ResNet殘差網絡的圖片識別分類任務時,浪潮F10A加速方案圖片處理速度可達每秒742張,Top-5識別準確率達到99.6%,相比同檔次GPU能效比提升3倍以上。而與通用CPU對比,在處理這種高并行、小計算量的任務時,F10A的優勢將更明顯。
    WebP圖片轉碼壓縮加速方案:針對圖片數據的壓縮應用,嵌入基于FPGA計算環境下的WebP編解碼優化算法,通過充分利用硬件流水設計和任務級并行,大大提升WebP圖像壓縮編碼算法的處理性能,能夠實現JPEG-WebP圖片格式的快速轉換,比傳統實現方式的整體處理效率平均高9.13倍左右,最高性能可比CPU提高14倍。
    數據壓縮加速方案:為解決傳統壓縮架構的弊端,浪潮GZip算法加速方案充分利用板卡硬件流水設計和任務級并行,大幅提升了壓縮任務的吞吐量并有效降低CPU的負載,壓縮率(壓縮率=1-壓縮后文件/壓縮前文件)最高可達94.8%,壓縮速度達到1.2GB/s,10倍于傳統方案的壓縮效率。
    顧慮五:我是做云的,FPGA咋管理?支持虛擬機么?
    FaaS不僅僅是指板卡與軟件算法的一體化服務,同時還可以支持公有云及在線遠程管理和更新。浪潮FPGA解決方案能夠支持動態邏輯的在線可重構、靜態邏輯的遠程更新,并且通過優化的監控管理機制,提升板卡遠程監控管理的可靠性,通過它們可以實時的監控FPGA芯片的溫度、板卡風扇轉速、板卡內存特性等從而調整FPGA的工作頻率。
    同時浪潮FPGA也支持虛擬機的直接訪問,板卡本身也加入了很多RAS(可靠性、可用性、可擴展性)特性,如高可靠內存訪問等,支持并行(FPP)和串行(AS)雙加載模式,任何一種模式加載出現故障,都可以快速切換到另一種模式加載,保證了板卡大規模服務的可用性。
    有了這些特性,就可以利用浪潮FPGA方案,快速搭建FPGA云所需要的基礎底層計算平臺,不論是對外提供公有云服務,還是對內實現FPGA計算力快速分配都能夠既高效又可靠。
 

大云網官方微信售電那點事兒

責任編輯:任我行

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 中文一区二区在线观看 | 国产猛烈无遮掩视频免费网站男女 | 在线 中文字幕 日韩 欧美 | 伊人短视频 | 欧美成人黄色 | 一区二区三区视频免费观看 | 久久精品国产99久久99久久久 | 久久久久久久久久久久福利 | 国产成年女一区二区三区 | 日韩午夜在线视频不卡片 | 女高中生被cao到哭视频 | fc2ppv在线播放 | 欧美与黑人午夜性猛交久久久 | 欧美色综合高清视频在线 | 欧美毛片性视频区 | 成人国产精品免费网站 | 亚洲欧美日韩国产精品一区 | 高清一级淫片a级中文字幕 高清一区二区 | 国产精品免费一区二区三区 | 日韩美女一区 | 美女一级毛片 | 精品久久香蕉国产线看观看亚洲 | 精品综合久久久久久99 | 一级毛片不卡片免费观看 | 中国女人毛茸茸免费视频 | 久草免费在线播放 | 欧美一级乱理片免费观看 | 国产一二三区在线 | 韩国一级做a爰片性色毛片 韩国一区在线 | 午夜国产亚洲精品一区 | 中文无码日韩欧免费视频 | 久久亚洲精品国产精品777777 | 91成人啪国产啪永久地址 | 精品一区二区三区免费视频 | 日本亚欧乱色视频在线网站 | 日韩成人在线观看视频 | 日韩视频免费一区二区三区 | re久久| 欧美一级片免费在线观看 | 精品玖玖玖视频在线观看 | 99视频免费看 |