當前,利用人工智能(AI)為代表的新興信息技術推動創新,已經成為企業共識。來自麥肯錫全球研究院的一項報告顯示,到2030年大約70%的公司將采用至少一種人工智能,而且很大一部分大型企業將使用全方位的技術。在IDC發布的2021中國人工智能未來趨勢報告中顯示,到2021年,至少有65%的中國1000強企業將利用自然語言處理(NLP)、機器學習(ML)和深度學習(DL)等AI工具,賦能60%在客戶體驗、安全、運營管理和采購等業務領域的用例。
提到人工智能,就不得不提數據、算法、算力三大要素。隨著技術的突破,算力有了飛躍式的提升,為開發人工智能應用提供算力支撐的方式也變得多種多樣,不再僅是高性能服務器計算集群,諸如數據科學工作站、云上超算等也出現在我們的視野當中。今天,筆者就重點跟大家聊聊數據科技工作站是否能夠為開發AI應用提供足夠的算力。
數據科學工作站的算力是否夠用?
在AI應用的開發過程中,要經過數據準備、模型開發和訓練、模型部署三個階段,整個過程對平臺的算力有很高的要求,特別是當收集的數據量越來越大,數據類型越來越多元時,算法強度就會越來越高,這就需要更高性能的計算產品來提供對AI的支持。
利用工作站開發AI應用,我想大部分用戶都會擔心其算力不夠用的問題。有這種擔心的用戶,我想大部分人對工作站這種產品并不了解,或者已經很久時間沒有關注相關產品了。
早期的工作站產品,主要針對圖形、圖像與視頻工作的高端專用電腦,以此來滿足設計師對于圖形設計、視頻渲染等的需求,的確不太適用于開發AI應用。不過,隨著AI應用開發的需求越來越多,用戶需要更加方便、靈活、高性價比的產品,以滿足AI算力需求。于是,搭配更高CPU、內存、GPU的專業數據科學工作站出現了。
從硬件配置上來看,數字科學工作站不但能夠支持多路英特爾至強可擴展處理器,而且還能夠支持NVIDIA RTX 和 NVIDIA Quadro RTX 專業級 GPU,且在臺式工作站上能夠支持高達臺式機上獲取高達96 GB 或在筆記本電腦上獲取高達 24 GB 的超快本地顯存。當然,其內存和硬盤的容量也大大高于圖形工作站。
除此之外,數字科學工作站還具備優化的軟件能力。例如,在采用 NVIDIA 技術的數據科學工作站,NIVIDA都會為其配備基于 NVIDIA CUDA-X AI 打造且經過測試和優化的綜合性堆棧,這些堆棧采用了 RAPIDS 數據處理和機器學習庫、NVIDIA 優化 XGBoost、TensorFlow、PyTorch 及其他領先的數據科學軟件,能夠加速工作流程,提高數據準備、模型訓練和數據可視化的速度。
可以說,雖然在算力上數據科學工作站還無法與高性能計算集群相媲美,但其仍然具備不錯的算力和穩定性,同樣能夠滿足很多企業開發AI應用的需求。相比較之下,由于部署簡單,即開即用,無須進行繁雜的配置,且價格相對比較便宜,因此,數字科學工作站可以說是一種不錯的選擇。
數據科學工作站有哪些主要優勢?
或許很多用戶會問,如今提供云上算力與AI應用開發的廠商越來越多,且價格不高,隨用隨買,更加適合于普通企業;那些對算力有著更高要求的AI應用,企業一般都會選擇部署AI服務器集群,數據科學工作站相比較之下,有哪些優勢呢?
筆者認為,數據科學工作站的主要優勢主要體現在以下幾個方面:
1)使用簡單,開箱即用。我們可以把數據科學工作站看成是一臺高配置的電腦,大部分產品都自帶系統和驅動,只需要用戶根據自己的需要安裝開發軟件即可,基本上做到了開箱即用。
2)按需配置,費用更低。用戶可以根據自己的實際情況,選擇不同配置的處理器、圖形加速器、內存、硬盤、顯示器等硬件進行按需配置。相比較之下,雖然用戶可以在云上選擇自己需要的硬件配置,但由于云平臺的帶寬資源并不是免費的而是按照流量收費,其網絡傳輸成本不菲。同時,從長期使用來看,云上AI服務器的總體使用成本并不便宜。
3)本地化訪問,更加安全。云上數據安全一直是用戶擔心的問題,相比較之下,數據科學工作站一直為本地化部署方式,強調數據本地化管理,不但能夠輕松應對數據的本地訪問和修改,且數據更加安全。
4)按需安裝軟件,更加靈活。使用數據科學工作站的用戶,不僅可以在試驗階段,自行自由試驗,而且對于容器開發包或平臺軟件,也可以按照需求安裝。同時,用戶也可以按需對
AI應用軟件迭代,對數據科學工作站在算法、模型等方面進行隨意修改,雙便于提供更加貼身的AI應用支持。
什么樣的用戶適合選擇數據科學工作站?
目前,各大廠商推出了各種配置的數據科學工作站。
從戴爾、HP、聯想等廠商在售的產品來看,高端產品大都采用了英特爾至強可擴展處理器以及英偉達的高端專業GPU,入門產品也采用了最新一代的酷睿i7系列處理器和英偉達的專業GPU,售價覆蓋了一萬到十萬的價格區間,產品型號非常豐富,能夠滿足當前絕大多數AI應用開發的需求。
不過,對于那些沒有任何AI開發經驗,想嘗試一下深度學習等技術,運行一些現成的代碼的企業或者用戶,可以租用云平臺來進行體驗,大可沒有必須花重金采購數據科學工作站。當然,對于那些已經部署了超算服務器集群的企業,他們也不會關注選擇數據科學工作站此類的產品。
除此之外,筆者認為目前大部分企業的AI應用開發,都可以選擇在數據科學工作站上完成。企業或者用戶可以根據自己的實際情況,選擇不同配置的產品即可,以保證在高效完成AI應用開發的同時,降低算力帶來的成本。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】
文章來源:https://biz.51cto.com/art/202112/695035.htm