虛擬平台AI訓練 支援高性能運算

[新科技速遞] [人工智能AI][VMWare] [Dell]

Dell EMC PowerEdge伺服器配備BitFusion的原廠安裝VMware vSphere

新科技速遞

雖然說AI訓練有不少硬件方案,不過圖像處理器(GPU)仍然是主流。不少AI模型必須在內部訓練,企業必須購置圖像處理器(GPU)。

GPU價格和耗能居高不下,一般安裝於伺服系統,以供多用戶共享,以分擔成本。

由於Google推出了Kubernetes上安排AI和機器學習Kubeflow容器化流程,通過容器,可快速部署訓練AI,加快模型訓練與部署,已成為主流部署方式,而VMware針對現代化應用和容器,推出VMware Tanzu,深度支援容器。

容器化方案便於管理

VMWare Tanzu Kubernetes Grid針對容器而設計,可支援部署Kubeflow,加快AI訓練。

GPU協同處理器設於個別的工作站或伺服器,經常未能充分利用,有時候只有容量不足15%。專爲AI而設Dell EMC的GPU即服務,提供兩款不同設計,創建共同虛擬GPU,有效運用資源。

VMware配備 BitFusion 技術的VMware vSphere 7版本,透過內部部署虛擬化GPU,再供Kubeflow作訓練用途,據需要將工作負載靈活移動至支援VMware的公有雲作訓練,充分利用混合雲的優勢。

VMware vSphere 7由Dell供應鏈於工廠安裝,配合Bitfusion功能,集合IT資源讓數據中心共享。這項技術讓用戶可合時為合適的工作負載自助存取合適的資源,以提升利用率。

高性能方案擴充容易

大部份在專屬系統上運行的HPC工作負載需要專門技術進行部署及管理。專爲虛擬高效能運算(vHPC)而設的Dell EMC 就緒解決方案結構包括VMware Cloud Foundation及VMware vSphere 7,並配備Bitfusion功能,有助簡化及以更具成本效益的方式使用VMware環境,應付嚴苛的HPC及AI應用,包括運算化學、生物信息學及電腦協助工程。

而對於實施大型HPC項目,專為vHPC而設Dell EMC就緒解決方案,則提供VMware vSphere Scale-Out Edition選項,以節省成本。

透過利用VMware將HPC及AI運作虛擬化,IT團隊可以按需配置硬件,加快初始部署及設定速度,並透過簡化的中央管理及保安功能以節省時間。根據Forrester Consulting,專為vHPC而設的Dell EMC就緒解決方案,提升AI模型開發速度達18倍,從以往所需數個月,縮短至數日,加快硬件配置及整合速度20%。

PowerEdge配備Dell EMC OpenManage系統管理軟件,可協助AI及先進運算管理人員進一步提升系統的正常運作時間。

Leave a Reply

Your email address will not be published. Required fields are marked *