今年2月下半,公有雲廠商AWS與Google Cloud恰巧都針對高效能運算(HPC)用途,正式推出新款執行個體服務,它們都採用代號為Turin的AMD第五代EPYC處理器平臺

導入Nitro v6架構,AWS推出新一代高效能運算服務

首先是2月16日AWS宣布Amazon EC2 Hpc8a上線,在去年SC25大會該公司曾預告將於2026年推出,等到真正上市之後,他們揭露Hpc8a搭配的處理器時脈最高達4.5 GHz,相較於上一代高效能運算服務Hpc7a,效能提升40%,記憶體頻寬高出42%,性價比領先25%。就系統資源配置而言,Hpc8a僅提供Hpc8a.96xlarge一種組態,內建192顆處理器核心、768 GiB記憶體,以及300 Gbps網路頻寬(搭配EFA網路卡)。

而在Hpc8a的全球雲端區域供應上,AWS起初僅開放兩個:美國西部(俄亥俄)、歐洲(斯德哥爾摩),到了3月13日,AWS宣布亞太地區(東京)與GovCloud的美國西部區域,也能使用Hpc8a。

關於高效能運算應用軟體的效能表現狀況,AWS在3月4日揭露多筆測試數據

以STREAM Triad測試而言,Hpc8a領先Hpc7a的幅度逼近43%;

執行Ansys Fluent時,Hpc8a領先Hpc7a的幅度均超過50%,執行個體若增至8臺,甚至可到59%;

執行西門子Simcenter Star-CCM+時,Hpc8a領先Hpc7a的幅度介於36%到44%;

執行Ansys Mechanical時,Hpc8a領先Hpc7a的幅度最高為45%;

執行LS-DYNA Car2Car,Hpc8a領先Hpc7a的幅度逼近51%。

值得注意的是,Hpc8a也和近期上市的Amazon EC2執行個體一樣,均採用最新一代的AWS自研基礎架構卸載平臺Nitro System v6,可將虛擬化、儲存、網路等功能卸載至專屬加速卡,AWS強調,對比於先前推出的Hpc執行個體採用的Nitro舊世代技術,Nitro v6可提供更強大的封包處理效能,以及更低的網路存取延遲,能提供近乎裸機部署型態的系統效能,並兼顧雲端基礎架構需要的彈性、安全性與規模擴充能力。

首款實作Cloud RDMA技術的虛擬機器登場,Google Cloud推出新款主打HPC應用的運算最佳化服務

在今年2月23日正式登場的Google Cloud H4D,這批虛擬機器搭配的處理器時脈最高為4.1 GHz,就系統資源配置而言,H4D提供三種組態:h4d-standard-192、h4d-highmem-192、h4d-highmem-192-lssd,處理器核心均有192顆、記憶體容量為720 GiB或1,488 GiB,以及200 Gbps網路頻寬(支援Cloud RDMA),其中的h4d-highmem-192-lssd,可額外搭配本機Titanium SSD儲存,容量最高為3,750 GiB(10臺375 GiB容量的固態硬碟)。

關於全球雲端區域的供應,H4D起先開放美國地區的愛荷華州(us-central1)、歐洲地區的荷蘭(Netherlands),今年3月增設亞太地區的新加坡(asia-southeast1-a)。

在此之前,Google Cloud曾在去年多次公布H4D的效能測試數據。

例如,在4月舉行的Next 2025大會,H4D用於開放原始碼的High-Performance Linpack(OSS-HPL),整臺VM節點的運算效能可達到12,000 gflops以上。相較於採用AMD第4代EPYC處理器的C3D,H4D單臺VM與每核心效能的領先幅度,分別高達80%與60%,比起採用AMD第3代EPYC處理器C2D,H4D單臺VM提供5.8倍效能,以及1.7倍的每核心效能。

用於測量記憶體頻寬的STREAM Triad,H4D整臺VM可提供到950 GB/s以上;相較於C3D,H4D單臺VM與每核心效能的領先幅度,分別高達30%與40%,比起C2D,H4D單臺VM提供3倍效能,以及1.4倍的每核心效能。

用於不同用途的高效能運算應用程式,H4D的效能領先程度也相當顯著。用於製造領域,以計算流體動力學類型的軟體而言,像是西門子Simcenter Star-CCM+、Ansys Fluent,效能可增至3.6倍;用於醫療與生命科學領域,在分子動力學的軟體GROMACS上,效能可增至5倍;用於氣象預測領域,執行WRFv4時,效能提升至3.6倍。

接下來是10月舉行的STAC Summit NYC大會,Google Cloud揭露金融服務類型工作負載的執行效能,使用的工具是開放原始碼效能測試軟體KX Nano,整體而言,對比C3D,H4D在所有測試場景的效能領先幅度平均可達34%。

    

在11月的SC25大會,AMD公布H4D的高效能運算軟體效能數據,相較於C2D,H4D平均的效能可增至4倍。

今年3月,Google Cloud再度揭露多種高效能運算軟體的效能測試數據。

在製造領域中,執行OpenFOAM時,H4D效能可達到C2D的5.2倍;執行Ansys Fluent時,H4D效能可達到C2D的4.1倍,就完成工作時間而言,H4D只需C2D的27%,以及C3D的71%,成本分別降低6成與7成。

在醫療與生命科學領域,執行LAMMPS時,H4D效能可達到C2D的4.3倍;執行GROMACS,H4D效能可達到C2D的5.8倍,就完成工作時間而言,H4D只需C2D的四分之一,以及C3D的67%,成本卻降了7成。

H4D之所以能提供如此大的性能效益,除了採用AMD第五代EPYC處理器平臺,配備的硬體卸載與網路加速技術也是關鍵因素。H4D同樣導入Google Cloud自行研發的Titanium技術,但這裡增加新的卸載功能,稱為Cloud RDMA(Cloud Remote Direct Memory Access),也是首度配置在Google Cloud虛擬機器的技術,是專門為了支援高效能運算類型工作負載而發展的,因為運算流體動力學、氣象建模、分子動力學這類運算作業,重度依賴節點之間的通訊,Cloud RDMA可幫忙虛擬機器分攤網路處理的負擔,減少主機CPU運作的瓶頸,進而替多個運算節點提供低延遲、高頻寬的可預期通訊能力。

Google Cloud表示,Cloud RDMA本身也運用他們研發的硬體傳輸加速架構Falcon,能在資料中心乙太網路環境當中,提供可靠、低延遲的網路通訊能力,確保網路效能的表現不僅高且能夠被預期。

他們也在2025年4月Next大會期間,揭露Cloud RDMA的傳輸加速能力。對比於使用TCP傳輸,同樣是1到4臺虛擬機器的執行,在OpenFOAM軟體測試中,改用Cloud RDMA傳輸,速度可提升至4.3倍;在西門子Simcenter Star-CCM+軟體測試中,Cloud RDMA可提升至1.9倍。

若增至1到32臺虛擬機器的執行,在GROMACS軟體測試中,改用Cloud RDMA傳輸,速度可提升至2.8倍;在WRFv4軟體測試中,Cloud RDMA可提升至1.3倍。

產品資訊

AWS Amazon EC2 Hpc8a
●原廠:AWS
●建議售價:隨需定價模式,亞太地區(東京)區域,hpc8a.96xlarge每小時10.22989美元(192顆虛擬處理器、768 GiB記憶體)
●處理器:AMD EPYC 9R45
●服務規模與組態:
hpc8a.96xlarge,192顆虛擬處理器、768 GiB記憶體、網路頻寬為300 Gbps,硬碟儲存搭配AWS雲端區塊儲存服務EBS,存取頻寬為87至2,085 Mbps

Google Cloud H4D
●原廠:Google Cloud
●建議售價:h4d-standard-192,亞太地區新加坡(asia-southeast1)區域,每小時10.209696美元(192顆虛擬處理器、720 GiB記憶體)
●處理器:AMD EPYC 9B45 
●服務規模選擇與最大組態:
h4d-highmem-192-lssd,192顆虛擬處理器、720或1,488 GiB記憶體、網路頻寬為200 Gbps,硬碟儲存搭配平衡Hyperdisk(每臺虛擬機器最多掛載64臺硬碟,平衡Hyperdisk最多8臺)或Local Titanium SSD

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement