角逐云霸主:亞馬遜云升級(jí)自研AI芯片,與英偉達(dá)合作推AI基礎(chǔ)設(shè)施
·亞馬遜云科技(AWS)成為第一家在云端配備英偉達(dá)GH200 Grace Hopper超級(jí)芯片的云廠商,并將在其平臺(tái)上推出英偉達(dá)DGX Cloud NVIDIA AI“訓(xùn)練即服務(wù)”。兩家公司將合作推出Project Ceiba,構(gòu)建全球最快的GPU驅(qū)動(dòng)的AI超級(jí)計(jì)算機(jī)。
·云計(jì)算領(lǐng)域正在經(jīng)歷一場(chǎng)激烈的霸主爭奪戰(zhàn),AWS和微軟處于這場(chǎng)競爭的最前沿,兩者都在定制芯片上下了功夫,也都采取了某種“雙管齊下”的思路:既推出自研芯片,也同時(shí)提供英偉達(dá)最新AI芯片這樣的可選項(xiàng)。
太平洋時(shí)間11月28日,亞馬遜云科技在美國拉斯維加斯舉辦2023 re:Invent全球大會(huì)。
太平洋時(shí)間11月28日,亞馬遜云科技(Amazon Web service,AWS)在美國拉斯維加斯舉辦的2023 re:Invent全球大會(huì)上宣布,與英偉達(dá)擴(kuò)大戰(zhàn)略合作,將聯(lián)合推出先進(jìn)的基礎(chǔ)設(shè)施、軟件及服務(wù),推動(dòng)客戶在生成式AI(Generative AI)的創(chuàng)新。
AWS還宣布推出專為訓(xùn)練人工智能系統(tǒng)而設(shè)計(jì)的第二代芯片Trainium2,以及通用Graviton4處理器。
云計(jì)算領(lǐng)域正在經(jīng)歷一場(chǎng)激烈的霸主爭奪戰(zhàn),AWS和微軟處于這場(chǎng)競爭的最前沿,兩者都在定制芯片上下了功夫,也都采取了某種“雙管齊下”的思路。
首家在云端配備英偉達(dá)GH200
亞馬遜云科技首席執(zhí)行官亞當(dāng)·塞利普斯基(Adam Selipsky)表示,“亞馬遜云科技與英偉達(dá)合作已經(jīng)超過13年,我們的合作起源于推出全球首個(gè)配置GPU(圖形處理器)的云端實(shí)例。現(xiàn)在我們推出最廣泛的英偉達(dá)GPU解決方案,可用于各種工作負(fù)載,包括繪圖、游戲、HPC高性能計(jì)算、機(jī)器學(xué)習(xí),直到現(xiàn)在的生成式AI。”
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛也穿著標(biāo)志性皮衣出現(xiàn)在發(fā)布會(huì)現(xiàn)場(chǎng),他在與塞利普斯基對(duì)話時(shí)說,“生成式AI正改變各種云端負(fù)載,為多元內(nèi)容創(chuàng)作在底層注入加速計(jì)算動(dòng)能。我們的共同目標(biāo)是為每個(gè)客戶提供具有成本效益的先進(jìn)生成式AI,為此英偉達(dá)與亞馬遜云科技在整個(gè)計(jì)算堆棧展開合作,橫跨AI基礎(chǔ)設(shè)施、加速庫(acceleration libraries)、基礎(chǔ)模型以及生成式AI服務(wù)。”
雙方將英偉達(dá)與亞馬遜云科技技術(shù)優(yōu)勢(shì)相結(jié)合,為訓(xùn)練基礎(chǔ)模型和構(gòu)建生成式AI應(yīng)用提供理想環(huán)境,具體包含英偉達(dá)新一代GPU、CPU(中央處理器)與AI軟件的最新多節(jié)點(diǎn)系統(tǒng),以及亞馬遜云科技的Nitro System先進(jìn)虛擬化與安全平臺(tái)、Elastic Fabric Adapter(EFA)互連技術(shù)和UltraCluster(超大規(guī)模集群)擴(kuò)展能力。
亞馬遜云科技與英偉達(dá)此次擴(kuò)大合作主要包括四個(gè)方面:
·亞馬遜云科技成為第一家在云端配備英偉達(dá)GH200 Grace Hopper超級(jí)芯片的云廠商。英偉達(dá)GH200 NVL32多節(jié)點(diǎn)平臺(tái)為運(yùn)用英偉達(dá)NVLink與NVSwitch技術(shù)連接32個(gè)Grace Hopper Superchips組成的實(shí)例。此平臺(tái)將在Amazon Elastic Compute Cloud(Amazon EC2)實(shí)例上可用,與亞馬遜的網(wǎng)絡(luò)相連,由虛擬化(Amazon Nitro System)及超大規(guī)模集群(Amazon EC2 UltraClusters)提供支持,讓共同客戶能擴(kuò)展至數(shù)千個(gè)GH200超級(jí)芯片。
·在亞馬遜云科技平臺(tái)上將推出英偉達(dá)DGX Cloud NVIDIA AI“訓(xùn)練即服務(wù)(AItrainingasaservice)”。此服務(wù)將是首個(gè)配置GH200 NVL32的DGX Cloud,為開發(fā)者提供單一實(shí)例中最多的共享內(nèi)存。在亞馬遜云科技上運(yùn)行的DGX Cloud將加速訓(xùn)練含有超過1兆參數(shù)的尖端生成式AI與大型語言模型。
·英偉達(dá)與亞馬遜云科技合作推動(dòng)Project Ceiba,構(gòu)建全球最快的GPU驅(qū)動(dòng)的AI超級(jí)計(jì)算機(jī),這是一個(gè)配備GH200 NVL32與Amazon EFA互連技術(shù)的大規(guī)模系統(tǒng),該系統(tǒng)部署在亞馬遜云科技上,為英偉達(dá)研發(fā)團(tuán)隊(duì)提供服務(wù)。該超級(jí)計(jì)算機(jī)將前所未有地配置16384顆英偉達(dá)H200超級(jí)芯片,能處理65 exaflops(衡量超級(jí)計(jì)算機(jī)性能的單位,每秒浮點(diǎn)運(yùn)算可達(dá)一百億億次)速度等級(jí)的AI運(yùn)算,英偉達(dá)使用該超級(jí)計(jì)算機(jī)推動(dòng)其全新生成式AI的創(chuàng)新。
·亞馬遜云科技將推出三款A(yù)mazon EC2實(shí)例:P5e實(shí)例配置英偉達(dá)H200 Tensor Core GPUs,針對(duì)大規(guī)模與尖端生成式AI及HPC高性能運(yùn)算工作負(fù)載;分別配置英偉達(dá)L4 GPUs與英偉達(dá)L40S GPUs的G6與G6e實(shí)例,可運(yùn)行包括AI微調(diào)、推理、繪圖以及影片工作負(fù)載等廣泛應(yīng)用。G6e實(shí)例特別適用于開發(fā)3D工作流程、數(shù)字孿生、以及其他使用英偉達(dá)Omniverse的應(yīng)用,用來連結(jié)與構(gòu)建各種生成式AI的3D應(yīng)用。
據(jù)塞利普斯基透露,亞馬遜云科技正運(yùn)用英偉達(dá)NeMo框架訓(xùn)練新一代大語言模型Amazon Titan。Amazon Robotics也已開始借助英偉達(dá)Omniverse Isaac打造數(shù)字孿生,在虛擬化環(huán)境中推動(dòng)自主倉庫的自動(dòng)化、優(yōu)化以及規(guī)劃,完成之后再部署到真實(shí)環(huán)境。
最新自研芯片Trainium2和Graviton4
據(jù)塞利普斯基介紹,Trainium2的性能是其前身(2020年12月推出的第一代Trainium)的四倍,能源效率是其前身的兩倍。10萬個(gè)Trainium芯片可提供65 exaflops的計(jì)算能力,相當(dāng)于每個(gè)芯片可提供650 teraflops(每秒執(zhí)行一萬億次浮點(diǎn)運(yùn)算)的計(jì)算能力。
AWS表示,由10萬個(gè)Trainium芯片組成的集群可以在數(shù)周而不是數(shù)月內(nèi)訓(xùn)練出3000億參數(shù)的大語言模型,這大約是OpenAI的大語言模型GPT3大小的1.75倍。
據(jù)AWS介紹,初創(chuàng)公司Databricks和OpenAI競爭對(duì)手Anthropic計(jì)劃使用新的Trainium2芯片構(gòu)建模型。但AWS沒有透露AWS客戶何時(shí)可以使用Trainium2實(shí)例,只是表述為“明年某個(gè)時(shí)候”。
亞馬遜云科技計(jì)算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗(David Brown)表示:“芯片是用戶所有工作負(fù)載的基礎(chǔ)……Graviton4是我們?cè)诙潭涛迥晖瞥龅倪@一系列的第四代,是我們至今功能最強(qiáng)大和最具能效的芯片。”
AWS發(fā)布的第二款芯片是基于Arm架構(gòu)的自研服務(wù)器CPU芯片Graviton4,旨在用于推理。據(jù)塞利普斯基介紹,與在Amazon EC2上運(yùn)行的上一代Graviton處理器Graviton3相比,Graviton4的計(jì)算性能提高了30%,核心數(shù)量增加了50%,內(nèi)存帶寬增加了75%。
由Graviton4支持的R8g實(shí)例已推出預(yù)覽版,AWS客戶目前已可以開始測(cè)試該處理器,該實(shí)例計(jì)劃在未來幾個(gè)月內(nèi)全面上市。
云計(jì)算霸主的“雙管齊下”思路
云計(jì)算領(lǐng)域正在經(jīng)歷一場(chǎng)激烈的霸主爭奪戰(zhàn),AWS和微軟處于這場(chǎng)競爭的最前沿,兩家巨頭都在定制芯片上進(jìn)行了大量投資。
定制芯片本質(zhì)上也是對(duì)當(dāng)下生成式人工智能火熱,大模型訓(xùn)練和運(yùn)行所需GPU短缺的應(yīng)對(duì)。據(jù)巴倫周刊此前報(bào)道,英偉達(dá)性能最好的芯片的交付已排到2024年。為了減少對(duì)GPU的依賴,有能力負(fù)擔(dān)得起GPU的公司正在開發(fā)定制芯片,用于創(chuàng)建、迭代和產(chǎn)品化大模型。
從微軟和AWS兩個(gè)云計(jì)算廠商可以觀察到一種“雙管齊下”的思路:既推出自研芯片,也同時(shí)提供英偉達(dá)最新AI芯片這樣的可選項(xiàng)。此次亞馬遜云科技在推出自己推理訓(xùn)練芯片的同時(shí),也提供對(duì)英偉達(dá)最新AI芯片H200的訪問。11月初,微軟也采取了類似的思路,推出了首款人工智能芯片Maia 100,并表示微軟云(Azure)將配備英偉達(dá)H200 GPU。
除此之外,值得注意的是,AWS也展示了其在量子計(jì)算領(lǐng)域的一些最新進(jìn)展,其中包括最新的量子糾錯(cuò)硬件設(shè)計(jì),這種新的架構(gòu)有望用更少的超導(dǎo)組件來產(chǎn)生可控的邏輯量子比特,從而為超大規(guī)模量子計(jì)算機(jī)的構(gòu)建鋪平道路。
- 1空調(diào)繼電器壞了出現(xiàn)什么問題(如何判斷及更換)
- 2大金冷氣故障代碼a3(大金冷氣故障代碼A3解析指南)
- 3凱福將指紋鎖售后服務(wù)中心(凱福指紋鎖服務(wù)中心:專業(yè)售后服務(wù)一站解決)
- 4樂開指紋鎖售后電話(樂開指紋鎖售后電話:快速與貼心的服務(wù)!)
- 5步陽防盜門打不開怎么辦(步陽防盜門無法開啟應(yīng)對(duì)策略)
- 6創(chuàng)維G6圖像模式怎么調(diào)(創(chuàng)維G6圖像模式指南:如何實(shí)現(xiàn)最佳中心調(diào)節(jié)?)
- 7奧克斯柜機(jī)空調(diào)故障代碼e4(奧克斯柜機(jī)空調(diào)故障代碼e4:疑難排解及解決方案
- 8小米電視換屏幕多少錢(維修費(fèi)用詳解)
- 9西門子洗衣機(jī)報(bào)e17故障(西門子洗衣機(jī)E17故障解決方案)
- 10十大不建議買的燃?xì)庠钆琶?哪些品牌不靠譜?)
-
NBA總決賽MVP榜:哈利伯頓力壓亞歷山大升至榜首
2025-06-13
-
2025 世俱杯小組賽巡禮 & 關(guān)鍵榜單速覽
2025-06-13


