剛剛,阿里云宣布正式推出
全棧智能計(jì)算解決方案“飛天智算平臺(tái)”
并啟動(dòng)兩座超大規(guī)模智算中心
為科研、公共
服務(wù)和企業(yè)機(jī)構(gòu)
提供強(qiáng)大的智能計(jì)算服務(wù)
可將計(jì)算資源利用率提高3倍以上
AI訓(xùn)練效率提升11倍,推理效率提升6倍
我們希望通過開放飛天智算平臺(tái),為各行各業(yè)提供強(qiáng)大的融合算力、高效的全鏈路智能服務(wù),同時(shí)在可支撐多種指令集芯片的基礎(chǔ)上,大幅提升計(jì)算效率,并通過綠色低碳方面的能力,大大降低AI訓(xùn)練能耗。為各領(lǐng)域創(chuàng)新提供更高效、更開放、更綠色的智能計(jì)算服務(wù)。
————阿里云智能全球銷售總裁蔡英華
01:支撐建設(shè)超級(jí)智算中心
飛天智算平臺(tái)源于阿里巴巴內(nèi)部廣泛實(shí)踐,也源于廣泛的產(chǎn)業(yè)智能實(shí)踐。目前,該平臺(tái)正在支撐建設(shè)兩座超大規(guī)模智算中心。
張北智算中心建設(shè)規(guī)模為12 EFLOPS(每秒1200億億次浮點(diǎn)運(yùn)算)AI算力。在云端,張北智算中心支撐AI預(yù)訓(xùn)練大模型、AI Earth、數(shù)字人等前沿AI應(yīng)用,將成為全球最大的智算中心。
烏蘭察布智算中心建設(shè)規(guī)模為3 EFLOPS(每秒300億億次浮點(diǎn)運(yùn)算)AI算力,位于“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點(diǎn),采用自然風(fēng)冷、AI調(diào)溫等綠色技術(shù),實(shí)現(xiàn)綠色低碳。
02:全面開放飛天智算平臺(tái)
飛天智算平臺(tái)是阿里云最新發(fā)布的全棧智能計(jì)算解決方案,提供公共云和專有云兩種模式,為各類科研和智能企業(yè)機(jī)構(gòu)提供強(qiáng)大的智能計(jì)算服務(wù)。
通過先進(jìn)的技術(shù)架構(gòu),飛天智算平臺(tái)實(shí)現(xiàn)了90%的千卡并行計(jì)算效率,可將算力資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。
1、突破計(jì)算效率極限
飛天智算平臺(tái)采用先進(jìn)的技術(shù)架構(gòu),將衡量算力效率的核心指標(biāo)“千卡并行計(jì)算效率”,從傳統(tǒng)架構(gòu)的40%提升至90%,可將算力資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。
2、支持“一云多芯”
飛天智算平臺(tái)提供基于阿里云磐久基礎(chǔ)設(shè)施的融合算力和大數(shù)據(jù)AI一體化平臺(tái)整體解決方案,可以運(yùn)行在X86、GPU、ARM等多種芯片類型的服務(wù)器上,實(shí)現(xiàn)“一云多芯”,支持多種處理器混合部署、統(tǒng)一調(diào)度,并可進(jìn)行應(yīng)用優(yōu)化,部分性能提升100%以上。
3、高效智能服務(wù)
開發(fā)人員可以在飛天智算平臺(tái)上進(jìn)行數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)治理、數(shù)據(jù)分析、模型開發(fā)、模型訓(xùn)練與推理的工作。并提供了預(yù)訓(xùn)練模型,以及語音,圖像、自然語言處理、決策等領(lǐng)域的模型能力,以方便開發(fā)者更好的加速AI應(yīng)用的開發(fā)。
4、綠色低碳
飛天智算在技術(shù)減排、能源結(jié)構(gòu)優(yōu)化、區(qū)域布局優(yōu)化、供應(yīng)鏈減碳以及資源利用優(yōu)化五個(gè)方面來降低單位算力的碳排放。在技術(shù)減排方面,通過液冷、電源技術(shù)以及智能運(yùn)維等方式降低能耗,PUE最低可達(dá)1.09。
阿里云浸沒式液冷集群
03:體系化的技術(shù)創(chuàng)新
智能計(jì)算不同于通用型計(jì)算,需要海量數(shù)據(jù)對(duì)AI模式進(jìn)行訓(xùn)練,算力被損耗在數(shù)據(jù)遷移、同步等環(huán)節(jié),千卡以上規(guī)模的算力輸出最低往往僅有40%左右。這導(dǎo)致了智能算力成本高昂,制約了產(chǎn)業(yè)發(fā)展。
阿里云通過體系化的技術(shù)創(chuàng)新,改變了智能計(jì)算的損耗難題,將千卡并行計(jì)算效率提升至90%以上。
1、在網(wǎng)絡(luò)技術(shù)上:阿里云采用高性能RDMA網(wǎng)絡(luò),實(shí)現(xiàn)端對(duì)端最低2微妙延遲。
2、在通信技術(shù)上:阿里云自研的無阻塞通信技術(shù),讓計(jì)算過程中的數(shù)據(jù)交換速度提升了5倍以上。
3、在存儲(chǔ)技術(shù)上:自研的IO加速器讓數(shù)據(jù)存取實(shí)現(xiàn)最高10倍性能提升。
4、在大數(shù)據(jù)AI開發(fā)層:阿里云提供分布式訓(xùn)練框架,并通過API對(duì)分布式策略進(jìn)行自動(dòng)組合和調(diào)優(yōu),將訓(xùn)練效率提升了11倍以上。
5、一站式AI計(jì)算開發(fā)服務(wù):阿里云為用戶提供了一站式的通用推理優(yōu)化工具,對(duì)算法模型進(jìn)行量化、剪枝、稀疏化、蒸餾等操作,將推理效率提升6倍以上。
04:構(gòu)建智算生態(tài)產(chǎn)業(yè)圈
如今,飛天智算平臺(tái)已在阿里內(nèi)部廣泛應(yīng)用,支撐達(dá)摩院前沿AI和電商智能技術(shù)發(fā)展,并服務(wù)了小鵬汽車、深勢科技、上汽集團(tuán)、中國氣象局、南方電網(wǎng)等機(jī)構(gòu)和企業(yè),支撐自動(dòng)駕駛、新藥研發(fā)、氣象預(yù)測、工業(yè)能源等行業(yè)大幅提升AI訓(xùn)練效率。
1、在自動(dòng)駕駛領(lǐng)域
小鵬汽車:基于飛天智算在烏蘭察布建設(shè)智算中心“扶搖”,算力規(guī)模達(dá)600PFLOPS,是國內(nèi)最大的自動(dòng)駕駛智算中心,將自動(dòng)駕駛模型訓(xùn)練提速近170倍。
毫末汽車:基于飛天智算,實(shí)現(xiàn)128卡并行效率超96%,使自動(dòng)駕駛模型訓(xùn)練成本降低62%,訓(xùn)練速度提升110%,讓模型迭代周期大幅縮短。
2、在生命科學(xué)領(lǐng)域
深勢科技采用飛天智算平臺(tái)之后,將集群性能優(yōu)化提升超過100%,讓分子動(dòng)力學(xué)仿真模擬訓(xùn)練效率提升了5倍以上。
3、在工業(yè)領(lǐng)域
智己汽車:運(yùn)用高性能計(jì)算將工業(yè)仿真的效率提升了25%,智能駕駛訓(xùn)練效率提升了70%,加速了新車型的研發(fā)上市。
山東德州電力:通過AI進(jìn)行復(fù)核預(yù)測,準(zhǔn)確率達(dá)到了98%,耗時(shí)從1小時(shí)縮短至幾分鐘。
4、在城市治理領(lǐng)域
四川成宜高速:通過數(shù)字孿生進(jìn)行車路協(xié)同優(yōu)化使事故率降低60%。
重慶水務(wù):通過遙感數(shù)據(jù)與仿真推演實(shí)現(xiàn)水利調(diào)度預(yù)測準(zhǔn)確性高達(dá)95%;
南方電網(wǎng)與中國氣象局:利用智算能力提升氣象預(yù)報(bào)的準(zhǔn)確性與穩(wěn)定性。
帶你一圖看懂
阿里云飛天智算平臺(tái)
↓↓↓