8月2日,小鵬汽車(chē)宣布在烏蘭察布建成中國(guó)最大的自動(dòng)駕駛智算中心“扶搖”,用于自動(dòng)駕駛模型訓(xùn)練。“扶搖”基于阿里云智能計(jì)算平臺(tái),算力可達(dá)600PFLOPS(每秒浮點(diǎn)運(yùn)算60億億次),將小鵬自動(dòng)駕駛核心模型的訓(xùn)練速度提升了近170倍。
小鵬汽車(chē)董事長(zhǎng)、CEO何小鵬表示,隨著自動(dòng)駕駛模擬訓(xùn)練的需求變化,我們需要一個(gè)強(qiáng)大的本地+云端的算力來(lái)支持。我非常有信心和阿里云在一起合作,我們能夠更快更強(qiáng)去實(shí)現(xiàn)自動(dòng)駕駛的研發(fā)。小鵬汽車(chē)期待,與阿里云一起攜手共進(jìn),共創(chuàng)未來(lái)出行時(shí)代的美好明天。
數(shù)據(jù)驅(qū)動(dòng)是自動(dòng)駕駛發(fā)展的公認(rèn)方向,也讓自動(dòng)駕駛模型訓(xùn)練成為一頭“吃算力”的巨獸。自動(dòng)駕駛的視覺(jué)檢測(cè)、軌跡預(yù)測(cè)與行車(chē)規(guī)劃等算法模型,有賴(lài)于機(jī)器學(xué)習(xí)海量數(shù)據(jù)集,但算力的不足讓研發(fā)速度仍遠(yuǎn)遠(yuǎn)趕不上數(shù)據(jù)量增長(zhǎng)的速度。隨著傳感器的進(jìn)一步增加,算力的挑戰(zhàn)越來(lái)越大。
近年來(lái),專(zhuān)用于機(jī)器學(xué)習(xí)的AI智算成為發(fā)展最快的一種算力形式。包括谷歌、微軟、Meta、阿里巴巴在內(nèi)的頂尖科技公司都紛紛建造了智算中心。
自動(dòng)駕駛算法模型訓(xùn)練是機(jī)器學(xué)習(xí)的典型場(chǎng)景之一。在烏蘭察布,小鵬汽車(chē)建造了一個(gè)算力規(guī)模達(dá)600PFLOPS的自動(dòng)駕駛專(zhuān)用智算中心“扶搖”,來(lái)進(jìn)一步提高模型訓(xùn)練的效率。
通過(guò)與阿里云合作,“扶搖”以更低成本實(shí)現(xiàn)了更強(qiáng)算力。首先,對(duì)GPU資源進(jìn)行細(xì)粒度切分、調(diào)度,將GPU資源虛擬化利用率提高3倍,支持更多人同時(shí)在線開(kāi)發(fā),效率提升十倍以上。在通訊層面,端對(duì)端通信延遲降低80%至2微秒。整體計(jì)算效率上,實(shí)現(xiàn)了算力的線性擴(kuò)展。存儲(chǔ)吞吐比業(yè)界20GB/s的普遍水準(zhǔn)提升了40倍,數(shù)據(jù)傳輸能力相當(dāng)于從送快遞的微型面包車(chē),換成了20多米長(zhǎng)的40噸集裝箱重卡。此外,阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI提供了模型訓(xùn)練部署、推理優(yōu)化等AI工程化工具,比開(kāi)源框架訓(xùn)練性能提升30%以上。
“扶搖”支持小鵬自動(dòng)駕駛核心模型的訓(xùn)練時(shí)長(zhǎng)從7天,縮短至1小時(shí)內(nèi),大幅提速近170倍。目前,“扶搖”正用于小鵬城市NGP輔助駕駛系統(tǒng)的算法模型訓(xùn)練。和高速道路相比,城市路段的交通狀況更為復(fù)雜,自動(dòng)駕駛特殊場(chǎng)景(corner case)的數(shù)據(jù)集規(guī)模增加了上百倍。