4月19日,阿里巴巴達(dá)摩院發(fā)布超大規(guī)模語(yǔ)言模型PLUG,該模型參數(shù)規(guī)模達(dá)270億,是目前全球規(guī)模最大的中文純文本預(yù)訓(xùn)練語(yǔ)言模型。PLUG集良好的語(yǔ)言理解與創(chuàng)造性文本生成能力于一身,在小說(shuō)仿寫、詩(shī)歌生成、智能問答等長(zhǎng)文本生成領(lǐng)域表現(xiàn)突出,其目標(biāo)是通過(guò)超大模型的能力,大幅提升中文自然語(yǔ)言技術(shù)在各類任務(wù)中的表現(xiàn)。 4月19日,PLUG刷新CLUE分類榜單紀(jì)錄,排名僅次于“人類” 近年來(lái),大規(guī)模預(yù)訓(xùn)練模型成為人工智能領(lǐng)域的重要趨勢(shì)。訓(xùn)練擁有“大智慧”的“大模型”,展現(xiàn)了一條通向通用人工智能的可能路徑。去年5月,海外公司OpenAI發(fā)布能寫小說(shuō)、聊天、編曲譜、寫代碼的GPT-3模型,將這一浪潮在全球范圍內(nèi)推向新高。此后,中文領(lǐng)域同類模型的訓(xùn)練進(jìn)程備受關(guān)注。與GPT-3類似,阿里達(dá)摩院本次發(fā)布的PLUG模型有望廣泛應(yīng)用于文本生成領(lǐng)域,成為“萬(wàn)能寫作神器”。更重要的是,此類超大模型擁有極強(qiáng)的通用性,被認(rèn)為或?qū)⒊蔀槿斯ぶ悄軙r(shí)代新型基礎(chǔ)設(shè)施之一。 較GPT-3改進(jìn)之處在于,PLUG集成了達(dá)摩院自研的語(yǔ)言理解及語(yǔ)言生成雙模型,并通過(guò)構(gòu)建輸入文本雙向理解能力,顯著提升了輸出文本的相關(guān)性。在語(yǔ)言理解任務(wù)上,PLUG以80.614分刷新了業(yè)內(nèi)權(quán)威的中文語(yǔ)言理解評(píng)測(cè)基準(zhǔn)CLUE分類榜單歷史紀(jì)錄;在語(yǔ)言生成任務(wù)上,PLUG多項(xiàng)應(yīng)用數(shù)據(jù)較業(yè)內(nèi)最優(yōu)水平提升了8%以上。 據(jù)了解,PLUG采用了1TB以上高質(zhì)量中文文本訓(xùn)練數(shù)據(jù),涵蓋新聞、小說(shuō)、詩(shī)歌、問答等廣泛類型及領(lǐng)域。接下來(lái),PLUG將擴(kuò)大參數(shù)規(guī)模至2000億級(jí),并進(jìn)一步提升文本生成質(zhì)量。在超大規(guī)模預(yù)訓(xùn)練模型領(lǐng)域,除發(fā)布以中文為核心的PLUG外,達(dá)摩院、阿里云計(jì)算平臺(tái)團(tuán)隊(duì)還聯(lián)合智源研究院、清華大學(xué)發(fā)布了面向認(rèn)知的超大規(guī)模新型預(yù)訓(xùn)練模型“文匯”,以及聯(lián)合清華大學(xué)發(fā)布了超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型“M6”。 阿里巴巴達(dá)摩院語(yǔ)言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人司羅表示,“達(dá)摩院團(tuán)隊(duì)將進(jìn)一步攻克自然語(yǔ)言處理領(lǐng)域科研難題,完善中文及跨語(yǔ)言人工智能基礎(chǔ)設(shè)施,讓AI沒有難懂的語(yǔ)言,并探索通用人工智能之路?!?/span>