近日,在國際視頻標(biāo)準(zhǔn)MPEG Technical Requirements工作組關(guān)于MPEG Video Coding for Machine(機(jī)器視覺視頻編碼,以下簡稱“MPEG-VCM”)的技術(shù)征集提案評測中,阿里巴巴達(dá)摩院聯(lián)合香港城市大學(xué)提交的方案在機(jī)器視覺任務(wù)中取得2項(xiàng)第一,是唯一一個(gè)斬獲多項(xiàng)第一的提案。
達(dá)摩院與香港城市大學(xué)的提案獲得兩項(xiàng)第一 視頻編碼是視頻信號存儲和傳輸?shù)幕A(chǔ),在上世紀(jì)八十年代開始進(jìn)入標(biāo)準(zhǔn)化發(fā)展,經(jīng)過多代的迭代優(yōu)化,目前最新最高效的面向人眼的視頻編碼標(biāo)準(zhǔn)為H.266/VVC標(biāo)準(zhǔn)。 但隨著自動(dòng)駕駛,智慧城市和工業(yè)互聯(lián)網(wǎng)等人工智能場景的發(fā)展,面向機(jī)器的視頻編碼需求急劇上升,業(yè)界迫切需要全新的視頻編碼技術(shù)。 為此,MPEG于2019年7月成立VCM工作組,推進(jìn)機(jī)器視覺視頻編碼標(biāo)準(zhǔn)化工作,吸引了阿里巴巴、愛立信、諾基亞、浙江大學(xué)及ETRI等國內(nèi)外企業(yè)和機(jī)構(gòu)的參與。 今年,MPEG正式向全球發(fā)布MPEG-VCM技術(shù)征集書,共接收到來自全球16家企業(yè)和機(jī)構(gòu)的提案,將為后續(xù)標(biāo)準(zhǔn)制定提供重要參考。 在測評階段,所有提案在多項(xiàng)機(jī)器視覺任務(wù)和多個(gè)數(shù)據(jù)集上進(jìn)行測試,以BD-rate和BD-rate(Pareto)指標(biāo)衡量各個(gè)提案相對于H.266/VVC標(biāo)準(zhǔn)的碼率節(jié)省。 最終,達(dá)摩院聯(lián)合香港城市大學(xué)的提案(Proposal 02)在物體檢測任務(wù)中取得兩項(xiàng)性能第一。 達(dá)摩院提出了全新的VCM框架,聯(lián)合自適應(yīng)時(shí)空域編碼方案JAST,該方案包括面向機(jī)器的預(yù)分析、面向機(jī)器的預(yù)處理、自適應(yīng)時(shí)域變采樣、自適應(yīng)空域變采樣和核心視頻編碼器五大模塊,最終有效提升面向機(jī)器視覺任務(wù)性能的壓縮效率。在標(biāo)準(zhǔn)測試條件的物體檢測任務(wù)中,JAST方案可獲得平均39.04%的性能提升。 達(dá)摩院研究員葉琰表示:“隨著超高清視頻、AR/VR、自動(dòng)駕駛、智慧城市和工業(yè)互聯(lián)網(wǎng)等新應(yīng)用的爆發(fā),視頻編碼技術(shù)既要面向人眼也要面向機(jī)器,我們將持續(xù)深度參與國際視頻標(biāo)準(zhǔn)的制定,用創(chuàng)新技術(shù)為各行各業(yè)降低帶寬成本。” 過去幾年,達(dá)摩院積極參與國際視頻標(biāo)準(zhǔn)的制定,在ITU-T和INCITS等重要國際視頻標(biāo)準(zhǔn)組織中擔(dān)任主席和副主席職位,達(dá)摩院自研的Ali266在全球編解碼頂級賽事MSU 2021比賽中獲得了全高清FullHD客觀性能賽道的8項(xiàng)第一和主觀賽道的冠軍。 來源:阿里云