人民日?qǐng)?bào)海外版 | 聚焦杭州視覺(jué)智能產(chǎn)業(yè) 點(diǎn)贊當(dāng)虹科技核心技術(shù)
今天出版的《人民日?qǐng)?bào)(海外版)》,以《錢(qián)塘江畔探“視界”》為題,聚焦杭州視覺(jué)智能產(chǎn)業(yè)發(fā)展,并以當(dāng)虹科技為例重點(diǎn)闡述“掌握核心技術(shù)”的重要性。
AVS標(biāo)準(zhǔn)如何實(shí)現(xiàn)“突圍”?超低延時(shí)編碼如何在工業(yè)與衛(wèi)星領(lǐng)域應(yīng)用?AI大模型又將如何賦能視音頻產(chǎn)業(yè)發(fā)展?現(xiàn)將《錢(qián)塘江畔探“視界”》部分內(nèi)容摘編如下:
視覺(jué)智能的應(yīng)用潛能巨大。然而,如果只在下游應(yīng)用端打得火熱,卻不掌握核心技術(shù)、核心標(biāo)準(zhǔn)、核心芯片等,企業(yè)的“命門(mén)”終是掐在他人手中。
中國(guó)視頻產(chǎn)業(yè)就曾吃過(guò)“卡脖子”的虧。
2002年1月的一天,一艘來(lái)自中國(guó)的輪船抵達(dá)英國(guó)港口,孰料剛剛靠岸,便遇到難題。原來(lái),船上漂洋過(guò)海的DVD機(jī)沒(méi)有獲得國(guó)際編碼標(biāo)準(zhǔn)的專(zhuān)利授權(quán),被歐洲市場(chǎng)拒之門(mén)外。一時(shí)間,傳票紛至沓來(lái),要求中國(guó)廠商繳納高額的專(zhuān)利費(fèi)用。火熱的國(guó)內(nèi)DVD市場(chǎng)猶如當(dāng)頭澆下一桶冰水被迅速冰凍。
如何避免“卡脖子”?杭州的企業(yè)交上了各自的答卷。
“嘭,嘭,嘭……”畫(huà)面屏幕中,一個(gè)工匠正在打鐵,無(wú)論是亮部迸濺的火花高光,還是暗部冷調(diào)的鐵器,甚至是布衣上的褶皺,全都清晰可辨……在杭州當(dāng)虹科技股份有限公司展廳,一臺(tái)8K超高清編解碼設(shè)備吸引了記者的目光。公司董事長(zhǎng)孫彥龍介紹:“這臺(tái)設(shè)備以全國(guó)產(chǎn)化為特色,采用的是中國(guó)自主研制的AVS3編碼標(biāo)準(zhǔn)?!?/span>
啥是編碼?孫彥龍介紹,以8K視頻為例,一幀內(nèi)的像素點(diǎn)比1080p擴(kuò)大16倍,幀數(shù)也從每秒24幀擴(kuò)大為50幀;視頻“體積”如此巨大,要想流暢傳輸,就要經(jīng)過(guò)壓縮編碼,先變細(xì),再還原變粗。這就像是經(jīng)過(guò)一道兩頭寬、中間窄的啞鈴型傳送門(mén),如此,視頻才能變成大小合適的數(shù)字信號(hào),在數(shù)字世界自由馳騁。
對(duì)于企業(yè)來(lái)說(shuō),想要實(shí)現(xiàn)這種編解碼,就必須遵守行業(yè)“游戲規(guī)則”——采用一套業(yè)內(nèi)通用的音視頻編碼標(biāo)準(zhǔn)。但是,很長(zhǎng)一段時(shí)間里,“游戲規(guī)則”的制定權(quán)并不在中國(guó)。
“過(guò)去,編碼標(biāo)準(zhǔn)由國(guó)外機(jī)構(gòu)和企業(yè)制定,我們要用,就必須支付相當(dāng)比例的專(zhuān)利費(fèi)用?!币呀?jīng)與視頻算法打交道20多年的謝亞光,是當(dāng)虹科技創(chuàng)新研究院院長(zhǎng)。2002年起,他和團(tuán)隊(duì)就開(kāi)始參與制定中國(guó)自主知識(shí)產(chǎn)權(quán)的視頻編碼標(biāo)準(zhǔn)(AVS)。
“這就好比螞蟻搬家、蜜蜂筑巢,在外國(guó)標(biāo)準(zhǔn)已經(jīng)占據(jù)先機(jī)的情況下,成千上萬(wàn)個(gè)技術(shù)細(xì)節(jié)都需大量補(bǔ)充,自主研制難度很大,得一點(diǎn)點(diǎn)磨?!敝x亞光回憶說(shuō),這是全國(guó)音視頻領(lǐng)域?qū)W術(shù)界、產(chǎn)業(yè)界的一次合力突圍。經(jīng)過(guò)數(shù)年艱難推進(jìn),2009年,AVS標(biāo)準(zhǔn)已經(jīng)被認(rèn)為是國(guó)際上最重要的3個(gè)先進(jìn)視頻編碼標(biāo)準(zhǔn)之一,并正式成為國(guó)際通行標(biāo)準(zhǔn)?,F(xiàn)在,作為全球首個(gè)面向8K、5G產(chǎn)業(yè)應(yīng)用的視頻編碼標(biāo)準(zhǔn)AVS3,已經(jīng)領(lǐng)先于國(guó)際同類(lèi)標(biāo)準(zhǔn)。
此外,杭州市政府積極引導(dǎo)當(dāng)?shù)匾曈X(jué)智能產(chǎn)業(yè)集群攻關(guān)核心技術(shù),預(yù)計(jì)到2027年將突破視覺(jué)智能關(guān)鍵技術(shù)100項(xiàng),核心零部件、電子元器件、基礎(chǔ)軟件等領(lǐng)域建立多源可供體系,實(shí)現(xiàn)備份系統(tǒng)全覆蓋。
“你看這兩個(gè)畫(huà)面,有什么區(qū)別?”在當(dāng)虹科技展廳,記者來(lái)到一個(gè)實(shí)時(shí)顯示某學(xué)校動(dòng)態(tài)畫(huà)面的屏幕前,只見(jiàn)一條細(xì)線將畫(huà)面一分為二,肉眼卻察覺(jué)不出什么差別。疑惑之際,孫彥龍為記者揭曉了答案:“右邊是經(jīng)過(guò)超級(jí)編碼的視頻,能為行業(yè)客戶節(jié)省近90%的傳輸帶寬及中心端存儲(chǔ)的成本。之所以你看不出區(qū)別,是因?yàn)槿?、?chē)、衣服、背包等關(guān)鍵信息沒(méi)有丟失,只有天空、地面等不重要的信息,被不著痕跡地弱化了?!睋?jù)悉,這項(xiàng)技術(shù)目前已在衛(wèi)星視頻通信和工業(yè)視頻傳輸領(lǐng)域得到廣泛應(yīng)用。
編碼是當(dāng)虹科技的核心技術(shù)之一,這種神奇的“區(qū)別對(duì)待”效果,端賴(lài)人工智能的“大腦”?!拔覀儗?duì)畫(huà)面的壓縮不是簡(jiǎn)單、粗暴、無(wú)差別的,而是基于人工智能算法的感知編碼,精準(zhǔn)淡化不重要的信息,而且可以在調(diào)閱的時(shí)候按需還原。”謝亞光介紹。
未來(lái),怎樣確保視覺(jué)智能產(chǎn)業(yè)的“蛋糕”越來(lái)越大?杭州將目光投向了增量市場(chǎng)。
“一個(gè)短發(fā)的女生在街頭唱歌,早期彩色電影效果……”在后臺(tái)輸入指令,片刻后,一段視頻便生成:熙熙攘攘的人群中,一個(gè)穿著針織裙、盤(pán)著卷發(fā)的姑娘高歌于馬路中央,她雙目微閉,表情沉醉,畫(huà)面色調(diào)復(fù)古而懷舊。如此逼真的一幕,完全由AI生成。
今年4月,當(dāng)虹科技發(fā)布了自主研發(fā)的BlackEye多模態(tài)視聽(tīng)大模型?!半S著Sora的出現(xiàn),業(yè)內(nèi)對(duì)視頻大模型都很關(guān)注,雖然現(xiàn)在它還沒(méi)有大規(guī)模商用,但技術(shù)研發(fā)必須超前。”孫彥龍介紹,當(dāng)虹科技很多前瞻性的技術(shù)都是提前3—5年進(jìn)行布局,企業(yè)內(nèi)七成都是研發(fā)人員,每年研發(fā)投入占營(yíng)業(yè)收入的30%以上。