當(dāng)虹科技亮相ITTC!基于視聽大模型的AI應(yīng)用成功落地
6月13日,由中國電影電視技術(shù)學(xué)會主辦的2024北京國際電視技術(shù)研討會(ITTC)拉開帷幕。
來自國家廣播電視總局、中央廣播電視總臺、全國多家廣播電視臺的領(lǐng)導(dǎo)、行業(yè)專家學(xué)者以及創(chuàng)新技術(shù)企業(yè)的500余名代表共襄盛會,集中研討視聽產(chǎn)業(yè)創(chuàng)新升級路徑,共同推進(jìn)“超清化、移動化、智能化”創(chuàng)新技術(shù)應(yīng)用發(fā)展。
在主題研討會上,當(dāng)虹科技智能媒資產(chǎn)品線總經(jīng)理范濤,展示了當(dāng)虹科技BlackEye多模態(tài)視聽大模型的應(yīng)用,并分享新一代人工智能驅(qū)動下媒資如何實現(xiàn)智能生產(chǎn)。
不需要高精度的攝像機360°采集和大規(guī)模渲染,手機拍攝幾張靜態(tài)照片或者一段視頻,通過AI算法就能在幾分鐘內(nèi)生成一個三維模型。這樣一個生動的虛擬形象在植入節(jié)目后,還能與觀眾進(jìn)行交互。
在大會現(xiàn)場,范濤展示了當(dāng)虹科技智能媒資系統(tǒng)基于BlackEye多模態(tài)視聽大模型的應(yīng)用成果。
范濤介紹,BlackEye多模態(tài)視聽大模型已于今年4月在中關(guān)村論壇發(fā)布。該大模型還是強大的AIGC引擎,它深度整合視頻、音頻、圖像、文本和三維模型等跨模態(tài)內(nèi)容的推理與生成能力,包括文本生成、文生視頻、圖生視頻等生成式算法,以及AI視覺增強、AI橫豎轉(zhuǎn)換、AI智能集錦等分析式算法。
除了算法的優(yōu)勢,BlackEye融合了豐富的數(shù)據(jù)類型。結(jié)合多樣性、準(zhǔn)確性、安全性等數(shù)據(jù)要求,公司從核心團隊30多年的視聽數(shù)據(jù)積累、視聽內(nèi)容合作伙伴共建共享等來源,全面構(gòu)建訓(xùn)練所需的數(shù)據(jù)“燃料”。
“這確保我們BlackEye多模態(tài)視聽大模型真正貼近業(yè)務(wù)場景,真正契合客戶需求。”范濤表示,當(dāng)虹智能媒資系統(tǒng)正是在大模型的驅(qū)動下,不僅有著更高效率的生產(chǎn)力,還可以創(chuàng)造更高質(zhì)量的內(nèi)容。例如,智能標(biāo)簽、高光集錦、三維建模、短視頻生產(chǎn)、智能剪輯等,都是智能媒資系統(tǒng)中可以調(diào)用的AI能力。
在研討會上,范濤和大家分享了BlackEye在國內(nèi)某內(nèi)容平臺的應(yīng)用案例:在該平臺的智能媒資系統(tǒng)中,給出一段演唱會視頻或音樂MV,它可以智能分析出高潮片段,并進(jìn)行橫屏轉(zhuǎn)豎屏,剪輯成易于傳播的短視頻。如果遇到歌詞遮擋,還可以自動擦除字幕,保持人物完整性。據(jù)了解,基于BlackEye多模態(tài)視聽大模型的視聽能力,已在多家B端客戶中落地應(yīng)用。