淘天集團(tuán)發(fā)布圖生視頻技術(shù)框架AtomoVideo 圖片可一鍵變視頻
3月19日消息,淘天集團(tuán)旗下阿里媽媽技術(shù)團(tuán)隊近日推出高保真圖片生成視頻框架——AtomoVideo(阿瞳木視頻),可將圖片素材自動化轉(zhuǎn)換為高質(zhì)量視頻動效。目前,該技術(shù)已在阿里媽媽的萬相實驗室、廣告投放平臺等應(yīng)用場景上線,所有商家都可以體驗“圖片一鍵變視頻”的人工智能新技術(shù),快速生成創(chuàng)意短視頻。
經(jīng)體驗,用戶上傳一張圖,輸入動作文字指令,靜態(tài)的圖片就能在各種場景中動起來。比如,上傳一張玩偶圖片后輸入文字指令:穿紅色襯衣的玩偶在街上散步。很快,一段短視頻就生成了,玩偶邁開步伐行走,街景也跟著變化。此外,靜態(tài)的帆船也能在輸入指令后在大海中揚(yáng)帆起航,海報中的樂手也開始彈奏吉他演奏,場景還原和人物表情、動作,都接近專業(yè)動畫師水準(zhǔn)。
圖源:淘天集團(tuán)官方
以上視頻生成功能已在阿里媽媽廣告平臺廣泛應(yīng)用。商家可以在阿里媽媽電商圖片生成工具“萬相實驗室”中,一鍵將制作的商品圖片轉(zhuǎn)化為商品視頻。同時,阿里媽媽的設(shè)計師也可以應(yīng)用該技術(shù),為商家客戶量身訂制視頻創(chuàng)意并投放。
據(jù)了解,AtomoVideo應(yīng)用了阿里媽媽技術(shù)團(tuán)隊自研的諸多新技術(shù),包括優(yōu)質(zhì)數(shù)據(jù)集構(gòu)建、多粒度圖像注入、漸進(jìn)性動作強(qiáng)度增加的多階段訓(xùn)練等,目前可以支持任意像素的圖片生成4秒視頻動效,并兼容市面上各種文生圖模型。
阿里媽媽一位受訪技術(shù)人士稱,當(dāng)前技術(shù)還遠(yuǎn)未挖掘出視頻生成的真正潛力,在視頻畫面穩(wěn)定性、內(nèi)容創(chuàng)造可控性以及視頻時長等關(guān)鍵要素上,仍有非常廣闊的探索空間。這位人士認(rèn)為,當(dāng)前的應(yīng)用生成雖然只是起步,但隨著技術(shù)模型不斷迭代,視頻生成的準(zhǔn)確度和仿真度也會逐漸提高。
圖源:淘天集團(tuán)官方
在創(chuàng)意生成領(lǐng)域,除了此次發(fā)布的AtomoVideo,阿里媽媽技術(shù)團(tuán)隊也研發(fā)出可擴(kuò)展圖片、視頻的“尺寸魔方”等創(chuàng)意編輯工具,可以實現(xiàn)圖片和視頻的任意目標(biāo)尺寸的拓展和補(bǔ)缺,同時保持素材的原生性。
據(jù)介紹,過去一年來,淘寶在AI電商領(lǐng)域探索不斷加深。在消費者端,淘寶推出“淘寶問問”,用戶可以通過向“問問”與淘寶互動,了解最新的消費動態(tài)。在商家端,淘寶推出的商家AI創(chuàng)意生產(chǎn)工具萬相實驗室可以幫助商家0成本上新、0成本適配模特、0成本創(chuàng)造場景以及批量生產(chǎn)高規(guī)格商品圖。年初,淘寶基于AI大模型,升級智能客服機(jī)器人“店小蜜”,進(jìn)一步提升“店小蜜”回答買家問題的準(zhǔn)確度。最近,淘寶再次推出AI制圖工具“繪蛙”,幫助商家生成各種風(fēng)格的高品質(zhì)圖片,降低商家成本,該應(yīng)用很快將結(jié)束內(nèi)測全量推廣。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn