抖音AI越搞越猛,硬剛阿里快手
勝者為王。
1.抖音“即夢(mèng)AI”移動(dòng)端上線蘋果商店
現(xiàn)在,市面上的AI工具越來(lái)越多,功能也更加強(qiáng)大了。從圖片生成、視頻生成,再到故事創(chuàng)作,各大互聯(lián)網(wǎng)公司對(duì)AI技術(shù)的更新迭代,讓創(chuàng)作變得簡(jiǎn)單。
比如,字節(jié)跳動(dòng)旗下剪映推出的AI創(chuàng)作平臺(tái)“即夢(mèng)AI”,集圖片生成、智能畫布、視頻生成、故事創(chuàng)作4大功能,用戶可以用AI作圖,輸入提示詞生成圖片,也可以生成視頻,畫面栩栩如生。
近日,據(jù)鈦媒體AGI獨(dú)家獲悉,“即夢(mèng)AI”移動(dòng)端已上架蘋果APP Store應(yīng)用商店。更早之前的7月31日,即夢(mèng)AI安卓版已上架小米等各大安卓應(yīng)用商店,版本號(hào)為1.0.0,可供用戶下載使用。
而在今年5月,即夢(mèng)AI網(wǎng)頁(yè)版已上線。
應(yīng)用介紹顯示,即夢(mèng)AI是一個(gè)專為創(chuàng)意愛好者打造的AI表達(dá)平臺(tái),讓你的想象力成為現(xiàn)實(shí)。
主頁(yè)面功能包括圖片生成與視頻生成,其中,圖片創(chuàng)作可選擇八款通用模型,視頻生成也可以選擇運(yùn)鏡角度,包括隨機(jī)、推近、拉遠(yuǎn)、順時(shí)針、逆時(shí)針,而視頻速度則有快中慢三檔。底部Tab鍵還可進(jìn)入靈感社區(qū),一鍵創(chuàng)作同款作品。
截至目前,“即夢(mèng)AI”已上線會(huì)員服務(wù),用戶可選擇連續(xù)包月每月69元、單月79元,或連續(xù)包年659元,對(duì)應(yīng)購(gòu)買505個(gè)積分/月,從而生成約2020張圖片或168個(gè)AI視頻。每天登陸即夢(mèng)AI可獲得66積分,并在當(dāng)天后清零。
至于即夢(mèng)AI背后的開發(fā)團(tuán)隊(duì)是“深圳市臉萌科技有限公司”,該公司是字節(jié)跳動(dòng)在2018年收購(gòu)的相機(jī)拍照工具《Faceu激萌》團(tuán)隊(duì),交易總價(jià)約3億美元。
目前,臉萌科技隸屬于字節(jié)跳動(dòng)旗下的剪映業(yè)務(wù),由剪映業(yè)務(wù)負(fù)責(zé)人張楠(Kelly Zhang)領(lǐng)導(dǎo)。
話又說(shuō)回來(lái),在抖音的AI產(chǎn)品矩陣當(dāng)中,即夢(mèng)AI算是推出比較晚的AI產(chǎn)品。在此之前,抖音已經(jīng)有豆包、Cici、MagicVideo、MagicAnimate等產(chǎn)品和模型。
MagicVideo- V2于今年1月發(fā)布,是一款ai視頻生成模型,可以文生視頻、圖生視頻,也可以用來(lái)給視頻換風(fēng)格;而MagicAnimate于去年12月上線,可以讓圖片生成逼真的視頻動(dòng)態(tài)效果。
抖音各種大模型項(xiàng)目遍地開花,與其加大投入大模型業(yè)務(wù)有關(guān)。去年2月,抖音開始組建大模型團(tuán)隊(duì),由TikTok產(chǎn)品技術(shù)負(fù)責(zé)人朱文佳帶隊(duì),主要發(fā)力語(yǔ)言和圖像兩種模態(tài)。
緊接著11月,又有消息稱,抖音成立新部門Flow,發(fā)力AI應(yīng)用層,仍然由朱文佳擔(dān)任業(yè)務(wù)負(fù)責(zé)人。
如今,即夢(mèng)AI移動(dòng)端上線各大應(yīng)用商店,表明抖音AI業(yè)務(wù)得到進(jìn)一步發(fā)展。依托剪映在圖片和視頻創(chuàng)作領(lǐng)域的優(yōu)勢(shì),即夢(mèng)AI將可以迅速出圈。
2.視頻生成大模型,抖音也不想落下
今年2月,全球知名人工智能公司OpenAI上線文生視頻大模型Sora。一經(jīng)發(fā)布,該款產(chǎn)品迅速火遍全球,成為大家的關(guān)注重點(diǎn)。
只要給Sora一些提示詞,它就可以生成1分鐘的Ai視頻內(nèi)容。當(dāng)時(shí)Sora生成的視頻中最典型的案例,是一位時(shí)尚的女士穿著黑色皮夾克、長(zhǎng)紅裙和黑色靴子,手拿黑色手袋,在東京一條燈光溫暖、霓虹燈閃爍、帶有動(dòng)感城市標(biāo)志的街道上自信而隨意地行走。
如果不提前告訴你這是由Ai生成的,你絕對(duì)不會(huì)發(fā)現(xiàn)。Sora的上線引起的轟動(dòng)效果可謂顯著,國(guó)內(nèi)各大互聯(lián)網(wǎng)科技企業(yè)都不想掉隊(duì),爭(zhēng)相加大投入視頻生成模型。
而在此之前,國(guó)內(nèi)互聯(lián)網(wǎng)公司已經(jīng)有所成績(jī)。比如阿里巴巴自研的視頻生成模型 AnimateAnyone,可以讓一張照片生成一段舞蹈視頻,就有網(wǎng)友用這個(gè)AI模型讓兵馬俑跳科目三。
而早在去年11月底,該研究論文便已經(jīng)在海外視頻播放量超 1 億。今年3月,阿里一個(gè)高保真圖像視頻生成框架AtomoVideo,能讓生成的視頻更加逼真。
此前2月份,阿里還推出了AI圖片-音頻-視頻模型EMO,僅需一張人物肖像和音頻,就可以肖像人物開口唱歌。
另外還有騰訊的視頻生成模型AnimateZero,可以實(shí)現(xiàn)精準(zhǔn)地控制視頻的外觀和運(yùn)動(dòng),比如更改車的顏色,或者將動(dòng)漫人物的圖片生成的視頻,并融入眼睛變色、頭發(fā)蓬松等細(xì)節(jié)。
快手方面,今年7月初,在2024世界人工智能大會(huì)上,快手大模型首次集體亮相,其中就有視頻生成大模型“可靈”。
今年6月,快手自研的“可靈”視頻生成大模型官網(wǎng)正式上線,至今不到兩個(gè)月就已經(jīng)迎來(lái)三次迭代升級(jí)。據(jù)了解,初次亮相的可靈大模型全面對(duì)標(biāo)Sora,并在內(nèi)容生產(chǎn)方面取得了新突破。
比如此前Sora僅能生成60秒左右的高清視頻,而可靈AI則將生成視頻時(shí)長(zhǎng)拉長(zhǎng)至2分鐘。可靈的畫質(zhì)、鏡頭控制、首尾幀控制也隨著產(chǎn)品升級(jí),而有了實(shí)質(zhì)性的飛躍。
值得一提的是,在騰訊、阿里、抖音都沒有向用戶開放視頻大模型的使用權(quán)限時(shí),可靈率先全面開放內(nèi)測(cè),在快手旗下的快影App開放邀測(cè)體驗(yàn)。
可以看出,國(guó)內(nèi)其他互聯(lián)網(wǎng)公司在視頻生成模型方面取得一項(xiàng)又一項(xiàng)突破,這不免給抖音帶來(lái)壓力。抖音“即夢(mèng)AI”上線各大應(yīng)用商店,顯然是主動(dòng)出擊,直面市場(chǎng)壓力。
我們也能看到,視頻生成模型的功能和效果已經(jīng)發(fā)生了翻天覆地的變化,場(chǎng)景識(shí)別和情感分析則能夠更深入地理解視頻內(nèi)容,為用戶創(chuàng)造出了前所未有的視覺體驗(yàn)。
3.成本依舊是難題
盡管大模型賽道十分火熱,但成本依舊是困擾絕大多數(shù)人工智能企業(yè)的難題。相較于大型語(yǔ)言模型,像Sora這樣的視頻生成模型涉及到更復(fù)雜的數(shù)據(jù)處理和更高的計(jì)算要求,訓(xùn)練成本更高。
據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,大型語(yǔ)言模型(LLM)如GPT-3的單次訓(xùn)練成本約為140萬(wàn)美元。然而,對(duì)于更大規(guī)模的LLM,訓(xùn)練成本會(huì)顯著增加,介于200萬(wàn)美元至1200萬(wàn)美元之間。
LLM的訓(xùn)練需要使用大量的高端GPU,如英偉達(dá)的A100等。這些GPU的價(jià)格昂貴,且需要配置相應(yīng)的服務(wù)器和存儲(chǔ)設(shè)備。此外,由于訓(xùn)練過(guò)程中需要持續(xù)運(yùn)行大量的計(jì)算任務(wù),因此電費(fèi)也是一項(xiàng)不可忽視的成本。
以 ChatGPT 在1月的獨(dú)立訪客平均數(shù)1300萬(wàn)計(jì)算,其對(duì)應(yīng)芯片需求為3萬(wàn)多片英偉達(dá)A100 GPU,初始投入成本約為8億美元,每日電費(fèi)在5萬(wàn)美元左右。
同時(shí),據(jù)澎湃新聞報(bào)道,Sora在訓(xùn)練階段至少需要4200~10500塊英偉達(dá)H100 GPU,并持續(xù)訓(xùn)練1個(gè)月。去年也有消息傳出,抖音向英偉達(dá)訂購(gòu)了超過(guò)10億美元的GPU。
據(jù)虎嗅報(bào)道,按照某國(guó)內(nèi)AI公司最近公布的AI圖片生成最大折扣價(jià)算,生成1張圖片的價(jià)格最低0.06元,1秒25幀,花費(fèi)1.5元,120秒的視頻成本高達(dá)180元。
總之,AI視頻生成的高成本是限制大模型企業(yè)的重要因素。因此,企業(yè)還需要探索多樣化的商業(yè)模式以平衡成本與收益。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn