谷歌今日正式發(fā)布新一代視頻生成模型Veo 3.1,在畫面真實度、敘事控制及多模態(tài)生成能力方面實現(xiàn)突破。該模型同步賦能旗下AI影視創(chuàng)作平臺Flow,新增音頻生成功能,支持從文本到"聲畫合一"的完整創(chuàng)作流程。
Flow平臺此次升級聚焦三大核心功能:素材生視頻(Ingredients to Video)支持多圖參考生成定制化視頻,首尾幀(frames to Video)可自動生成過渡鏡頭,視頻延展(Extend)功能則能將短片擴(kuò)展至分鐘級長視頻。最引人注目的是AI音頻生成系統(tǒng)的加入,該系統(tǒng)可根據(jù)畫面內(nèi)容自動匹配環(huán)境音、動作音效及氛圍配樂,實現(xiàn)真正的多媒體創(chuàng)作。
針對后期編輯需求,F(xiàn)low新增智能元素插入工具,可自然融入人物、動物等新元素并自動調(diào)整光影效果。即將上線的一鍵移除功能支持無痕刪除對象,系統(tǒng)會自動重建背景畫面。這些工具使創(chuàng)作者能更精準(zhǔn)地控制最終效果。
技術(shù)測試顯示,Veo 3.1在復(fù)雜光影場景中表現(xiàn)突出,能準(zhǔn)確還原清晨光線的暖色調(diào)與自然氛圍。實測生成的小溪畫面水流平滑,反光細(xì)節(jié)處理得當(dāng),配音與畫面內(nèi)容高度契合。模型提供快速版(30秒-1分鐘生成)和高質(zhì)量版兩種模式,滿足不同創(chuàng)作需求。
但在高難度動態(tài)場景測試中,模型暴露出明顯局限。當(dāng)嘗試生成體操動作視頻時,輸出畫面出現(xiàn)嚴(yán)重扭曲,無法準(zhǔn)確呈現(xiàn)人體結(jié)構(gòu)。名人肖像測試也顯示保護(hù)機制生效,上傳OpenAI CEO照片生成的畫面存在顯著差異,系統(tǒng)提示不支持使用特定人物形象。
目前Veo 3.1已通過Flow平臺、Gemini API、Vertex AI及Gemini應(yīng)用全面開放,免費用戶每月可獲100個AI點數(shù),約可生成5條視頻。廣告短片測試表明,模型能根據(jù)咖啡杯、人像等素材生成符合品牌調(diào)性的商業(yè)內(nèi)容,廣告詞呈現(xiàn)效果達(dá)到預(yù)期要求。
本文鏈接:http://www.yifxia.cn/showinfo-24-185528-0.html谷歌Veo 3.1視頻生成模型上線,AI創(chuàng)作“聲畫合一”,實測體驗有亮點也有局限
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com