Veo 3 主要數據
Veo 3 可根據單一文字提示生成最長 60 秒的影片片段,讓創作者有足夠時間構建短篇故事、廣告或電影場景。
- 影片畫質最高可達 1080p(Full HD),細節更豐富,鏡頭運動流暢,物理模擬精確——是目前最擬真的 AI 影片生成模型之一。
- Veo 3 也具備原生音訊生成,包含 擬真人聲旁白、音效、環境聲與背景音樂。音訊會自動與畫面動作同步,並能精確跟隨用戶自訂的對白與場景提示。
- 提示理解能力大幅提升,模型可解析 鏡頭角度、物體動作、情感氛圍,甚至音訊時序與聲音風格。
- 渲染過程通常需 1–3 分鐘,依場景複雜度與平台而異。
首創音訊整合影片生成
Veo 3 是 Google DeepMind 首款可原生同時生成音訊與影片的模型。它不僅僅加入背景音樂,更能創造 場景專屬音景,包括自然對話、環境聲、音效(SFX)與音樂,全都與畫面完美同步。
高保真與真實感
Veo 3 可產生 1080p 高畫質影片,細節豐富、動作精確、空間一致性高。支援複雜物理效果,讓落物、水流、風吹髮絲或反射等都能自然且一致地呈現。臉部表情更細膩,動作流暢,即使在困難的動態鏡頭(如平移、跟拍)下也能維持品質。
創意提示控制
使用 Veo 3,創作者可前所未有地掌控視覺與音訊元素。你可以指定 鏡頭角度、運動(如平移、縮放、推軌)、場景構圖、氛圍,甚至情感基調。音訊提示可包含精確對白、背景環境(如熱鬧咖啡館、寧靜森林),甚至指定「溫柔女聲」或「緊張電影配樂」等。
VEO 3 在此如何運作?
步驟 1
1. 撰寫詳細提示: 請包含視覺指示、鏡頭角度、音訊提示、對白與音效——Veo 3 擅長理解複雜輸入。
步驟 2
2. 生成與微調: 提交提示並檢視結果。
步驟 3
3. 下載你的影片。