Reference to Video AI Generator
什么是 Reference to Video AI?
Reference to video AI 是一种由源素材驱动的生成工作流。你不需要从零开始描述场景,而是先上传用于定义哪些内容应该保持稳定的参考素材,再描述你希望模型生成的新镜头。



边界清晰
Reference to video 负责源素材驱动的生成。Text to video 负责先写 prompt 再创作,image to video 则负责把首帧或首尾帧动画化。
如何使用 Reference to Video
选择支持参考素材的模型,上传应该控制连续性的文件,再写一段 prompt 说明你想生成的新镜头。
先选模型
在这个页面里选择真正支持源素材驱动视频生成的模型。当前 reference workflow 支持 Veo 3.1 Fast、Seedance 2.0、Seedance 2.0 Fast、Gemini Omni Video、Happy Horse 1.0、Kling 2.6 Motion Control 和 Kling 3 Motion Control。
上传参考素材
每个文件只负责一件事:身份、产品还原、动作示例、场景风格或音频节奏。更干净的参考素材通常会带来更稳定的结果。
描述新镜头
让参考素材负责连续性,再用 prompt 定义新片段里发生什么变化,例如动作、构图、镜头运动、氛围或节奏。
更多 AI 工具与特效
发现更多工具和特效,为您的创意工作流增添动力。
为什么 Reference to Video 更能保持连续性
角色更稳定
参考文件可以减少身份漂移,让同一个脸部、服装和视觉 persona 在相关视频中更容易被识别。
产品还原度更高
使用参考素材可以让产品演示、广告和活动变体中的包装、材质、 logo 与视觉风格保持一致。
运动更容易被引导
当模型支持时,视频参考可以提供运动线索,帮助下一镜头更清楚地延续姿势、节奏或动作模式。
音频节奏可控
音频参考可以帮助支持音乐驱动和节奏敏感生成的模型定义节拍、能量感或时间感。
Prompt 更干净
当参考素材已经定义了身份和连续性之后,prompt 就可以专注于新镜头,而不必反复描述静态主体信息。
迭代结果更可预期
当参考素材已经锚定主体、场景逻辑和风格方向时,小幅 prompt 调整通常会产生更清晰的 A/B 变体。
Reference to Video AI 常见问题
面向源素材驱动 AI 视频生成的实用回答。
