
研究视频生成技术有一段时间了,最近看到一篇实用性强的分享,整理如下。
团队运营一家AI影视工作室,曾为政府机构和多家市值数十亿美元的企业制作过宣传片。过去几个月,团队持续使用Seedance 2.0,测试多种工作方式,记录下真正有效的操作方法。
以下是完整的Seedance实战指南,免费公开。
如何立即使用 Seedance 2.0
只有一种可行方式——实则包含两个步骤:下载CapCut,将VPN切换至印度尼西亚。完成之后,即可在应用内直接使用Seedance 2.0,无需排队、无需申请API、无需特殊权限。只需印尼VPN + CapCut,就能开启。
核心限制:15秒是上限
Seedance生成的单段视频最长为15秒,分辨率为720p。不支持生成1分钟以上的连续片段,也不提供原生4K输出。
真正的制作方法是“拼接”:
将多个5秒、10秒、15秒的片段组合起来,形成完整视频。每个片段独立生成,再通过剪辑流畅衔接。这正是专业剪辑师的工作逻辑。
不要想着“生成一个视频”,而是思考“生成一组镜头”。一旦转变思路,Seedance就从娱乐工具变成了生产工具。
先规划,再生成
在打开CapCut之前,先在纸上拆解视频结构:
- 场景1:远景建立镜头,5秒
- 场景2:近景反应,10秒
- 场景3:反打镜头,15秒
为每个场景明确写出:环境、构图、动作、情绪、声音。
- 一分钟视频 ≈ 4–5个场景
- 两分钟视频 ≈ 8–12个场景
每个镜头单独生成,后期拼接。由于Seedance最擅长处理单一动作、单一瞬间。
关键决策:是否需要角色一致?
不需要角色一致(纯环境/风格视频)
使用纯文本生成(text-to-video)。设定统一的风格锚点,保持提示词语言一致。每个场景独立生成,Seedance会同步生成音频。在提示词中加入旁白、环境音、氛围描述。
最终拼接后,整体感自然连贯。
需要角色一致(动画或插画风格)
先用Nano Banana Pro生成分镜图,每场景一张。它的角色一致性表现优于多数工具。
将这些图像输入Seedance(image-to-video):
- 图像决定身份
- 提示词决定动作
提示词结构(核心部分)
大多数人写提示词像写散文,但模型只会吸收其中20%。
每条提示词必须包含五个模块:
1. SUBJECT(主体)
明确是谁或什么,加上服装、场景、情绪。描述要具体、可感知。
示例:“一个穿着深色羊毛大衣的男人,站在雨中的屋顶边缘,肩膀紧绷,下颌紧咬,身后城市灯火模糊散开。”
2. ACTION(动作)
只能用一个动词。✔ 正确:“他缓缓转向镜头”✘ 错误:“他转身、抬手、微笑”
多个动作会让模型混乱。
3. CAMERA(镜头)
包含运动方式 + 构图。
常用关键词:
- 运动:慢推、跟拍、横移、手持、环绕、升降
- 构图:特写、中景、远景、俯拍、仰拍、过肩
⚠️ 速度词至关重大(slow / rapid)⚠️ 不要叠加多个镜头运动
4. STYLE(风格)
不要只写“cinematic”。
要组合具体元素:
- 光线
- 颗粒
- 色彩
示例:
- Kodak Vision3 500T(电影暖调)
- ARRI Alexa(高端数字质感)
- 35mm grain(胶片颗粒感)
强效果关键词:
- 动机光(最有效)
- 画面内可见光源
- 钨丝灯暖光
- 体积光尘
- 负补光(强化阴影)
5. QUALITY(质量后缀)
每条提示词末尾必须加上:“4K, Ultra HD, Rich details, Sharp clarity, Cinematic texture, Natural colors, Stable picture.”
提示词长度规则
- 文本转视频:120–280词
- 图像转视频:50–80词
太短 → 结果随机太长 → 模型忽略部分内容
⚠️ 不使用否定词(如“no blur”)只用正面描述
参考图系统
最多支持:
- 9张图片
- 3个视频
- 3段音频
关键规则:
- @Image1 权重最高(+40–50%)
- 每个角色使用3张图:正面、3/4侧、侧面
- 不使用拼图(系统会误判为多个角色)
图像生成视频时:
提示词开头写:“@Image1 as the first frame.”
不要重复描述角色外貌(图像已定义)
必须加入身份锁定句:“Same person as @Image1. Do not alter facial proportions, eye shape, or hairstyle.”
中文提示词技巧(极其重大)
Seedance由字节跳动开发,中文训练数据更丰富。
在以下方面表现更稳定:
- 空间关系
- 材质表现
- 天气效果
- 建筑细节
操作提议:
- 先用英文写提示词
- 翻译成中文
- 两个版本都跑一遍
复杂物理场景(布料、雨、水、玻璃) 中文提示词一般更可靠
病毒内容策略:快,是唯一优势
Seedance最大的价值在于速度。
操作流程:
- 监控Polymarket等热点平台
- 抓住明星、政治、突发事件的即时热度
你只有几小时窗口期
步骤:
- 生成4–5个镜头
- 拼成30–50秒视频
- 立即发布
你是第一个发布视频的人 算法会优先推送(供给稀缺)
案例:Meek Mill事件
提示词示例:
“@Image1 as the first frame. 过肩镜头对着僧人。他向前倾,用温和语气说:‘我曾为这样的时刻祈祷。’烛光在脸上闪烁。他说完停顿。无音乐,仅环境声。4K, Ultra HD, Rich details, Sharp clarity, Cinematic texture, Natural colors, Stable picture.”
- 74词
- 图像锁定身份
- 文本驱动动作
多个片段拼接 → 完整视频
效果:观众几乎无法分辨是AI生成,传播速度极快——由于时机精准。
关于真人生成
CapCut对写实人类形象有严格限制,无法绕过。
团队通过另一套方法实现真实人物的一致性(包括上述Meek Mill案例)。完整流程仅在内部社区分享。





