AI 视频 Best Practice 周报 | 第 1 期(2026.04.01-04.07)

本期精选 5 条 AI 视频最佳实践:Kling 3.0 Motion Control 六步工作流、HeyGen Video Agent 完整脚本提示法、Runway 四段式框架,以及即梦的去 AI 痕迹工作流和一镜到底创作法。本周最大事件:Seedance 2.0 同时登上 Runway 和 HeyGen,多镜头多模态生成进入商业主流;FrameFusion 开源插帧模型发布。

AI 视频 Best Practice 周报
April 8, 2026 · 1:22 PM
0 subscriptions · 5 items

本周关键信号

两件事值得在这里单独说。
第一件:Seedance 2.0 在同一周内登上了 Runway 和 HeyGen。4 月 7 日 Runway 上线,4 月 6 日 HeyGen 发布 Avatar Shots——同一个基础模型,一周内被两个头部平台同时接入12。一个 prompt,支持文本、图像、视频、音频四种输入,输出带完整音效和对白的多镜头成片。这不是某一家平台的产品决策,而是行业在同一周集体押注了一套新的生成范式。
说一下实际可用情况:Runway 需要 Unlimited+ 计划,HeyGen 需要企业邮箱认证,目前美国用户都进不去。国内及其他非美国地区的创作者可以先跑起来。
第二件:10M 参数的开源视频插帧模型 FrameFusion 在 r/StableDiffusion 宣布开源3。37MB,ComfyUI 节点开箱即用,低端硬件可跑,无订阅。SaaS 订阅有点多的人可以看一眼。

主线一:工作流与提示词技巧

Kling 3.0 Motion Control:六步完整工作流

一句话价值:系统解决参考视频动作迁移时的面部漂移问题,第一帧质量合格的情况下成功率可达 90% 以上。
把一段舞蹈的动作"嫁接"到一张角色图——听起来直接,但大量创作者卡在面部融化和动作方向混乱两个坑里。Kling 3.0 新增的面部元素绑定功能专门处理这个问题,但正确用法要按顺序走完六步4
Step 1 准备参考视频:3-10 秒,单人,相机稳定(三脚架拍摄),光线均匀,第一帧中性姿势且面部清晰。多人物和手持抖动是最常见的失败来源。第一帧质量是输出成功率最大的预测因子——光线干净加起始姿势清晰,成功率可超过 90%4
Step 2 角色图片:全身可见,四肢无裁剪,风格与目标输出匹配。
Step 3 面部绑定(Kling 3.0 独有功能,不该跳过):额外上传最多 4 张不同角度的角色面部参考图,推荐配置——正面朝前中性表情、左 45°、右 45°,有抬头动作的再加一张微仰视角。实测在 14 秒复杂手部动作中实现了零身份漂移4
Step 4 场景源与朝向设置:舞蹈和动作内容选「视频朝向」(最长 30 秒),品牌内容和 AI 头像选「图片朝向」(最长 10 秒)。舞蹈内容建议打开 keepOriginalSound,保留参考视频原始音频,节拍对齐会自然很多。
Step 5 写提示词——整个流程里最反直觉的一步:
提示词不能描述动作。参考视频已经控制了所有运动,提示词只负责场景、氛围和光线。
关键提示词示例
✅ 正确:电影感布光、霓虹夜店、体积雾、浅景深
❌ 错误:一个女人充满活力地跳舞,做手部动作(与参考视频冲突,干扰模型)
Step 6 先用 Standard 模式验证动作节奏,确认无误后切 Pro 模式输出。穿搭选择上,格子和棋盘格图案容易出闪烁,缎面和 PVC 效果最稳定4

Kling 3.0 Motion Control 工作流可视化:骨骼追踪与角色面部绑定示意
Kling 3.0 Motion Control 工作流可视化:骨骼追踪与角色面部绑定示意

HeyGen Video Agent:把完整脚本直接当提示词

一句话价值:用整段脚本替代简短描述作为提示词,Video Agent 逐场景执行脚本内容,同时自动优化节奏和视觉,省掉逐帧手动指定的工作5
大多数人用 Video Agent 的方式是写两句话:"帮我做一个介绍 X 产品的两分钟视频。"结果往往是通用模板感明显。官方提示词指南里最核心的一条:上下文越多,输出越精准。把整段脚本粘进去——Video Agent 会按场景跟随脚本,只对语法和节奏做小幅调整,内容控制权还在你手里。
官方推荐在所有提示词里追加这段通用视觉优化模板5
关键提示词/参数(通用视觉模板,建议加入所有提示词):
Use minimal, clean styled visuals. Blue, black, and white as main colors.
Leverage motion graphics as B-rolls and A-roll overlays. Use AI videos when necessary.
When real-world footage is needed, use Stock Media. Include an intro sequence,
outro sequence, and chapter breaks using Motion Graphics.
需要精准品牌色时,直接用色值指定,避免不同场景风格混乱5
Use #1E40AF as primary blue, #F8FAFC as background white, and #0F172A for text.
Use Inter font family throughout.
媒体类型选择原则:动态图形做数据展示和章节切换,AI 生成视频做概念场景和产品样机,库存素材做真实场景和定场镜头。
来源:HeyGen 官方博客 · heygen.com/blog/video-agent-prompt-guide

Runway 四段式提示词框架(附 92 条现成提示词)

一句话价值:用标准化的四段式写 AI 视频提示词,解决镜头乱飘和细节失控,可直接套用官方整理的 92 条分类提示词6
Runway 官方资源库给出的通用结构:
[镜头运动] + [场景] + [动作] + [细节]
几个高频踩坑点6
  • 写"无镜头抖动" → 改为 Smooth, stable camera movement(用正向描述)
  • 一段 prompt 塞多个动作 → 每条只控制一个,时长 5-10 秒
  • 出现 "then"、"next" → 全部删掉,每段 prompt 独立处理
一个典型示例:
Slow dolly forward through foggy forest. Ancient redwood trees on both sides,
moss-covered trunks. Figure in red raincoat walks away from camera.
Morning light shafts piercing through fog.
官方资源库里有 92 条现成分类提示词,覆盖电影级镜头、产品演示、社交热门内容、转场特效等八大类。已整理好的直接复制,比自己从头写快很多。
来源:Runway 官方资源库 · runwayml.com/resources/ai-video-prompting-guide

AI 视频提示词工程工作站:多屏提示词结构与镜头运动参数图示
AI 视频提示词工程工作站:多屏提示词结构与镜头运动参数图示

主线二:风格化与创意方法

即梦 + 剪映:三步去 AI 痕迹工作流

一句话价值:即梦生成高清素材,剪映画质增强洗掉 AI 闪烁和色偏,三步输出接近实拍质感的成片7
AI 生成视频有几个几乎无法完全避免的问题:轻微帧间闪烁、过度饱和的色彩,以及那种说不清楚但一眼能认出来的 AI 质感。这个三步工作流通过工具接力来处理这些问题7
Step 1 即梦生成写实素材:视频比例 9:16 或 16:9,清晰度 1080P,参考图片强度 0.8-0.9(高值提升细节还原度)。找到满意效果后固定 Seed 值,保证后续批次一致。
Step 2 剪映修复:AI 去噪增强画质、降低饱和度、加入轻微胶片颗粒感、修复闪烁帧。这一步的核心是把 AI 过于完美的色彩往"有轻微缺陷的真实感"方向推。
Step 3 导出成片:色调偏低饱和度,加轻微暖色,接近手机摄像头的自然质感。
逻辑简单:当即梦生成的画面细节足够好,"去 AI 感"的工作量集中在色彩校正和噪点,而不是完整重拍。这套流程在国内中短视频创作场景里复用率很高。
来源:微信公众号 AI 视频创作者 · mp.weixin.qq.com/s?__biz=MzY5NDEwODc0NA==&mid=2247487348

即梦 AI 一镜到底创作效果:从室内到室外的沉浸式镜头过渡,以及婴儿到老人的时光流逝场景
即梦 AI 一镜到底创作效果:从室内到室外的沉浸式镜头过渡,以及婴儿到老人的时光流逝场景

即梦 AI「一镜到底」场景创作法

一句话价值:在提示词里明确指定空间或时间连续性,驱动即梦生成具有沉浸感的长镜头视频,适合 Vlog、科普和情感类内容8
即梦支持单次生成最长 25 秒的视频。一镜到底的优势不只是视觉噱头——空间和时间的连续穿越能给观众更强的代入感,比普通剪辑自然很多。以下是实测可用的提示词8
关键提示词/参数
20秒竖屏视频,9:16,无字幕,沉浸风格,从卧室到阳台一镜到底,穿越房门,阳光逐渐变亮,动作自然,画面流畅。
25秒横屏视频,16:9,无字幕,科普风格,从微观细胞到宏观人体一镜到底,画面清晰,细节丰富,适合科普类创作。
18秒竖屏视频,9:16,无字幕,时光风格,从婴儿到老人成长一镜到底,人物形象渐变,背景同步变化,治愈感拉满。
参数配置要点:视频比例和时长在提示词里写清楚(9:16 竖屏 / 16:9 横屏),默认清晰度选 1080P;找到满意效果后固定 Seed 值,后续生成保持一致风格8
来源:CSDN 即梦实测汇总 · blog.csdn.net/q951250246/article/details/159083965

本周工具动态

Seedance 2.0 双端上线(Runway + HeyGen)
Runway 4 月 7 日上线 Seedance 2.0,支持文本、图像、视频、音频四种输入,生成带音效和对白的多镜头视频序列,适用于 Unlimited 及以上计划(美国用户暂不开放)1。HeyGen 4 月 6 日推出 Avatar Shots(Seedance 2.0 驱动),数字分身可以进入多镜头电影级场景,Video Agent 里单条 prompt 生成最长 3 分钟的完整视频2
两个平台在同一周接入同一基础模型,对创作者的直接影响:SaaS 演示和品牌宣传片的"说话头"格式现在可以升级成多镜头完整场景,不需要额外拍摄预算。
FrameFusion 开源视频插帧
个人开发者 BurguerJohn 开源 FrameFusion 视频插帧模型,参数量不足 10M,fp32 格式下文件仅 37MB,同时在真人实拍和动漫数据上训练3。ComfyUI 自定义节点和极简工作流文件都在仓库里,可以本地离线使用。需要提升 AI 生成视频帧率的创作者,目前成本最低的本地化选项。

下周值得关注

Seedance 2.0 本周刚上线,下周 r/runwayml 和 r/heygen 会开始涌现第一批真实用户的测试结果——参数踩坑、提示词优化、失败案例都会出来,比官方介绍更有参考价值。FrameFusion 在 ComfyUI 社区的集成进度也值得跟,复杂工作流很快就会有人跑出来。

Add more perspectives or context around this Post.

  • Sign in to comment.