有人问 Seedance 2.0 The reality video过审。这个问题,我们前段时间真被折腾过。
图片看着没问题,上传后生成视频真人审核卡住,换个角度,还是卡。

后来经过不断测试与实战沉淀,大概了解了一些方法,真人过审不要只盯着脸,先把角色做成一套 AI 原创资产,让平台知道它是角色设定,不是一张真人肖像照。
这篇不写万能公式,也不保证百分百能过,因为模型底层规则也在不断动态变化。
下面这 5 个办法,是我们一直在用的,适合做 AI 真人短剧的人直接照着试。
方法一:先做全身三视图,不要上来就怼脸
很多人第一次做真人短剧角色,最容易犯的错就是把脸做得太大。

脸越大,越像一张真人照片,审核压力也越大。
你自己看着清楚,平台也看得更清楚。
我们现在更常用全身三视图。
正面、侧面、背面先跑出来,脚部完整入画,双手自然下垂,服装、鞋子、发型、发饰都能交代清楚。

这样做有两个好处。
第一,角色不再只靠一张脸来识别。
第二,Seedance 2.0 后面做视频时,可以同时看到体型、服装轮廓、鞋履和发型这些信息。
我们内部则是用专门的 Gem 生成一些设定,辅助设计形象。
可以先用这个提示词骨架:
●●●Terminal
真人影视写实风格,角色概念定妆照,全身镜头,正面拍摄,简洁纯白浅灰背景。
展示全身及脚部,站立姿态,双手自然下垂,没有任何表情。
角色为[年龄、性别、身份],[身高体型],[发型发色],[服装材质与颜色],[鞋履描述],[发饰或配饰]。
人物皮肤与细节真实自然,均匀柔光,画面干净,不要文字,不要水印,不要多余人物。
如果你只想先测能不能过审,就别一开始搞九宫格和脸部特写。
先拿全身三视图去试,很多时候已经够了。
方法二:脸放远一点,用中景和细节图补信息
全身图有一个问题,脸部信息会少一点。
这时候不要马上补一张大脸特写。
更稳的做法,是补腰部以上的中景,脸大概占画面的五分之一左右。
这个比例够模型认人,也不会让整张图变成纯人脸实拍。
我们自己会把全身三视图、中景半身、鞋子或服装细节放在一起。
比如古装短剧里,发冠、袖口、衣摆、鞋子这些有必要的也能放进去,seedance2.0 的参考生成能力还是比较好的。
很多时候模型记住角色,不只靠脸,也靠整套造型。
如果你前面总是卡审核,可以按这个顺序降风险:
●●●Terminal
第一轮:全身三视图。
第二轮:全身三视图 + 腰部以上中景。
第三轮:全身三视图 + 中景 + 鞋履、袖口、发饰等局部细节。

这里不用把搞得太玄乎,也不用收藏一堆提示词。
核心就一句话,别让脸成为整张图唯一的信息。
方法三:先从剧本里提角色、场景、道具,再生成资产
很多过审教程会直接给一大段提示词,让你复制去跑。
这当然有用,但真做短剧时,角色不是凭空来的。
一个人物的年龄、身份、欲望、困境、服装、站姿,应该从剧本里展现出来。
我们会先让 AI 从故事里提三类资产:人物、场景、道具。
人物先做定妆图,场景做勘景图,道具做纯白底特写。
可以直接用这段:
●●●Terminal
你是一个 AI 出图设计师。根据这个故事剧本,帮我罗列出所有资产,包括人物、场景、道具。
请输出这些内容的 AI 出图提示词,要求是真人写实风格。
人物提示词必须是全身正面白底,要有鞋子的描述。
人物不要拿任何东西,双手自然下垂,全身站立。
角色形象提示词要描述身高、体型、年龄、发型、发色、服装、脸型、眼睛。
场景设计不能有人,并且根据角色站位至少生成正反打两个场景图提示词和一个侧面全景图提示词。
道具提示词必须纯白底,不要有背景和任何人物。
这一段看起来没有像标题党那么刺激,但做项目会很省事。

你后面做 Seedance 2.0,不是在喂一张孤零零的人脸,你是在喂一套短剧资产,角色、场景、道具都在,模型才有东西可去理解和生成。
方法四:平台别死磕,先用更好的路径跑通
真人审核这里,别把自己耗死。
如果你在一个平台上反复被卡,不一定非要一直卡在那里。
像 LibTV、TapNow 这类更偏 AI 创作流程的平台,对 AI 生成图和 Seedance 2.0 的接入会方便一点。
比如 LibTV,有专门的 seedance2.0 合规校验,审核过了有图标显示,非常方便。

我们的建议很简单。
先把作品做出来,再回头优化质量。
前段时间,我们也被真人审核卡过很久。
后来发现,很多时间其实耗在非创作问题上。
不是剧本不好,不是镜头想不出来,就是一张图来回不过。
所以我们中间可以借用四宫格、九宫格等各种方式,先把作品做出来,别一直卡在真人审核。

如果你就是想用即梦,也可以。
按前面三步来,先做 AI 原创角色资产,少用脸部大特写,多用全身三视图、中景和场景资产。
平台只是路径,别让路径变成项目本身。
方法五:Seedance 提示词写成短剧现场
视频提示词也会影响审核。
我不建议这样写:
●●●Terminal
A 图片人物在 B 场景里,模仿 C 视频人物动作。
这种写法容易让模型理解成真人动作迁移。
更适合短剧的写法,是把它写成一个正在拍摄的镜头:
●●●Terminal
古装宅斗真人短剧,9:16 竖屏,电影级写实质感。
侯府正厅内,年轻主母站在木桌旁,神情克制,眼神冷静。
镜头从中景缓慢推进到近景,她轻轻抬手整理袖口,压住情绪后开口说话。
室内暖色烛光,背景是中式木质屏风和茶案,画面干净,无字幕,无水印,只生成环境声和人物动作声。
我们给 Seedance 2.0 的基础公式主要是像下面这样:
●●●Terminal
运镜 + 景别 + 角度 + 主体描述 + 运动描述 + 环境氛围
这套公式适合新手,因为它会逼你把镜头说清楚。
Seedance 2.0 很强,但你不能只给它一句让这个人动起来,然后期待它懂你的短剧。
15 秒之后,怎么接成长视频?
真人过审只是第一关。
后面还有一个更实际的问题:Seedance 2.0 一段通常只有几秒到十几秒,怎么做一集完整短剧?
我们的做法是拆批次。
每个批次 5 到 15 秒,只表现一个小事件。
台词要算时长,超过 20 个汉字就要小心,超过 30 个汉字尽量拆成说话镜头、反应镜头、道具特写或者画外音。
比如一场对话戏,不要把所有台词都塞进一段视频。
先拍角色 A 开口,再拍角色 B 的反应,再切桌上的对牌或钥匙,画外音接一句,最后回到角色 B 的表情。
这时候 Seedance 2.0 才好用。
它不是一次帮你生成一整集,它更适合帮你把一段一段素材做出来。
at last
真人过审是很烦,但它不该占掉你大部分时间。
能用全身三视图,就别先怼脸。
能用中景和局部细节补信息,就别急着做超近脸部特写。
能用 LibTV、TapNow 这类更方便的路径跑通,就先把片子做出来。
做 AI 真人短剧,最后拼的还是故事能不能连续,角色能不能稳定,镜头能不能接上,情绪能不能推进。
过审只是门口那一步。
在门口别卡太久,后面还有一整集要拍。