在剧本拆解必修课一文中分享了对剧本的核心元素(角色、场景、道具及特效)以及分镜表的拆分~
这份笔记的核心任务就是基于剧本拆解中拆出的角色、场景、道具、特效清单,通过豆包、即梦两大工具生图,包括人物三视图、主要场景图、道具图及特效图,为后续生成分镜图片提供精准素材,核心要求是“图纸贴合拆分清单、风格统一、细节达标”~
一、课程核心目标
1.熟练掌握豆包、即梦生成各类生图的操作流程,能结合剧本拆解的画面描述精准编辑提示词,实现“文字需求→可视化图纸”的高效转化
注意:【如果是使用的飞书,可以试试调用字段捷径,选择合适的模型,依据画面描述自动生成提示词;如果你的拆镜用的是豆包,也可以根据豆包生成的描述尝试生成,不合适的话直接对话调整~】
飞书操作示例:



2.明确人物三视图、场景图、道具图、特效图的生成标准,确保图纸细节贴合剧本设定,无偏差、无遗漏
二、核心生图内容及生成要求
生图均需严格遵循之前的拆分清单,保持整体风格统一(如奇幻、现实、悬疑等),避免素材风格割裂影响后续制作
整体风格这一卦,建议定风格时,参考一下市场上同类型的短剧是什么风格~
(一)人物三视图
1.核心要求:需包含正面、侧面、背面三个视角,精准还原角色发型、服饰、神态、标志性动作及细节特征(如配饰、服饰纹路),比例协调、人设统一
2.关键要点:明确角色身份与性格对应的视觉元素,标注不同场景下的情绪状态差异,避免三视图细节不一致
3.实操步骤:
(1)整理了人物小传
人物小传一:江福宝
江福宝:视觉年龄 3 岁,女主,现代社畜,善良,聪明,独立,性格坚韧,不内耗,有仇必报,作为中医的她因加班熬药,过劳猝死,穿越到天灵国江家村的同名三岁女童身上,深受家里人的宠爱,这让从小是孤儿的江福宝,感受到家的温暖,她决定用自身携带出租屋的空间和能听动植物的金手指,让全家人过上好日子
(2)生成对应角色卡
(3)补充重要信息
身份及时代背景与人物的外貌,服饰风格要保持一致,比如:这是农户,就不能是华丽服饰,必须符合人物设定
(4)给出生图示例(角色设计示例)
(5)生成的图片把人物三视图,表情,姿态全在一张图上,使用即梦进行拆分,拆为纯色背景三视图及表情图
根据人物小传,生成对应角色卡片:
【角色名】
【视觉年龄】
【性别】
【身份/时代背景】
【核心性格关键词】
【外貌关键词】
【服饰风格关键词】
【关键设定/金手指】
【生图提示词(全身,白底)】
【三视图提示词】
■ 正面:
■ 侧面:
■ 背面:
重点补充信息:
一、身份及时代背景与人物的外貌,服饰风格要保持一致,比如:这是农户,就不能是华丽服饰,必须符合人物设定
二、生图提示词务必要详细,可参照下方要求:
进行角色设计(Character Design),画面风格:3D修仙风格UE5渲染,根据【角色卡】,依次生成【比例设定表】【模型设定表】【表情设定表】【姿态设定表】:
角色卡【陈闲|男主|科学修仙的社畜阁主
– 画面风格:CG风格修仙、国产CG动漫
– 身份定位:前互联网社畜程序员,加班猝死后穿越成修仙界“天机阁”阁主,用绩效、KPI、PPT当法宝,开创科学修仙。
– 性格特点:表面佛系懒散、能坐绝不站,嘴上不停吐槽,是摸鱼大师;内心算得极清楚,关键时刻秒切认真模式,擅长拆解问题、制定流程,情绪稳定到离谱。对“瞎忙”“无效努力”极度厌恶,信奉“少干蠢事胜过多干苦力”。
– 外形&服装:黑色碎发,总有几缕乱翘,清秀却长期疲惫感拉满。上身黑色T恤、外罩绣有电路灵纹的深色长袍,下身牛仔裤,脚踩“灵力运动鞋”,一眼就与古风修士格格不入。
– 标志道具:魔改玉简,看似古朴实则像智能手机,会弹出PPT、思维导图;随身马克笔,能在空气和地面画出流程图、公式,字迹短暂化作灵光,直指修炼本质。
– 典型金句:“别用战术上的勤奋,掩盖你战略上的懒惰——这是修仙,不是搬砖。” 】
1. 【比例设定表】(Proportion Sheet)画面风格:3D修仙风格UE5渲染
– ·展示角色身高对比、身体主要比例结构(头身比1:7)。
2. 【模型设定表】 / 三视图(Model Sheet / Turnaround)画面风格:3D修仙风格UE5渲染
– ·标准正交视图:正面、侧面、背面。
3. 【表情设定表】(Expression Sheet)画面风格:3D修仙风格UE5渲染
– ·在3×3表格中展示角色的9种不同的面部表情与情绪。
4. 【姿态设定表】 / 动作设定表(Pose Sheet / Action Sheet)画面风格:3D修仙风格UE5渲染
– ·在3×3表格中展示角色的9种不同姿势、代表性动态动作、代表性特写,体现性格、运动特征、对应经典金句
根据提示词即可出图:

不难看出,豆包直出的效果也有不少瑕疵,比如人物的表情跟姿势设定出图效果其实并不好,有可能是提示词的要求太多,在一张图上呈现确实是有难度的!
因此,建议大家三视图及表情姿势图最好是分开出~不过豆包出的主人物效果都不错,可以通过即梦把人物三视图扒出来~


因为有直接提供角色卡跟人物表情姿势等生成的提示词,以至于大家都没有认真思考过,为什么短剧需要生成这些而不仅仅只是人物的正面整体形象图
这一点其实是为了在短剧中很好地保持人物一致性,毕竟视频人物是动态的,在图片中提供的细节越多,后面出问题的概率就越低~
我也是在后期同学们的分享中才知道有很多一键生成三视图的工具,比如oiioii跟seko等,大多是一键出视频的平台,它们都是直接使用的三视图
由此可见,要做短剧视频,人物还得是三视图才行~但是当时不知道啊!所以全靠十几个小时的抽卡,对于坑点已经麻木了~
个人感觉,想要稳定的画风用豆包出(优点是发挥很稳,不管多少人物,一个对话中,画风超级温,但是对应的缺点就是像个犟种,你让改变一点点,哪怕是大的变化,它都修改的很保守,所以我的三视图是豆包出的),即梦就是创意性多一点,但动不动就脱离掌控,适合出想象力构建不出来的画面~
(二)主要场景图
1.核心要求:聚焦核心场景,还原场景类型、整体氛围、核心布景及光影特点,明确核心区域与次要区域的视觉层次,贴合剧情适配性
2.关键要点:控制场景细节复杂度,兼顾美观与后续分镜适配(不宜过于繁琐导致分镜图杂乱),光影效果需服务于场景氛围(如诡异场景用低饱和光影)
3.实操步骤:
(1)根据场景生图提示词抽卡(提示词依旧是根据分镜表中的“画面描述”,利用AI工具进行编辑)
(2)难点:场景的多角度出图
这个多视角出图,需要根据(1)中抽取的合适的基础图为底图,将这个问题先抛给AI

即梦出图效果:

其实各种出图工具都可以进行上面的尝试,但是效果不一,按需选择自己满意的角度图即可,可以多次抽卡获取足量图片~



(三)道具图
1.核心要求:核心道具需多角度展示(正面、侧面、使用状态),标注颜色、材质、形状及与角色/剧情的关联细节,次要道具明确基础样式即可
2.关键要点:道具尺寸需与角色、场景比例协调,避免出现尺寸失衡问题,核心道具的细节精度直接影响后续分镜图真实感
3.提示词+出图
道具–Prompt提示词
基于道具参考图的结构(保持完全一致性),生成1张16:9比例专业道具设计三视图组合图;
每张图包含正面整体、侧面整体、背面整体的标准正交视图,背景为纯浅白基底/无阴影,无人物/场景/多余元素,排版专业有设计感,清晰呈现道具设计特征

(四)特效图
1.核心要求:还原特效名称、触发场景、视觉风格、颜色及动态逻辑,呈现静态效果图时需标注动态方向(如魔法特效的扩散方向)
2.关键要点:贴合短剧快节奏特性,特效不宜复杂冗余,视觉效果需与场景、角色适配,避免喧宾夺主,优先保证辨识度
3.提示词+出图

建议:很多时候特效表述精准,因此,建议小伙伴们使用图片反推,让AI替你生成提示词进行生图~

三、工具实操:豆包+即梦使用说明及注意事项
(一)豆包(AI生成+提示词优化工具)
1.核心用途
适合生成人物三视图、简单道具图及特效示意图,同时可辅助优化提示词(针对即梦生图效果不佳的提示词,用豆包调整精准度),适配小白快速上手
2.操作流程
(1)提示词构建:基于拆分清单,按“核心元素+细节描述+风格要求+视角要求”构建提示词
(2)生成操作:打开豆包,选择“图像生成”功能,粘贴提示词,设置图片尺寸(主要是为了格式统一),点击生成;
(3)效果调整:若生成图细节偏差,在原提示词基础上补充修正,重新生成
3.注意事项
(1)提示词需精准具体,避免模糊表述(如不说“好看的衣服”,而说“白色衬衫+黑色西装裤,袖口有纽扣装饰”),细节越全,生成效果越贴合需求
(2)人物三视图生成时,需明确标注“三视图”及三个视角(明确正面、侧面、背面),否则易只生成单一视角
(3)避免一次添加过多元素,易导致生成图杂乱、比例失衡,可分步骤优化细节
(4)生成后及时保存原图,标注对应角色/道具名称,便于后续分类管理
(二)即梦(可视化生图工具,侧重场景与氛围呈现)
1.核心用途
适合生成主要场景图、复杂道具图及带氛围的特效图,画面质感与氛围营造优于豆包,适配需要强化视觉冲击力的素材
2.操作流程
(1)前期准备:打开即梦,登录账号,提前在本地创建素材文件夹(按“人物/场景/道具/特效”分类),便于生成后快速归档
(2)提示词输入:参考豆包优化后的提示词,补充氛围与光影描述
(3)参数设置:选择对应模型(4.5 4.1都可以试试),调整分辨率(建议最高分辨率,保证素材清晰度)
(4)生成与微调:点击生成,若氛围达标但细节不足,可使用“局部重绘”功能修正(如调整场景中道具位置、补充细节);若整体偏差大,优化提示词后重新生成
3.注意事项
(1)场景图生成时,需明确“室内/室外”“整体氛围”及核心布景,避免生成与清单不符的场景元素
(2)即梦生成速度略慢于豆包,复杂图生成需耐心等待,避免中途取消
(3)局部重绘时,精准框选需要调整的区域,提示词仅针对该区域补充
(三)两大工具适配场景总结
1.优先用豆包:人物三视图、简单道具图、提示词优化、快速生成初稿
2.优先用即梦:主要场景图、复杂道具图、带氛围的特效图、需要提升画面质感的素材
3.协同使用:用豆包构建基础提示词与初稿,用即梦优化细节与氛围,提升生图效率与质量
四、学习心得与实操总结
(一)核心心得
生图的核心是“提示词精准+工具适配”,拆分清单的细节精度直接决定生图效果,模糊的拆分内容再优化提示词也难以达标
豆包与即梦各有优势,协同使用能兼顾效率与质量,小白无需纠结单一工具,重点是根据素材类型选对工具、细化提示词
此外,生图过程中需反复调整优化,耐心打磨细节,才能生成符合后续制作需求的素材
(二)实操复盘
1.完成成果:生成对应剧本的人物三视图、主要场景图、核心道具图及特效图,按类别归档,素材风格统一、细节基本贴合拆分清单
2.核心问题:部分人物三视图侧面视角比例失衡,复杂场景图细节冗余(后续需优化提示词,减少非核心元素)
3.优化方向:多积累优秀提示词模板,针对性优化人物比例、场景细节的描述;练习即梦局部重绘、参数调整技巧,提升素材修正效率;生图前先预判难点,提前优化拆分清单细节
五、补充注意事项
1.所有生成图纸需统一风格,避免人物图为卡通风、场景图为写实风,导致后续分镜图割裂;
2.及时备份所有素材(本地+云端),避免误删,素材命名规范;
3.生图时保留提示词,后续同类素材可复用并优化(有可能需要连贯补图),提升生图效率;
4.若生成图与拆分清单偏差过大,先回溯调整拆分清单,再优化提示词生图,避免本末倒置
短剧生图的核心并非依赖单一工具,而是 “精准拆分 + 优质提示词 + 工具适配” 的组合!
对新手而言,无需追求复杂的操作,先做好拆分清单,再根据素材类型选对工具,细化提示词,就能生成贴合需求的素材
人物三视图重精准,场景图重氛围,道具图重比例,特效图重适配,按这套逻辑实操,能有效减少返工,为后续分镜制作和视频生成打下坚实基础。
随着生图经验的积累,不断优化提示词和工具使用技巧,就能逐步提升素材质量和效率,让AI短剧制作更顺畅~