如何用AI创作人物角色设计全流程实操手册(附提示词模板)

我们在之前的文章中聊了怎么从思路层面打造一个独一无二的角色——怎么找视觉锚点、怎么明确性格特征、怎么让你的角色不只是”好看”而是”有辨识度”。

AI短剧制作全攻略,手把手教会你设计爆款AI短剧角色技巧

那篇更像是在解决”想”的问题。

这篇,我们来解决”做”的问题。

你已经知道自己的角色应该是什么气质、什么调性了,但打开生图工具,输入提示词,出来的图总是差点意思。要么脸长得千篇一律,要么换个角度人就”变脸”了,要么衣服对了但整体感觉不对。

这些问题其实不是你审美有问题,也不是工具不行,多数时候是流程没跑对。

角色形象设计是有一套完整流程的。这套流程的目的只有一个:让你的角色在任何场景、任何角度下,看起来都是”同一个人”。

这篇文章会把整个流程拆开,每一步该做什么、为什么这么做、常见的坑怎么绕,全部讲清楚。你不需要是专业设计师,跟着一步一步走就行。

1.先搞清楚”角色设计图”长什么样

在正式开始之前,我们得先对齐一个基本认知:角色形象设计图到底应该长什么样?

很多人一上来就急着生图,恨不得第一张就出一个电影质感的场景大片——角色站在雨夜的霓虹灯下,光影交错,氛围感拉满。

好看吗?确实好看。但这不是设计图,这是”成片”。

角色形象设计图的核心任务不是好看,而是把这个人的长相、身材、穿搭准确地定义下来,让后续所有的生图工作都能以它为基准。所以它需要尽可能”干净”,排除一切干扰因素。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

示例角色形象设计图

具体来说,三个基本原则:

  • 纯色背景。 不要加任何场景元素。白色、浅灰色都可以。背景越干净,模型在后续识别角色特征时就越不容易被干扰。你加一面红砖墙,模型可能会把砖墙的纹理也当成角色信息的一部分来学习,下次生图的时候莫名其妙带出类似的色调或纹理。
  • 平拍视角。 就是正常平视的角度,镜头和人物视线基本齐平。不要俯拍、不要仰拍、不要搞什么荷兰角。角度一倾斜,人物的五官比例和身体比例在画面中就会产生透视变形,模型读取到的信息就不准了。
  • 平光。 均匀的、没有明显方向性的光线,类似于证件照的打光方式。不要侧光、不要逆光、不要顶光。光影本身会改变五官的观感——同一张脸,侧光打上去颧骨显高、眼窝显深,看起来就像换了个人。你希望模型记住的是这个角色”本来的样子”,而不是”某种光线下的样子”。

简单总结一下:你可以把角色设计图理解成一张”标准照”。它不追求氛围感,不追求艺术性,它追求的是信息传达的准确和稳定。所有的氛围、场景、光影,都是后面进入实际创作阶段才需要考虑的事情。

先把”人”定下来,再把”人”放进”故事”里。顺序不能反。

2.从一张脸开始——角色设计的完整流程

好,进入正题。角色形象设计的完整流程,拆开来其实就是三步:

面部特写 → 正面全身照 → 四视图

每一步都有它明确的任务,顺序也不能乱来。我们一步一步讲。

第一步:面部特写

很多人习惯一上来就生全身照,觉得这样效率更高,一张图就能把脸和身材全定了。

但你会发现一个问题:当画面里要同时兼顾脸部细节和全身比例时,模型的”注意力”是分散的。五官不够精细,表情不够到位,整体出来的脸往往比较”泛”,缺乏记忆点。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

左右两侧效果图均使用了同一套面部特征提示词,左侧为单独设计面部的效果,右侧为全身图放大至同等大小时的效果

所以第一步,只做脸。

生成一张面部特写,让模型把所有的精力都花在这张脸上。眉眼间距、鼻梁高度、嘴唇厚度、脸型轮廓、皮肤质感——这些细节在特写里才能被充分表达。

你需要在这一步反复调整,直到生成一张你真正满意的脸。这张脸会成为后续所有工作的”基准脸”,后面不管是全身照还是四视图,人物的面部特征都要以它为锚。

不要着急,这一步值得你花最多的时间。

第二步:正面全身照

脸定下来之后,下一步是生成一张正面站立的全身照。

这一步的核心任务是把角色的身材比例和基础穿搭确定下来。身高、体型、肩宽、腿长,以及角色的日常着装风格,都在这张图里交代清楚。

注意,这里说的是”正面”,不是四分之三侧,不是随意的站姿。就是最朴素的、面朝镜头的站立姿态。原因和上一部分讲的一样——减少变量,让信息尽可能准确。

生成的时候,把第一步确定好的面部特写作为参考输入,确保脸不要跑偏。全身照出来之后,重点检查一件事:这张全身照里的脸,和你第一步定好的脸,还像不像同一个人?如果差异太大,宁可重新生成,也不要将就。

这一步是把角色从”一张脸”变成”一个人”。

通用提示词模板:

基于给定的人物面部参考图,生成人物正面全身形象设计图。严格保持参考图中的面部特征、五官比例、脸型、发型、发色和人物辨识度不变。人物为正面站立姿势,全身完整入镜,从头到脚清晰可见,清晰展示人物整体身材比例、服装、鞋子。平拍视角,平光照明,光线均匀,无明显阴影遮挡。纯色简约背景,背景干净无干扰元素。

第三步:四视图

四视图就是把面部特写和全身多角度(正面、侧面、背面)组合在同一张画面里。

为什么全身照做完了还不够,还要再做这一步?

因为全身照是”远景”,面部信息在整个画面中占比很小。你自己看的时候觉得脸没问题,但对于模型来说,它从一张全身图里能提取到的面部细节其实是有限的。尤其是在后续做视频生成的时候,一旦镜头推到特写景别,模型手头的面部参考信息不够用,脸就容易”飘”——五官开始变形,或者干脆长成了另一个人。

四视图的意义就在于,把高清的面部特写和全身多角度信息打包在一张图里。模型拿到这一张图,既能看清脸长什么样,又能知道这个人从正面、侧面、背面分别是什么样子。远景近景的信息都有了,后续不管生成什么景别的画面,都有据可依。

你可以用拼图工具手动拼合,也可以在生图时直接用提示词描述四视图的排布方式。具体用哪种方式取决于你使用的工具,但最终的标准就一个:一张图里,脸看得清,全身看得全,正侧背都有。

通用提示词模板:

生成一张角色设定图,基于参考图,将面部特写人物全身三视图整合在同一画面中,画幅比例16:9
画面布局为:最左侧放置人物面部超大特写;右侧依次排列人物全身正面图、全身侧面图、全身后视图
人物全身完整入镜,从头到脚清晰可见,纯色简约背景,平拍视角,均匀光照。
各视图中的人物必须保持同一角色身份,确保脸部特征、发型、服装、配饰、身材比例高度一致,不同视图仅改变观察角度。
整体呈现应清晰、规整,适合作为角色形象设定图/三视图展示图

一个贯穿全程的原则:始终使用同一个图片模型

从面部特写到四视图,整个过程建议你自始至终使用同一个图片生成模型,不要中途换。

不同模型对提示词的理解方式不同,对人物特征的渲染逻辑也不同。哪怕你用完全一样的提示词,模型A出来的脸和模型B出来的脸就是会有微妙的差异——肤色的色调不一样,五官的风格化程度不一样,甚至身体比例的默认偏好都不一样。

中途换模型,就像同一个角色换了画师。画师水平可能都很高,但画风不统一,放在一起看就是会觉得不协调。所以在开始之前,先选好一个你用着顺手的模型,然后从头用到尾。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

3.关于”脸”的那些事

流程讲完了,但如果你真的上手操作过,应该已经体会到了——整个流程里最折磨人的环节,就是第一步。

生成一张满意的脸,远比你想象的要难。

这一步你大概率会遇到几个典型问题,我们挨个来说说怎么处理。

“我能不能找一张明星的照片做参考?”

不能。

这个问题必须说在最前面,因为确实很多人第一反应就是这么干。觉得自己想要的角色气质接近某个明星,直接拿张照片垫进去,快速又省事。

但这条路走不通。用真人明星的面部特征去生成角色形象,存在肖像权和相关法律风险。哪怕你做了一定程度的修改,只要最终结果和真人有明显的可辨认相似度,风险就一直在。尤其当你的内容是要公开发布的,这不是一个值得赌的事情。

“AI生成的脸怎么都长得差不多?”

这是第二个几乎所有人都会遇到的问题。

你换了很多组提示词,出了几十张图,结果脸和脸之间的差异小得可怜。不是说它们完全一样,但总有一种”同一个模子刻出来”的感觉——类似的眼间距,类似的鼻型,类似的脸部脂肪分布。你心里想的是一个有辨识度的、”这个人就是这个人”的脸,出来的却总是一张”谁都像又谁都不像”的平均脸。

这不是你提示词的问题,是模型的问题。图片生成模型在训练时学习了大量人脸数据,它对”好看的脸”会形成一个统计意义上的”最优解”。当你的提示词没有给出非常强烈的、偏离这个最优解的指令时,它就会本能地向那个均值靠拢。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

要打破这个均值,首先你得知道怎么把一张脸”拆”成具体的维度去描述。很多人写面部提示词只会写”好看的””精致的””有气质的”,这些词对模型来说约等于什么都没说。你需要给模型的是结构性的信息——一张脸由哪些部分组成,每个部分长什么样。

给你一个写面部提示词时可以参照的框架:

  • 脸型与骨骼结构: 这是一张脸的”底盘”。脸型是圆脸、方脸、鹅蛋脸还是菱形脸?颧骨是高还是平?下颌线是锋利的还是柔和的?下巴是尖的、圆的,还是略微前突的?这些决定了一张脸的基本轮廓和硬朗/柔美程度。
  • 眉眼区域: 往往是一张脸最出信息量的部分。眉形是平直的、挑起的还是弯的?眉毛浓密还是细淡?眉骨是否突出?眼睛的形状是圆眼、杏眼、丹凤眼还是桃花眼?眼间距是偏宽还是偏窄?双眼皮还是单眼皮?眼窝深邃还是平坦?瞳色是什么颜色?这些细节的组合几乎可以定义一个人给人的第一印象。
  • 鼻子: 鼻梁高度、鼻翼宽窄、鼻头的圆润或尖挺、鼻子的整体长度。鼻子是五官的中轴线,它的形态直接影响整张脸的立体感。
  • 嘴唇: 上唇和下唇的厚薄比例、唇峰是否明显、嘴角的自然朝向(微微上扬还是平直)、嘴巴的整体大小。
  • 皮肤: 肤色的具体色调(不只是”白”或”黑”,试试”小麦色””冷白皮””橄榄色”这样更精确的描述)、皮肤质感(光滑的、有纹理的、有雀斑的)。
  • 发型: 长度、卷直、发色、分线方式、刘海的有无和形态、整体蓬松度。发型对脸部观感的影响非常大,同一张脸换个发型可能气质完全不同。

你不需要每次都把所有维度写全,但至少要覆盖其中三到四个关键维度,并且在每个维度上给出明确的、具体的描述,而不是笼统的形容词。

越具体、越”不完美”的特征描述,越能帮助模型跳出那张平均脸。比如”略宽的鼻翼”就比”挺拔的鼻子”有用得多,因为前者是一个明确的结构偏移,后者只是在强化模型已有的审美默认值。

“提示词怎么调都不满意,怎么办?”

如果你已经换了很多种描述方式,跑了足够多的轮次,还是没有一张脸让你觉得”就是他/她”,那说明单靠提示词可能已经到达瓶颈了。

这时候不要死磕,引入手动修图的流程。

具体做法是:先从你生成的所有结果里,挑一张最接近你预期的。不需要完美,七八分满意就够了。然后把这张图拿到修图工具里,手动微调那些你不满意的地方。

你不需要PS技术多好,这种程度的微调,大部分修图工具甚至手机App就能搞定。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

关于脸的问题,核心就一句话:提示词能解决的就用提示词解决,提示词解决不了的,不要硬撑,动手修。工具是拿来配合你的,不是拿来限制你的。

4.穿什么衣服,比你想的复杂一点

脸定好了,全身比例定好了,接下来是穿搭。

很多人觉得服装设计是整个流程里最简单的一步——不就是想好角色穿什么,写进提示词就完了吗?

没那么简单。这里面有一个容易踩的坑,和一套值得了解的方法。

先说那个坑:不要直接搬电商平台上的衣服

这是一个非常常见的操作路径:打开某宝某多,搜到一件觉得适合角色的衣服,把商品图保存下来当参考图喂给模型。

看起来效率很高,但有侵权风险。

电商平台上的服装商品图本身是有版权的,而服装的原创设计也可能受到知识产权保护。你直接用商品图做参考,生成出来的结果很可能高度还原了原版设计的核心特征——版型、图案、配色组合、标志性的设计细节。一旦作品公开发布并获得了一定传播量,这些特征是可以被追溯比对的。

你可能觉得”AI生成的又不是原图,能有什么问题”,但问题不在于是不是原图,而在于生成结果是否构成对原创设计的实质性相似。这是一条模糊地带,而模糊地带意味着风险不可控。

所以,服装参考的正确方式,不是”搬款”,而是”提取设计语言”。

什么叫”提取设计语言”?

你看到一件衣服觉得”这个感觉对了”,先别急着存图。停下来想一想,它到底哪里打动了你?

通常来说,一件衣服的视觉印象可以拆解成几个核心要素:

  • 配色。 它用了什么颜色?是高饱和的撞色,还是低饱和的同色系?主色和辅色的比例大概是什么样的?颜色之间的关系是对比还是渐变?
  • 廓形。 也就是衣服穿在身上之后的整体轮廓。是修身收腰的H型,还是宽松的oversize?肩线是落肩还是正肩?下摆是收紧还是展开?廓形决定了一件衣服传达出来的气质——干练、慵懒、硬朗、柔软,很大程度上是由廓形说了算的。
  • 材质感。 是挺括的西装面料,还是垂坠的丝绸质感?是粗粝的牛仔,还是柔软的针织?材质影响的是衣服在画面里的”质感信息”,它会让角色看起来更贵气还是更日常、更正式还是更随意。
  • 设计细节的类型,而非具体细节本身。 这件衣服有没有领子?是什么类型的领?有没有口袋的设计?袖口是什么样的?注意,你要提取的是”翻领””插袋””泡泡袖”这种设计类型,而不是去复刻那件衣服上某个具体的图案或者独创的剪裁手法。

把这几个要素拆解出来之后,你就可以用纯文字描述的方式写进提示词里,不需要任何参考图。比如你原本看中了一件”卡其色亚麻质感的宽松西装外套,落肩设计,搭配同色系阔腿裤”,那你提示词里就写这些描述本身,而不是喂那张商品图。

这样做,你借鉴了那件衣服带给你的灵感,但生成出来的结果是模型基于你的文字描述自行组合的,不会和任何一件具体的商品构成实质相似。

善用”提示词反推”来辅助拆解

如果你觉得自己拆解设计语言的能力还不够熟练,有一个好用的技巧:把你看中的衣服图片丢给大语言模型,让它帮你做提示词反推。

你不是把图片当参考图去生图,而是让语言模型帮你”读”这张图——告诉你这件衣服的配色是什么、廓形属于哪种类型、材质看起来像什么、有哪些设计元素。模型会帮你把一件具体的衣服翻译成一段结构化的文字描述。

拿到这段描述之后,你再根据角色的性格和故事背景做调整——改改颜色,换换材质,加减一些细节——最终写出一段属于你这个角色的、不指向任何具体商品的服装描述。

这个过程的本质是:用那件衣服当灵感触发点,但你最终交给生图模型的,是你自己消化重组之后的设计语言,而不是那件衣服本身。

如何用AI创作人物角色设计全流程实操手册(附提示词模板)

左:参考图,右:反推提示词生成图片

最后一点:角色的穿搭要服务于角色

这句话听起来像废话,但实际操作中很多人会忘记。

很容易出现的情况是,你刷到一件很好看的衣服,觉得太适合拿来用了,就硬塞给角色。但这件衣服可能和角色的职业不搭、和角色的经济状况不搭、和故事发生的时代背景不搭。

在确定角色穿搭之前,回头看看你在上一篇文章里给角色做的设定:他是什么性格?什么职业?什么经济条件?日常活动场景是什么?一个在工地搬砖的角色和一个在写字楼上班的角色,穿衣风格不可能一样。不是说工地角色不能穿得好看,而是”好看”的具体表现形式得和角色的生活逻辑对得上。

服装是角色性格的外延,不是创作者个人审美的展览。

5.角色不是一成不变的——根据剧本调整外表

前面所有的步骤,做出来的是角色的”基础形象”——这个人在故事开始时、在最日常的状态下长什么样。

但故事是流动的。你的角色可能要换工作、换季节、经历一场变故、或者只是赴一场重要的约。如果从头到尾只有一套外表,观众看到的就不是一个活人,是一个纸片人。

所以你需要根据剧本,为角色在不同阶段生成不同的外表版本。

核心方法:在全身正面照的基础上局部编辑

不需要每换一套衣服就从头跑一遍完整流程。你已经有了一张确定好的全身正面照,这张图里包含了角色的脸、身材比例和基础体态——这些东西在大多数情况下是不变的。你要做的,只是在这张图的基础上,用局部编辑(inpainting)或图生图的方式,只改你需要改的部分。

这样做最大的好处是:身材比例被原图锁死了,不会因为换一件衣服人就突然变高变瘦或者肩宽变了。整体结构稳定,只有表面在变化,这才是同一个人换了身行头该有的样子。

关键前提:必须明确告诉模型,什么不能动

这一点非常重要。如果你只写”把衣服换成西装”,模型很可能在换衣服的同时顺手把脸也微调了——眼睛大了一点,下巴尖了一点,肤色偏了一点。每一处变化都很小,但加在一起,这个人就不是原来那个人了。

所以每次做阶段性外表调整的时候,你的提示词里要同时包含两部分信息:要改什么,以及绝对不能改什么。后者甚至比前者更重要。

这里给你一个通用的约束模板,你可以根据实际需要修改方括号里的内容,直接复制使用:

保持以下特征完全不变:人物面部五官、面部轮廓、肤色、发型、发色、身材比例、身高体型、站姿体态。

仅修改以下内容:[具体描述你要改的部分,例如:将上衣替换为深灰色圆领毛衣,下装替换为黑色直筒长裤,鞋子替换为深棕色皮靴]。

其余画面元素(纯色背景、平拍视角、均匀光线)保持不变。

模板的逻辑很简单:先画一条红线,把不能动的东西全部锁死;再在红线以内,精确描述你要修改的内容;最后确保设计图的基本规范不被破坏。

几个使用建议:

  • 每次改完都要对比检查。 把修改后的图和基础形象放在一起看,重点看脸有没有变化。不要只看”新衣服对不对”,要先确认”这还是不是同一个人”。如果脸飘了,这张图就不能用,重新生成。
  • 为每个阶段单独保存一张标准参考图。 改好之后,这张图就是这个阶段的”官方形象”。后续这个阶段的所有场景图都以它为参考,不要每次临时调,那样同一个阶段内部也会出现前后不一致的问题。

6.写在最后

到这里,整个角色形象设计的流程就讲完了。

我们回过头来看一眼走过的路:先理解设计图的基本规范是什么、为什么要那样做,然后从一张面部特写起步,一步一步推进到全身照、四视图,中间处理了关于脸的各种棘手问题,想清楚了衣服该怎么找参考,最后学会了怎么在一个稳定的基础形象上做阶段性的调整。

流程不复杂,但每一步都有它的讲究。而这些讲究指向的都是同一件事:让你的角色在任何画面里,都像同一个人。

一致性这个东西,做到了观众不会注意到,做不到观众一眼就出戏。它不是加分项,是及格线。

最后想说的是,不要指望一次就做出完美的角色形象。第一次跑完全流程,你大概率会觉得哪里都不太满意。这很正常。角色设计本身就是一个反复调整、逐步逼近的过程。你对角色的理解会随着创作的深入越来越清晰,你对工具的掌控也会越来越熟练。第一版不完美,就去改。改到第三版第四版的时候,你会发现这个角色开始真正像一个”人”了。

去试吧。打开你的工具,从一张脸开始。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
百科

AI短剧制作全攻略,手把手教会你设计爆款AI短剧角色技巧

2026-6-15 16:46:28

百科

AI写小说软件推荐,这10款AI工具帮你实现

2025-2-5 9:18:25

搜索