你有没有过这样的经历:脑子里有一个画面感极强的故事,但打开 AI 生图工具,憋了半天只会写”赛博朋克,雨夜,男人,霓虹灯,8k”?
结果出来的图,男人可能站在霓虹灯上面,雨也不知道下在哪里。
今天这篇文章,就是帮你彻底告别”关键词抽卡”的时代。
我会先用最短的篇幅讲清楚 Gemini 分镜提示词的核心方法论,然后直接给你一套可复制粘贴、立即能用的「夜晚街头人物九宫格分镜」提示词。
拿走,不谢。
先搞清楚一件事:Gemini 不吃关键词,它吃故事
老一代 AI 画图,本质是”标签匹配”。你输入的每个逗号隔开的词,都是往池子里扔一个元素,模型负责拼凑。
Gemini 不一样。
它底层是大语言模型,能读懂句子。它知道”雨水在前景中形成模糊的线条”和”雨水在背景里”是两回事。它能理解主谓宾,能区分因果关系。
所以,别再写标签式的提示词了,写一段话。
坏的写法:
赛博朋克,雨夜,霓虹灯,男人,奔跑,8k,虚幻引擎渲染

好的写法:
在一个赛博朋克风格的雨夜,一名身穿黑色风衣的男子在霓虹灯闪烁的湿滑街道上狂奔。雨水在前景中形成了模糊的线条,背景是高耸入云的钢铁建筑。

第二种写法看着长,但模型能精确分配每个元素的图层关系——谁在前景、谁在背景、谁在动、谁是静的。
这就是 Gemini 时代提示词的第一原则:用叙事代替标签。
四个东西写对了,出图就不会太差
行业里管它叫”四大支柱”,听着唬人,其实就四个问题:
1. 你是谁(角色设定)
告诉 Gemini 它的身份。别小看这一步,一句”你是一位拥有 20 年经验的好莱坞分镜师”,就能让输出的构图从”AI味”变成”电影感”。
2. 做什么(具体任务)
“生成一张图”太模糊。要写成:”根据以下剧本片段,生成一张 16:9 的电影级分镜,使用中景构图。”
3. 背景是什么(上下文)
这是画面的”Why”。补一句”这是主角刚经历重大失败后的深夜”,模型就会自动把光线压暗、色调偏冷。

4. 交付格式(物理规格)
画幅比例、是否需要文字、是否需要特定排版。说清楚,不给模型发挥的余地。
每张分镜图的万能公式
把上面的理论压缩成一行公式,每次写提示词照着套就行:
主体 + 动作 + 环境 + 镜头语言 + 风格氛围
举个例子:
一位 25 岁的亚洲青年男性(主体),
正站在便利店橱窗前凝视窗内(动作),
深夜的雨后街道,地面反射着荧光灯的暖色(环境),
中景平视构图,半身被暖光照亮、半身被冷青色阴影吞没(镜头语言),
电影级 Teal-and-Orange 调色,Kodak Vision3 500T 胶片颗粒感(风格氛围)。

注意几个细节:
- 主体要具象。不是”一个男人”,是”25 岁、短发微乱、穿深色连帽卫衣、背旧帆布包的亚洲青年”。
- 动作要用强动词。不是”在街上”,是”正倾身狂奔”或”双手插兜低头行走”。
- 情感别写抽象的。”悲伤”不行,要写”双肩下垂,目光呆滞地盯着地面,脸上有未干的泪痕”。
模型画不出”伟大”和”正义”,但它能画出一个”在路灯下拉长影子的孤独背影”。
用镜头语言让画面有”导演感”
这是区分”AI出图”和”AI分镜“的分水岭。
同一个场景,换一个景别,情绪天差地别。
Gemini 在训练时已经学过大量摄影元数据,所以你只需要像导演一样说人话,它就能执行。
景别速查表
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
角度速查表
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
光线速查表
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
记住:不要写”好看的光线”,要写”伦勃朗光,打火机火焰在左脸形成暖橙三角”。
越具体,AI 越老实。
角色一致性:分镜的终极痛点
做一张图容易,做九张风格统一、同一个人的图——这才是真难。
纯靠文字描述,哪怕你一个字不改,换个动作模型就给你换张脸。
解决方案叫”锚定与枢轴“,三步走:
第一步:生成角色基准图
用下面这段提示词,反复生成直到出一张满意的”基准脸”。这张图就是你整套九宫格的”人物身份证”。
一位约 25 岁的亚洲青年男性的正面半身肖像照。
短发微乱、被雨水打湿,身材精瘦,下颌线条分明,肤色自然偏暖。
穿深灰色棉质连帽卫衣(帽子放下),黑色直筒裤,
斜挎一个旧橄榄绿帆布包,包上有一个黄铜搭扣。
表情是安静的疲惫与内省,目光直视镜头。
拍摄方式:85mm 人像定焦镜头,f/2.0 光圈,
柔和的影棚灯光搭配微弱的冷青色辅助光,
干净的深灰色背景,浅景深,
面部细节极致清晰——皮肤纹理、毛孔、眉毛走向均可见。
电影级质感,Kodak Vision3 500T 胶片颗粒感。
1:1 画幅比例。

- 关键:这张图只有一个目的——把脸”定死”。所以背景要干净、光线要均匀、正面平视、表情中性。不要加任何花哨的场景,越朴素越稳定。
第二步:上传为参考图
把这张满意的图上传到 Gemini,勾选”作为参考”。Gemini 是原生多模态模型,它会把这张图的特征编码成数学约束——后续生成的每一帧都会被这张脸”锁死”。
第三步:枢轴扭转
后续的提示词只需要描述新场景和新动作,角色身份被参考图锁死了。
同时记得在每帧提示词里加一句保险:
- “指令红线:绝对保持面部解剖结构、发型与固有肤色特征不变。”
如果连续生成几十帧后,脸开始崩——别硬撑。换背影、过肩镜头、全景、剪影。用电影语言掩盖技术短板,有时候效果反而更高级。
实战:夜晚街头人物九宫格分镜
理论讲完了。下面是可以直接复制使用的完整提示词。
主题设定
「漫游者 / NIGHT WALKER」
一位 25 岁的亚洲青年,深夜独自行走在霓虹闪烁的雨后街头。情感弧线从迷茫压抑,经过沉思驻足,最终走向微光中的释然。
九宫格布局一览
┌───────────┬───────────┬───────────┐
│ 左上 │ 中上 │ 右上 │
│ 城市天际线 │ 霓虹招牌 │ 雨巷背影 │
│ 极远景 │ 极大特写 │ 远景 │
├───────────┼───────────┼───────────┤
│ 左中 │ 中中 │ 右中 │
│ 侧脸点烟 │ 积水倒影 │ 便利店光 │
│ 中近景 │ 低角度 │ 中景 │
├───────────┼───────────┼───────────┤
│ 左下 │ 中下 │ 右下 │
│ 天桥俯拍 │ 回眸特写 │ 路灯剪影 │
│ 高角度 │ 特写 │ 远景 │
└───────────┴───────────┴───────────┘
情感弧线设计
帧1 城市全景 → 冷漠、庞大
帧2 霓虹特写 → 疏离、赛博感
帧3 雨巷背影 → 孤独、迷失
帧4 侧脸点烟 → 沉思、挣扎
帧5 积水倒影 → 自我碎裂
帧6 便利店前 → 短暂温暖 ← 情绪开始转折
帧7 天桥俯拍 → 渺小感
帧8 回眸微笑 → 释然、接纳 ← 核心转折点
帧9 路灯剪影 → 余韵、继续前行
角色参考图使用说明
在生成下面每一帧之前,你需要先完成两件事:
- 用上面的角色基准图提示词生成一张满意的人物正面照
- 把这张图上传到 Gemini 对话中,勾选”作为参考”
完成后,后续每帧提示词的开头都会有一行[上传角色基准图,勾选”作为参考”]的提示——意思是确保你的对话中已经上传了参考图。如果你是在同一个对话窗口中连续生成,只需要上传一次就够了。
统一风格后缀(每帧都要加)
这段话是”画面统一的保险丝”,每次生成都贴在提示词最后面。
视觉风格:电影级新黑色风格,带赛博朋克霓虹美学。
模拟 Kodak Vision3 500T 钨丝灯平衡电影胶片,带明显有机颗粒感。
Teal-and-Orange 互补色调色,深黑色压低,
中间调去饱和但霓虹重点色选择性穿透。
浅景深配奶油般的六边形散景光斑。
雨水放大所有表面的反射。
沉郁、大气、深度城市感、情感共鸣。16:9 画幅比例。
九帧独立提示词
以下每帧都可以独立使用,生成后手动拼成九宫格。
帧 1:城市天际线(极远景 · 建立世界观)
极远景建城镜头,展现雨后夜晚一座庞大的亚洲都市天际线全景。无数摩天大楼刺穿低垂的云层,窗户发出微弱的琥珀色和青色光芒。湿润的屋顶反射着零碎的霓虹灯光,形成电蓝色和品红色的光条。画面中没有人物出现。使用 16mm 广角镜头拍摄,深景深,捕捉无尽的城市细节。
[粘贴风格后缀]

- 这帧没有人物出现。它的作用是告诉观众:故事发生在一个庞大、冷漠、灯火辉煌的城市。
帧 2:霓虹招牌(极大特写 · 氛围渲染)
一块老旧霓虹招牌的极大特写,上面的中文字符部分闪烁不定。雨滴沿着温热的玻璃灯管表面缓缓滑落。浅景深将背景渲染为纯粹的抽象散景——品红色、电蓝色和暖琥珀色的光斑。使用微距镜头拍摄,极致聚焦于开裂的玻璃质感和透过水珠渗透出的温暖钨丝光。
[粘贴风格后缀]

- 纯氛围帧。用微距镜头把霓虹灯管的物理质感拉到极致,建立整套分镜的色彩基调:品红、电蓝、暖琥珀。
帧 3:雨巷背影(远景 · 孤独的视觉定义)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
远景,展现角色的背影,他独自走在一条狭窄的雨后深夜小巷中。小巷两侧是高耸的建筑,挂满缠绕交错的粉色和青色霓虹招牌。湿润的石板路面映射出头顶霓虹的长条闪烁倒影。他拉起了帽衫的帽子,身影微微佝偻,双肩向内收拢。构图采用对称的一点透视,将他置于巷道消失点的正中央。
[粘贴风格后缀]

- 经典分镜构图:一点透视 + 人物居中 + 背影。孤独感不需要语言,构图本身就在讲故事。
帧 4:侧脸点烟(中近景 · 沉思与挣扎)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
中近景,捕捉角色点烟时的左侧面。打火机的火焰在他的脸颊和鼻梁上投射出锐利的伦勃朗式暖橙色光三角,而脸的另一侧则完全沉入不可穿透的深邃阴影中。一缕烟丝向上卷曲,被上方看不见的霓虹招牌泻下的冰冷蓝色溢光所捕获。他双眼半闭,目光低垂,明显透着疲惫。侧面 45 度角拍摄,经典的明暗对比布光。
[粘贴风格后缀]

- 这帧是光影设计的重头戏。打火机的暖橙 vs 霓虹的冷蓝,分割在同一张脸上——冷暖矛盾就是内心矛盾的外化。
帧 5:积水倒影(极低角度 · 自我碎裂)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
极低角度拍摄,相机几乎贴在湿润的地面上,向上仰拍。前景被一个浅浅的积水洼占据,它如同一面镜子,映射出头顶霓虹招牌和建筑立面的混乱倒影——品红色、电蓝色和金色交织成生动而扭曲的水彩画般的反射。角色的深色皮靴和黑色裤脚站在水洼的远端边缘,他的倒影被轻柔的涟漪碎裂扭曲。
[粘贴风格后缀]

- 把相机放到地面上,用水洼当镜子。倒影被水纹扭曲——这是”自我迷失”最直观的视觉隐喻。不需要脸,一双鞋和一面碎裂的倒影就够了。
帧 6:便利店驻足(中景 · 短暂的人间温暖)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
中景,角色静静站在一家灯火明亮的日式便利店前的深夜街头。温暖的荧光灯光从玻璃幕墙内透出,洒在湿润的人行道上,在地面形成一个柔和的琥珀色暖光矩形。他站在这道光的边界线上——半身被舒适的钨丝暖光照亮,另外半身被街道冰冷的蓝青色阴影吞没。他凝视着橱窗内部,眼神中带着安静的渴望。
[粘贴风格后缀]

- 全片九帧里最温暖的一帧。便利店那道光是整个冰冷城市里唯一的暖色面光源。人站在暖光和冷影的分界线上——想走进去,又没有。
帧 7:天桥俯拍(高角度 · 被城市吞噬)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
高角度正俯视拍摄,镜头从人行天桥上方垂直向下看去。角色是远处下方一个渺小的孤独身影,正独自穿越一个宽阔空旷、雨水映射的十字路口。白色虚线道路标线和斑马线在深色湿润的沥青路面上形成鲜明的几何图案。他微小的影子在唯一一盏钠蒸气路灯下被拉得很长。
[粘贴风格后缀]

- 俯拍让人显得渺小。几何道路标线 + 空旷路口 + 一个小小的人影 = 被巨大城市机器碾压的无力感。
帧 8:回眸微笑(特写 · 情感转折点)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
亲密的面部特写,角色在深夜街头转过头,越过肩膀直视观众。一个微弱但真挚的、疲惫却平和的微笑浮现在他的嘴角。他深色的眼睛中映射出一个微小的暖琥珀色光点。一滴雨水沿着他的太阳穴划出一道痕迹。背景被渲染成奶油般梦幻的虚焦霓虹散景旋涡——粉色、金色和青色的柔和光球。使用 85mm 人像定焦镜头、f/1.4 大光圈拍摄,实现最大程度的主体分离。
[粘贴风格后缀]

- 这是全套九帧的灵魂。 前七帧压了那么久的情绪,在这里用一个”疲惫但平静的微笑”一次性释放。85mm f/1.4 把背景化成梦幻光斑,所有注意力都集中在那个微笑上。
帧 9:路灯剪影(远景 · 故事落幕)
[上传角色基准图,勾选”作为参考”]
严格参照上传的角色参考图,保持面部特征、发型与肤色不变。
远景,角色背对观众沿着一条笔直空旷的长大道远行。大道两侧是等距排列的高大路灯,每盏都向下投射出一个温暖的钠橙色锥形光柱。他位于画面正中央,被渲染为一个干净的深色剪影,映衬在最远处路灯的金色逆光之上。湿润的路面将重复的路灯光锥倒映出一种有节奏感的图案,一直延伸到无限远处。一层薄雾低低垂着,将远处的灯光柔化成空灵的光晕。
[粘贴风格后缀]

- 最后一帧不需要看清脸。一个剪影、一条无限延伸的路、重复的路灯光锥——他带着自己的孤独和释然,继续走下去。故事没有结局,但画面本身就是最好的句号。
一次性生成整张九宫格拼贴的完整提示词
如果你使用的模型支持一次性生成九宫格拼贴(而不是逐帧生成),可以直接使用以下完整提示词。这是一整段话,不要拆开:
一张精心制作的电影级拼贴画,包含九张独立的方形照片,以 3×3 网格排列在深炭灰色、带有细微纹理的画布背景上,每张照片之间用带有微弱青色辉光的深色细边框分隔。画面描绘一位年轻的亚洲男性独自漫步在雨后霓虹闪烁的深夜城市街头的各种场景,整体充满浓郁的氛围感、沉郁情绪与强烈的电影级新黑色美学。
左上图是一张极远景建城镜头,展现雨后夜晚一座庞大的亚洲都市天际线全景。无数摩天大楼刺穿低垂的云层,窗户发出微弱的琥珀色和青色光芒。湿润的屋顶反射着零碎的霓虹灯光,形成电蓝色和品红色的光条。画面中没有人物出现。使用 16mm 广角镜头拍摄,深景深,捕捉无尽的城市细节。
中上图是一块老旧霓虹招牌的极大特写,上面的中文字符部分闪烁不定。雨滴沿着温热的玻璃灯管表面缓缓滑落。浅景深将背景渲染为纯粹的抽象散景——品红色、电蓝色和暖琥珀色的光斑。使用微距镜头拍摄,极致聚焦于开裂的玻璃质感和透过水珠渗透出的温暖钨丝光。
右上图以远景展现这位年轻亚洲男性的背影,他独自走在一条狭窄的雨后小巷中。小巷两侧是高耸的建筑,挂满缠绕交错的粉色和青色霓虹招牌。湿润的石板路面如同镜面,映射出头顶霓虹灯的长条闪烁倒影。他穿着深炭灰色连帽卫衣,帽子拉起,黑色直筒裤,斜挎一个旧帆布包。身影微微佝偻,双肩向内收拢。构图采用对称的一点透视,将他置于巷道消失点的正中央。
左中图是一张中近景,捕捉年轻男子点烟时的左侧面。打火机的火焰在他的脸颊和鼻梁上投射出锐利的伦勃朗式暖橙色光三角,而脸的另一侧则完全沉入不可穿透的深邃阴影中。一缕烟丝向上卷曲,被上方看不见的霓虹招牌泻下的冰冷蓝色溢光所捕获。他双眼半闭,目光低垂,明显透着疲惫。经典的明暗对比布光。
中中图从极低角度拍摄,相机几乎贴在湿润的地面上。前景被一个浅浅的积水洼占据,它如同一面镜子,映射出头顶霓虹招牌和建筑立面的混乱倒影——品红色、电蓝色和金色交织成生动而扭曲的水彩画般的反射。年轻男子的深色皮靴和黑色裤脚站在水洼的远端边缘,他的倒影被轻柔的涟漪碎裂扭曲。
右中图是一张中景,年轻男子静静站在一家灯火明亮的日式便利店前。温暖的荧光灯光从玻璃幕墙内透出,洒在湿润的人行道上,在地面形成一个柔和的琥珀色暖光矩形。他站在这道光的边界线上——半身被舒适的钨丝暖光照亮,另外半身被街道冰冷的蓝青色阴影吞没——他凝视着橱窗内部,眼神中带着安静的渴望。
左下图从高角度正俯视拍摄,镜头从人行天桥上方垂直向下看去。年轻男子是远处下方一个渺小的孤独身影,正独自穿越一个宽阔空旷、雨水映射的十字路口。白色虚线道路标线和斑马线在深色湿润的沥青路面上形成鲜明的几何图案。他微小的影子在唯一一盏钠蒸气路灯下被拉得很长,营造出深刻的孤立感与脆弱感。
中下图是一张亲密的面部特写,年轻男子转过头,越过肩膀直视观众。一个微弱但真挚的、疲惫却平和的微笑浮现在他的嘴角。他深色的眼睛中映射出一个微小的暖琥珀色光点。一滴雨水沿着他的太阳穴划出一道痕迹。背景被渲染成奶油般梦幻的虚焦霓虹散景旋涡——粉色、金色和青色的柔和光球。使用 85mm 人像定焦镜头、f/1.4 大光圈拍摄,实现最大程度的主体分离。
右下图是一张远景,年轻男子背对观众沿着一条笔直空旷的长大道远行。大道两侧是等距排列的高大路灯,每盏都向下投射出一个温暖的钠橙色锥形光柱。他位于画面正中央,被渲染为一个干净的深色剪影,映衬在最远处路灯的金色逆光之上。湿润的路面将重复的路灯光锥倒映出一种有节奏感的图案,一直延伸到无限远处。一层薄雾低低垂着,将远处的灯光柔化成空灵的光晕。
整体构图体现真实的电影级街头摄影风格:沉郁、大气、深度城市感、充满情感共鸣,带有新黑色美学。每张照片保持精确的 1:1 画幅比例,整体拼贴大致呈方形。以城市人工夜间照明为主:冰冷的电蓝色、品红色和青色霓虹溢光,与温暖的钠橙色路灯和便利店荧光灯交织。特写画面采用明暗对比与伦勃朗布光。模拟 Kodak Vision3 500T 电影胶片的明显有机颗粒感。浅至中等景深,配以奶油般的六边形散景光斑。Teal-and-Orange 互补色电影调色,深黑色压低,中间调去饱和,霓虹重点色选择性穿透。

- 记得上传参考图哦~
做分镜九宫格的完整工作流
最后总结一下从零到成品的完整步骤:
第一步:定角色
写好角色锚定文本,反复生成一张满意的”基准脸”。
第二步:定风格
确定风格后缀(我上面给的那段),锁死色彩体系和质感。
第三步:拆场景
按情感弧线把故事拆成 9 个视觉节拍,每帧一个情绪、一个动作。
第四步:配镜头
每个场景分配景别(远/中/近/特写)+ 角度(平视/俯/仰)+ 光线类型。
第五步:逐帧生成
把角色锚定 + 场景描述 + 风格后缀拼起来,一帧一帧生成。每帧确认后再生成下一帧。
第六步:拼贴成图
用任何拼图工具(Canva、Figma、甚至 PPT)拼成 3×3 九宫格,加上标题和署名。
或者,如果你的模型支持,直接用完整提示词一步到位。
可以直接替换的变体方向
同一套框架,换个主题就是一套新的九宫格:
|
|
|
|
|
|---|---|---|---|
| 雨天咖啡馆 |
|
|
|
| 深夜末班车 |
|
|
|
| 凌晨天台 |
|
|
|
| 老街漫步 |
|
|
|
写在最后
AI分镜的本质不是让模型帮你画画,而是你用文字当导筒,用提示词当场面调度,把脑子里的电影一帧帧拍出来。
模型只是你的摄影师。你才是导演。
而一个好导演,永远知道自己要什么。