最近有人问,现在到底能不能用AI工具做出像样的流畅的清晰的AI电影视频呢?”
“那些抖音快手上某些博主发的利用AI生成的微电影,难不成非得会用高大上假大空的软件配合才能做出来吗?”

其实完全不是这么回事,很多AI工具制作出来的微短片,微电影流量数据一样都是很不错的。
为了让大家一次学明白,把目前最稳定、成本最低、效果最靠谱的一套 AI 微电影工作流跑通了,这次特地虚构了一个国产末日科幻题材的AI短片案例:《余烬长安》。
咱们今天就用这个AI短片案例,把制作一部 10 分钟微电影的流程,从头到尾,一步步给你进行拆解,你准备好了吗?走着瞧着!

一、前期准备:准备好我们的工具箱
工欲善其事,必先利其器,这次会用到的 AI 工具大概是这些:
- 写故事(大脑): ChatGPT 4.0 / Claude(逻辑强、能写分镜)
- 画画面(眼睛): Midjourney(目前画质天花板)
- 做视频(肢体): 可灵AI(Kling) / Luma(让图片动起来)
- 做配音(嘴巴): 剪映专业版 / ElevenLabs
- 做配乐(耳朵): Suno(几秒钟写一首电影BGM)
二、搞定剧本 + 分镜
微电影最重要的是故事架构,10 分钟的小片,结构必须清晰,
打开 ChatGPT,输入下面这个中文提示词即可:

💡 ChatGPT 中文提示词:
“你现在是一位获得过奥斯卡的科幻电影编剧,请你为我构思一部名为《余烬长安》的 10 分钟微电影剧本。
世界观:
2088 年,击沉团灭日本后经历核战废墟般的长安,被风沙和变异植物覆盖,赛博朋克光影与古建残骸混在一起。
主角:
林默,30 岁,沉默寡言的废土拾荒者,穿着经过改造的汉服机能装。
核心冲突:
他在钟楼废墟下挖到一颗“未被污染的绿色种子”,却被机械野兽盯上。
请输出:
- 可以拍成 10 分钟短片的详细剧本。
- 一份结构化【分镜表】:包含场号、景别、画面描述、运镜方式、音效或旁白。
- 画面描述要非常有画面感,方便我后续做图。”
ChatGPT 会自动给你生成完整的剧本 + 分镜表,也算是相当于给你搭好了整个微电影的“框架”。

三、用 Midjourney 把画面定死
做 AI 微电影最怕什么?就是那种第一张图像吴彦祖,下一张像彭于晏。
所以这一步的关键是:先确定角色长相,再用这个角色,持续生成所有镜头。
1)先做主角“林默”的定妆照
下面是转换成中文后的 MJ 提示词(你可直接用,也可以转换成英文来用):
🎨 Midjourney 主角提示词(中文):
“一张电影级镜头。角色是一位叫林默的中国男性,30 岁,穿着未来感的破旧汉服机能装,脖子挂着防毒面具,脸上有尘土,眼神锐利。背景是荒漠化的废土城市。画面有电影光影,高级质感,清晰细节,16:9。”

生成多张后,挑你最喜欢的那张。这就是你的主角“角色参考图”。
2)生成分镜画面(记得兼顾好人物一致性)
比如“钟楼废墟”的场景:
🎨 MJ 场景提示词(中文):
“超广角镜头,2088 年的长安钟楼废墟,沙尘满天,巨大变异藤蔓缠绕古建筑,故障闪烁的霓虹中文招牌,空气中漂浮尘埃,电影级光影,16:9。”
再比如“林默发现种子”:
🎨 MJ 镜头提示词(中文):
“中景镜头,林默蹲下看着沙土中发光的绿色幼芽,机械义肢的手轻轻拨开灰尘,环境昏黄,光束照向植物,浅景深,电影氛围,16:9。
(使用角色参考图锁定脸部一致性)”

💡 小技巧:
- 一定使用角色参考功能,不然人物会变脸
- 画幅统一用 16:9
- 光影尽量保持同一风格(电影才不会跳戏)
四、让图片动起来:这一步我们用 可灵AI来做“图生视频”。
流程很简单:
- 点击“图生视频”
- 上传刚才在 MJ 生成的图片
- 填写中文提示词(告诉 AI 怎么动)

可灵中文提示词示例:
“画面保持电影质感,镜头缓慢推进到发光的绿色幼芽。林默的手轻微颤动,他伸手触碰叶片,尘土随动作缓缓飘起。光线柔和,不要夸张动作。”
❌ 负面提示(可选):
“不要畸变、不要多余手指、不要穿模、不要突然跳动。”
⚠️ 避坑:
- 动作写太大,人会扭曲
- 初学者只要拍“轻微动作”和“运镜”,就够稳
- 大场景选“平移/拉远”,人物特写选“轻微推镜”

五、Suno + 配音,画面有了,声音就是灵魂。
1)Suno 做背景音乐
🎵 Suno 中文提示词:
“电影配乐,偏史诗感。鼓点厚重,古筝混合电子音色,氛围紧张又苍凉,有反乌托邦风格。不要人声,纯音乐。”
可以生成 2 首,挑更配情绪的那一首即可。
2)旁白 / 配音
如果想简单点:
用 剪映专业版 → 解说 → 男声(低沉)
如果想更专业:
ElevenLabs 选一个沙哑一点的角色,调低“稳定性”,让语气更自然。
六、打开剪映或 PR完成最后的剪辑合成:
- 先铺 BGM
- 把每个片段按分镜排序
- 需要说话的地方可上口型同步(HeyGen / SadTalker)
- 套 LUT + 加黑边,电影质感立马上去
- 加字幕、调节音量,完工!

AI 时代,一个人就是一支完整的制作团队,你会发现,用 AI 做 10 分钟微电影,其实就是深刻的理解好一句话,做好下面这个流程:
- GPT 写故事 → MJ 画画面 → 可灵做动态 → Suno 做音乐 → 剪映合成。
真正决定影片质感的不是工具,而是你的 审美 + 想象力 + 分镜思维。
第一次做的话,我建议大家先从 30 秒短片 起步,熟悉流程后,再慢慢升级到 5 分钟、10 分钟,像写剧本故事这些,大家也可以用豆包或者元宝都行,用不了国外的,就可以找国内的作为替代,有时候生成效果欠佳,那就多试几次,只有跑通了整个流程,后续再做才能更好的优化细节,AI制作微电影的思路就和大家分享这么多了。