Flux Kontext 可以通过自然语言对图片进行修改,它不仅能在保持角色一致性、场景一致的前提下对图片进行局部精确修改,还可以连续修改。
可以说 Kontext 是目前最强的多模态模型了,甚至GPT4o在它面前都不遑多让。

最主要的是, Flux Kontext 目前推出了免费开源的dev版本,功能无敌又免费,谁能不爱呢?
Kontext应用场景演示
打开comfyUI,从模板打开 flux 官方示例工作流。这里提供了两个示例工作流,本质上是一样的,我们打开第一个进行演示。

巧用官方“提示词技巧”写提示词
打开模板后,官方给了一个提示词使用技巧,我们可以好好利用一下。

复制这个提示词技巧,来到豆包、deepseek、通义等大语言模型,告诉它这些是 flux kontext 提示词,我想让你学习它的使用方法,你要是明白了回复明白,我会使用了。
我把提示词给了通义大模型,它很容易就理解了提示词的用法。
后面,我们就可以让通义帮我写 kontext 提示词了。

1、去除水印:
告诉通义,让它根据flux kontext 提示词规则,帮我写一个提示词:移除画面中的水印。

将通义给的提示词粘贴到Kontext工作流中的CLIP文本编码器里,上传一张满是水印的图片,点击运行,它就可以把图片上的水印完美移除。

2、提取元素:
告诉通义,提取右则拿枪的机器人角色,删除其他内容,背景设为白色。
通义不仅帮我写出了提示词,还告诉我提示词为什么这么写。

将提示词粘贴到文本编码器,上传一张两个机器人的图片,Kontext准确地将右面的红色机器人提取了出来。

3、角色转换角度
让通义写一个把“摄像机顺时针旋转90度,展示兔子的侧面图”的提示词

将提示词粘贴到文本编码器,同时上传一张兔子的正面图片,点击运行后,我们得到了一张兔子侧面的图片。

4、连续修改:
点击加载图片节点的“refresh”,就会把刚刚生成的兔子侧面图片加载进来,这样我们只要再给新的提示词,就可以对刚刚生成的图片进行连续修改了。

这次我让通义帮我写的提示词是:画面主体不变,背景变成大草原

这样我们既完成了对图片的连续修改,也实现了主体不变,只对图片背景进行修改。

5、风格参考:
我告诉通义,我会先上传一张风格图片,请你根据flux kontext 提示词规则,帮我写一个提示词:参考我上传的图片风格,生成一个穿着盔甲,身材特别好的美女战士形象,女战士双手握剑,正在做攻击动作。

上传一张特殊风格的图片,然后粘贴刚刚通义生成的提示词
点击生成看下效果,完美复刻了参考图片的风格。

6、双图合并
flux kontext 默认有一个图片加载节点是被禁用的,开启它,同时上传两张图片,一个女人和一只鹅。
用通义写提示词:根据flux kontext 提示词规则,帮我写一个提示词:让女人怀里抱着这只鹅


本质上 kontext 生图也是在抽卡,效果对生成的图片不满意,可以多抽几张,直到满意为止。

放大图片观察,kontext将原图的高度进行了扩展,然后让女人抱起了鹅,整体上女人和鹅的一致性还是比较高的。不过kontext对双图的支持不是特别好,多图生图时的一致性不是很高,建议大家还是以单图为主。

7、移除背景
用通义写提示词:移除背景

通过提示词,很容易就移除了图片中除人物之外的背景。

我们也可以更进一步,让 kontext 在移除背景后,将背景设为白色。

8、风格转绘
让通义写提示词:根据flux kontext 提示词规则,帮我写一个提示词:将风格改为吉卜力风格

修改图片风格对 kontext 来说是小菜一碟,你还可以试着让它修改为其它类型的图片风格。

9、局部微调
如果想只对图片的局部进行修改,真正做到“指哪打哪”,我们需要对工作流稍加改造,同时还要用到遮罩功能,具体方法参见文章:
Flux Kontext 使用指南,两种方法实现AI图片精准局部重绘
用通义写提示词:根据flux kontext 提示词规则,帮我写一个提示词:将红色区域改成粉色花环

在图片中人物部分画上遮罩,Kontext 非常精确的让人物头上戴上了花环。

以上就是今天的全部内容。