What is FLUX.1 Kontext Pro?

According to Black Forest Labs, FLUX.1 Kontext [pro] is a previous-generation model that combines text-to-image generation with image editing.

Is Kontext Pro mainly an image generator or an image editor?

It can do both, but the strongest practical reason to choose it is prompt-based image editing with context preservation rather than generic from-scratch generation.

What can Kontext Pro officially do?

The official overview lists text-to-image, image editing, character consistency, text editing, and style transformation.

What does Black Forest Labs recommend for new projects?

The official docs recommend FLUX.2 for new image generation and editing projects.

How do text edits work in Kontext Pro?

The official docs recommend quotation marks around the exact text change, for example: Replace 'old text' with 'new text' .

Can Kontext Pro preserve the same character across multiple edits?

Yes. The official prompting guide explicitly presents character consistency as a strength and recommends naming the reference clearly while preserving identity markers such as facial features and hairstyle.

What are the editing input limits?

The official editing docs say input_image supports up to 20MB or 20 megapixels.

What output size should I expect?

The official docs describe outputs as roughly 1MP total, with text-to-image defaulting to 1024x1024 unless aspect ratio is specified.

What is the official price and speed position of Kontext Pro?

In the official overview, Kontext Pro is positioned as the fast production-ready option with 5-6 seconds generation time and $0.04 per image.

When should I compare Kontext Max instead?

Compare Kontext Max when top-end typography, maximum prompt adherence, and premium consistency are more important than Kontext Pro’s speed-cost balance.

FLUX.1 Kontext Pro：AI 图像编辑工具

如果你的需求只是“根据一段文本生成一张全新的图片”，并不关心编辑路径如何运作，那么 FLUX.1 Kontext Pro 并不是最应该先打开的页面。它真正有价值的场景是另外一种：你已经有了一张图片、一个草稿、一张海报、一张产品图或者一个角色参考图，现在只想改其中一个明确部分，而不是把整张图推倒重来。在 Black Forest Labs 官方文档里，FLUX.1 Kontext [pro] 被描述为一个将 text-to-image 与 image editing 结合在一起的上一代模型。

这个表述很重要，因为它帮我们把模型放到正确的位置上。Kontext Pro 不是又一个换了名字的图片生成器，它的核心价值首先在“按指令改图”，其次才是“从零生成”。官方文档反复强调的是局部编辑、角色一致性、图中文字编辑以及风格转换。如果你的真实工作是给产品换颜色、改海报里的标题、在多轮修改里保住同一个人物、或者在不打散构图的前提下重做风格，那么这页内容会比那种只承诺“快速 text-to-image”的泛模板页面有用得多。

还有一个必须坦诚说明的前提。截止 2026 年 4 月 18 日，Black Forest Labs 官方文档已经明确建议：新的图像生成与编辑项目优先考虑 FLUX.2。这并不意味着 Kontext Pro 没价值了，而是意味着这篇页面必须帮助用户判断：什么时候 Kontext Pro 仍然是合理选择，什么时候直接走更新的路线更好。

快速结论

优先考虑 FLUX.1 Kontext Pro 的情况是：你的核心任务是基于指令做图像编辑，例如给产品改色、替换横幅文案、切换背景、逐轮更新角色、或者在保留整体结构的前提下改风格。

这篇页面的主要一手来源包括官方 Kontext overview、官方 image editing 文档、官方 text-to-image 文档，以及官方 image-to-image prompting guide。

Kontext Pro 真正擅长的事情

理解 Kontext Pro 最快的方法，不是把它当成“更强的图像生成模型”，而是把它看成“按提示修图的模型”。官方编辑文档明确指出，它可以通过简单的文本指令完成图像修改，不需要复杂 workflow，也不需要额外 fine-tuning。它的价值就在这里：你明确告诉模型哪里要改，而图像的其余部分尽量保持稳定。最终结果应该像一次有意图的修订，而不是一次把整张图重画的重生成。

在实际工作里，这种能力非常适合营销素材、产品视觉、社交创意和编辑类视觉内容。因为这些场景往往并不需要整张图推倒重做，而是需要局部更新。Kontext Pro 在“替换图中文字”这件事上也尤其有用，因为 Black Forest Labs 对这类操作给出了非常清晰的引号式写法，可以在改字的同时尽量保住周边的排版和上下文。

展示产品改色、背景替换和角色保持的前后对比编辑板 — 理解 Kontext Pro 最好的方式，是把它看成一个“选择性改动模型”。当用户已经认可图片的大部分内容，只想改一个物体、一段文字、一个背景或一层风格时，它最有说服力。

不依赖重流程的局部编辑

官方资料把 Kontext Pro 放在“简单指令驱动的图片编辑器”这个位置上，这对非技术团队的快速修订很友好。

多轮编辑里的角色一致性

Prompting 指南给出了明确示例，说明在环境和风格变化后，同一个人物仍然可以保持可辨识性。

直接改图中文字

Black Forest Labs 文档化了清晰的引用式模式，让你在改文字时更容易保住周围布局。

同一模型家族里兼顾生成与编辑

官方 overview 把 Kontext Pro 描述为既能从文本生成，也能编辑现有图片的统一模型。

官方文档真正确认了什么

真正有价值的 SEO 页面，往往不是说得越多越好，而是说得越准越好。旧版文案试图同时覆盖太多内容：未经验证的 benchmark、宽泛的承诺、模糊的比较。实际上，Black Forest Labs 官方文档已经给出了足够多的可验证信息，完全可以据此建立一篇强页面，而不需要再补任何想象性的说法。

维度	官方确认内容	对用户意味着什么
模型状态	FLUX.1 Kontext [pro] 被描述为上一代模型，而新项目推荐使用 FLUX.2	Kontext Pro 仍然有用，但新的整合项目应该先拿它和更新的 Black Forest Labs 路线做比较。
核心能力	Text-to-image、image editing、character consistency、text editing、style transformation	它并不只是一个生成器，而是一个兼顾生成与编辑的统一模型，而且明显偏向编辑用途。
在家族中的定位	Overview 将 Pro 定位为快速、production-ready、生成与编辑一体、指令跟随能力强、单张约 5-6 秒、每张 0.04 美元	Pro 是 Kontext 系列里的平衡点，不是最高端的质量层，也不是开放权重研究路线。
Editing API 基础	`/flux-kontext-pro` 端点同时需要文本 prompt 和 `input_image`	如果你的工作流本来就是从一张已有图片开始，那么 Kontext Pro 会很自然地接进去。
图像编辑限制	输入图像上限 20MB 或 20MP；编辑时会尽量保持原始尺寸并对齐到 32 的倍数；支持的 aspect ratio 范围为 3:7 到 7:3	这个模型更接近“围绕原图做改动”，而不是把所有任务都塞进同一块固定画布。
Text-to-image 默认行为	默认输出 1024x1024，如未指定比例则默认 `1:1`	从零生成时，可以把它理解为大约 1MP 量级的输出，除非你自己指定格式。
输出格式与结果获取	输出可以是 `jpeg` 或 `png`，签名结果 URL 有效期 10 分钟	对于需要 polling 然后快速拉取结果的系统，这是一条重要的操作条件。
指令长度	官方 image-to-image 指南给出的上限是 512 tokens	因此更适合写短而清楚的编辑指令，而不是长篇堆砌。

为什么到 2026 年 Kontext Pro 仍然有位置

看到“Black Forest Labs 推荐新项目用 FLUX.2”之后，最容易犯的错误就是直接把 Kontext Pro 排除掉。这其实太简单化了。只要团队需要的是一个快速、易接入生产、而且以编辑为中心的模型，并且任务本身也符合官方文档强调的强项，那么 Kontext Pro 依然合理。典型例子包括：局部改动、文字替换、风格重做、以及在多轮修改里保住同一个角色。

这一点对按 revision cycle 工作的团队尤其重要。营销、产品、内容团队并不总是需要一张全新神图。很多时候，他们只是想改一个词、换一个背景、做一个颜色版本、替换一个道具、或者调整氛围，同时让其他部分尽量保持不变。在这种场景里，Kontext Pro 现在依然很实用。

路线	官方定位	最合适的用途
FLUX.1 Kontext Pro	快速、production-ready、生成与编辑一体、5-6 秒、每图 0.04 美元	速度与可反复修订能力，比绝对最高终稿质量更重要的编辑工作流。
FLUX.1 Kontext Max	最佳输出质量、领先的 typography、最大程度的 prompt adherence、premium consistency、每图 0.08 美元	对 typography、稳定性和最终质感要求更高的重要项目。
FLUX.2	推荐用于新项目；质量更高；支持最多 10 张 multi-reference；text editing 更强；输出可达 4MP	希望从一开始就走 Black Forest Labs 当前推荐路线的新项目。

真正有用的 prompt 写法

Kontext 的官方 prompting 指南之所以有用，是因为它不仅关注“改什么”，也关注“保留什么”。如果你想在多个回合中保持同一个角色，Black Forest Labs 建议的结构很简单：先明确参照对象，再说清变换内容，最后明确必须保留的 identity markers。指南还特意提醒一个常见错误：不要只写模糊代词，而要明确写出人物本身。

落到实际操作里，这意味着 Kontext Pro 更喜欢“像编辑指令一样的 prompt”，而不是“像诗一样的描述”。说清对象，说清变化，说清不该变的部分。如果变化幅度很大，官方文档也建议拆成多个小步骤，而不是一次性要求模型跨越式完成。

展示文字替换、角色保持与分步风格转换的提示词结构图 — 对 Kontext Pro 来说，好 prompt 不是写得更长，而是边界更清楚：哪里变、哪里不变、哪些大改动最好拆开做。

Prompt 模式 1

适合做局部对象修改： 只想改产品或道具，不想重建整个画面。

Prompt: Change the bottle cap from matte black to brushed silver while keeping the same product shape, label layout, lighting, and background.

Prompt 模式 2

适合保持同一角色： 需要在多轮里维持同一个人。

Prompt: Place the woman with short black hair in a rainy Tokyo street at night while maintaining the same facial features, hairstyle, eye shape, and expression.

Prompt 模式 3

适合替换文字： 按官方文档建议使用带引号的结构。

Prompt: Replace 'SUMMER SALE' with 'FLUX DROP' while maintaining the same font style, color, and placement.

Prompt 模式 4

适合大幅度风格调整： 与其一次塞满，不如分步推进。

Prompt: Transform the portrait into a claymation style while preserving the same person, then use that output as the base for the next scene change.

为什么 text editing 和 annotation boxes 很实用

官方文档在两个高价值 workflow 上写得非常具体。第一是 text editing。Black Forest Labs 明确建议把要替换的文字放进引号里，用 Replace '[original text]' with '[new text]' 这样的结构。同时也说明了，字体越清晰、越容易阅读，新旧文案长度越接近，效果通常越稳定。

第二是 annotation boxes。文档解释说，醒目的彩色方框可以作为局部编辑的视觉标记，尤其是在需要挪动或缩放文字的时候。Kontext Pro 会识别输入图像里的这些标记，并在最终输出中去掉它们。对于横幅、海报、包装和广告版式，这个细节非常实用。

任务	官方最佳实践	为什么重要
替换文字	使用引号：`Replace 'old text' with 'new text'`	这样模型收到的是明确的替换指令，而不是模糊的排版要求。
保持字体风格	必要时显式写出，例如 keep the same font style and color	否则文字虽然改对了，视觉风格却可能跑偏。
维持版式稳定	尽量让新旧文案长度接近	长度差过大时，spacing 与位置常常会出问题。
定点局部编辑	使用亮色 annotation boxes 作为参考	在拥挤布局里，需要移动文字或调整大小时尤其有帮助。

什么时候更应该比较别的模型

如果一篇页面假装 Kontext Pro 是所有场景的答案，那它其实并不实用。Black Forest Labs 自己已经说得很清楚：FLUX.2 是当前给新项目的推荐路线。因此，更有价值的做法，是在用户需求开始偏离局部编辑的时候，明确告诉他应该跟哪些模型比较。

继续用 Kontext Pro

当你的真实 workflow 是围绕一张现有图片做快速、可控、可反复的修改。

与 Kontext Max 比较

当 typography、premium consistency 和最高程度的指令贴合度，比 Pro 的速度与成本平衡更重要。

与 FLUX.2 比较

当你现在要启动新的 Black Forest Labs 集成，并且希望直接走官方推荐的 current-generation 路线。

与 Imagen 4 Fast 比较

当你的核心任务不是改已有图片，而是快速产出多种新的创意方向。

与 Ideogram 比较

当海报文字可读性、标签设计、重排版的图像任务才是主要问题。

打开 image model hub

当你还在生成优先、编辑优先、排版优先这几条路线之间做选择。

用于比较编辑型 Kontext Pro、追求高端输出的 Kontext Max，以及更新推荐路线 FLUX.2 的决策图 — 对 Kontext Pro 最诚实的定位，不是“什么都最强”，而是“当指令式编辑与视觉连续性比从零重做更重要时，它是最合理的选择”。

集成前必须知道的操作细节

API 文档里有几条很容易被忽略、但在生产环境里非常关键的信息。做 image editing 时，Kontext Pro 同时需要文本指令和输入图片。做 text-to-image 时，如果你不指定 aspect ratio，默认是 1024x1024。而在 editing 模式下，只要你不通过 aspect_ratio 强制覆盖，它就会尽量保留原图尺寸，并对齐到 32 的倍数。

官方文档还提到用于获取结果的 polling flow，以及 signed output URL 只有 10 分钟有效期。这可能不是页面里最“好看”的部分，但对生产可靠性非常关键。如果你围绕 Kontext Pro 做内部工具或自动化，这类细节和画质本身一样重要。

Editing 需要 input_image： 它的主要路线并不是 prompt-only workflow。
输入限制是真实存在的： 官方文档写明上限是 20MB 或 20MP。
Aspect ratio 有范围： 官方范围是 3:7 到 7:3。
输出规模大约是 1MP： 设计 use case 时最好按这个量级理解。
结果要尽快回收： 签名 URL 10 分钟后失效。

发布前应该检查什么

一篇好的 edit-first 页面，不应该以“相信模型就行”结尾。Kontext Pro 可以保留很多内容，但最后的把关仍然是人。检查 typography。检查角色是否真的还是同一个人。检查未修改区域是否真的像未修改。最后再检查：这次编辑到底有没有解决真实业务问题，而不只是做出一个“不同版本”。

确认未改区域真的像未改： 好的 Kontext 编辑不应该让人感觉整张图被重新生成。
重新读一遍替换后的文字： 就算替换成功，spacing 和长度也可能还需要人工确认。
多轮后检查 identity markers： 头发、脸部、比例、表情都应属于同一人物。
把大改动拆开： 很多时候，多次小修改比一次性大跨度更稳定。
重新判断路线： 如果项目需要全新集成或更高一层的输出质量，Kontext Pro 可能就不再是最好的起点。

这篇指南核实了什么

这篇页面严格建立在 Black Forest Labs 的一手资料之上：官方 Kontext overview、官方 image editing 文档、官方 text-to-image 文档、以及官方 image-to-image prompting guide。没有根据的 benchmark、猜测性的比较、无来源的技术建议和夸大的说法，都已经刻意删除。

关于 FLUX.1 Kontext Pro 的常见问题

FLUX.1 Kontext Pro 是什么？
按照 Black Forest Labs 的定义，它是一个把 text-to-image 与图像编辑结合在一起的上一代模型。
Kontext Pro 更偏生成还是更偏编辑？
两者都能做，但它真正有实用价值的地方，还是保留上下文的 prompt 驱动编辑。
官方写明了哪些能力？
包括 text-to-image、image editing、character consistency、text editing 和 style transformation。
Black Forest Labs 对新项目的建议是什么？
官方文档建议新的图像生成与编辑项目优先考虑 FLUX.2。
替换文字的指令应该怎么写？
官方推荐使用类似 Replace 'old text' with 'new text' 这样的明确结构。
Kontext Pro 能在多轮里保持同一个角色吗？
可以。官方 guide 把 character consistency 当作强项之一，并建议明确写出参考对象和身份特征。
输入图片的限制是什么？
官方 editing 文档指出 input_image 上限为 20MB 或 20MP。
输出尺寸应该预期多少？
官方资料提到大约 1MP 规模；text-to-image 默认是 1024x1024。
官方给出的速度和价格是多少？
Overview 中将 Kontext Pro 描述为大约 5 到 6 秒、每张 0.04 美元的快速 production-ready 方案。
什么时候应该拿它和 Kontext Max 比较？
当 typography、premium consistency 和最大程度的 prompt adherence，比 Pro 的速度与成本平衡更重要时。

FLUX.1 Kontext Pro：AI 图像编辑工具

AI 图像生成器

上传您的照片并告诉我们您的想象

享受AI让您的图像栩栩如生

FLUX.1 Kontext Pro：AI 图像编辑工具

Kontext Pro 真正擅长的事情

官方文档真正确认了什么

为什么到 2026 年 Kontext Pro 仍然有位置

真正有用的 prompt 写法

为什么 text editing 和 annotation boxes 很实用

什么时候更应该比较别的模型

集成前必须知道的操作细节

发布前应该检查什么

这篇指南核实了什么

关于 FLUX.1 Kontext Pro 的常见问题

超级促销