What is FLUX.1 Kontext Pro?

According to Black Forest Labs, FLUX.1 Kontext [pro] is a previous-generation model that combines text-to-image generation with image editing.

Is Kontext Pro mainly an image generator or an image editor?

It can do both, but the strongest practical reason to choose it is prompt-based image editing with context preservation rather than generic from-scratch generation.

What can Kontext Pro officially do?

The official overview lists text-to-image, image editing, character consistency, text editing, and style transformation.

What does Black Forest Labs recommend for new projects?

The official docs recommend FLUX.2 for new image generation and editing projects.

How do text edits work in Kontext Pro?

The official docs recommend quotation marks around the exact text change, for example: Replace 'old text' with 'new text' .

Can Kontext Pro preserve the same character across multiple edits?

Yes. The official prompting guide explicitly presents character consistency as a strength and recommends naming the reference clearly while preserving identity markers such as facial features and hairstyle.

What are the editing input limits?

The official editing docs say input_image supports up to 20MB or 20 megapixels.

What output size should I expect?

The official docs describe outputs as roughly 1MP total, with text-to-image defaulting to 1024x1024 unless aspect ratio is specified.

What is the official price and speed position of Kontext Pro?

In the official overview, Kontext Pro is positioned as the fast production-ready option with 5-6 seconds generation time and $0.04 per image.

When should I compare Kontext Max instead?

Compare Kontext Max when top-end typography, maximum prompt adherence, and premium consistency are more important than Kontext Pro’s speed-cost balance.

FLUX.1 Kontext Pro：AI 圖像編修工具

如果你的需求只是「把一段文字直接變成一張全新的圖片」，而且並不在意編修流程怎麼運作，那麼 FLUX.1 Kontext Pro 並不是最先該打開的頁面。它真正有價值的情境是另一種：你已經有圖片、草稿、海報、產品照或角色參考圖，只想改其中某個明確部分，而不是整張圖全部重來。在 Black Forest Labs 官方文件裡，FLUX.1 Kontext [pro] 被描述為一個把 text-to-image 與 image editing 結合在一起的上一代模型。

這樣的定位很重要，因為它能把模型放在正確的位置上。Kontext Pro 不是又一個換名字的圖片生成器。它真正的價值首先在於「按指令改圖」，其次才是「從零生成」。官方文件特別強調的是局部編修、角色一致性、圖中文字編輯，以及風格轉換。如果你的實際工作是幫產品換色、改海報文案、讓同一個人物在多輪修改中保持一致、或是在不破壞構圖的前提下改變畫面風格，那麼這頁內容會比那種只承諾快速 text-to-image 的通用頁面實用得多。

另外還有一個必須坦白說清楚的前提。到 2026 年 4 月 18 日 為止，Black Forest Labs 官方文件已經明確建議：新的圖像生成與編輯專案優先考慮 FLUX.2。這不代表 Kontext Pro 沒有價值，而是代表這篇頁面必須幫使用者判斷：什麼時候 Kontext Pro 仍然合理，什麼時候直接走更新的路線比較對。

快速結論

應該先看 FLUX.1 Kontext Pro 的情況，是你的核心工作本來就是圖像編修：例如替產品改色、替換橫幅文案、切換背景、逐輪維持同一角色、或是在保留大部分畫面結構的前提下改變整體風格。

這篇頁面的主要一手來源包括官方 Kontext overview、官方 image editing 文件、官方 text-to-image 文件，以及官方 image-to-image prompting guide。

Kontext Pro 真正擅長的工作

要理解 Kontext Pro，最快的方法不是把它當成「更強的圖片生成模型」，而是把它看成「依照文字指令進行圖像修訂的模型」。官方編輯文件明確指出，它可以透過簡單的文字指令完成圖片編修，不需要複雜 workflow，也不需要另外做 fine-tuning。它的核心價值就在這裡：你明確指出哪裡要改，而畫面其餘部分盡量維持穩定。這樣最後的結果會比較像有意識的修稿，而不是整張圖被重新生成。

在實務上，這種能力特別適合行銷素材、產品視覺、社群創意，以及需要選擇性更新的編輯類圖片。Kontext Pro 在「修改圖中文字」這件事上也很實用，因為 Black Forest Labs 已經把引用式的寫法整理清楚，讓你在替換海報、標誌或標籤文字時，更容易保住原本的版面與風格。

展示產品改色、背景替換與角色維持的前後編修圖板 — 如果要用一句話概括 Kontext Pro，它就是「用來做選擇性修改的模型」。當使用者已經接受畫面的大部分內容，只想動一個物件、一段文字、一個背景或一層風格時，它最有價值。

不靠重流程也能做局部編修

官方文件把 Kontext Pro 放在「用簡單指令驅動的圖片編輯器」這個位置，對非技術團隊的快速修稿特別友善。

多輪修改也能維持角色一致

Prompting 指南直接展示了多步驟案例：即使場景或風格變了，同一個人物仍然可以保持辨識度。

可以直接替換圖片內文字

Black Forest Labs 文件化了清楚的引號結構，讓文字替換更容易，同時盡量保住周圍版面。

同一套模型家族兼顧生成與編修

官方 overview 把 Kontext Pro 描述成既能從文字生成，也能編修現有圖片的統一模型。

官方文件真正確認了哪些事

真正有用的 SEO 頁面，不是什麼都講，而是把有根據的事情講清楚。舊版內容嘗試涵蓋太多：沒有充分來源的 benchmark、過度寬泛的承諾、模糊的比較。其實光靠 Black Forest Labs 的官方文件，就已經足夠建立一篇有說服力的頁面。

面向	官方確認內容	對使用者的意義
模型狀態	FLUX.1 Kontext [pro] 被定義為上一代模型，而新專案建議優先使用 FLUX.2	Kontext Pro 依然可用，但新的整合案應先拿它與更新的 Black Forest Labs 路線相比。
主要能力	Text-to-image、image editing、character consistency、text editing、style transformation	它不是單純生成器，而是同時涵蓋生成與編修的整合模型，而且明顯偏向編修用途。
在產品家族中的位置	Overview 把 Pro 定位成快速、production-ready、生成與編修整合、指令跟隨能力強、單張約 5 到 6 秒、每張 0.04 美元	Pro 是 Kontext 系列中的平衡點，不是最高品質層，也不是研究型 open-weights 路線。
Editing API 基礎	`/flux-kontext-pro` 端點同時需要文本 prompt 與 `input_image`	如果你的工作流程本來就是從既有圖片開始，Kontext Pro 會很自然地接上去。
圖像編修限制	輸入圖片上限為 20MB 或 20MP；編修時會盡量維持原始尺寸並對齊到 32 的倍數；支援的 aspect ratio 範圍為 3:7 到 7:3	這代表它偏向在原圖基礎上精修，而不是把所有工作都塞進同一種固定畫布。
Text-to-image 預設行為	預設輸出為 1024x1024，如未指定比例則為 `1:1`	如果從零生成，可以先把它理解為大約 1MP 等級的輸出尺度。
輸出格式與取得方式	輸出可以是 `jpeg` 或 `png`，簽名結果 URL 有效期為 10 分鐘	對需要 polling 後快速抓取成果的系統來說，這是很重要的操作條件。
指令長度	官方 image-to-image 指南給出的上限是 512 tokens	因此更適合使用短而清楚的編修指令，而不是很長的堆砌描述。

為什麼到了 2026 年 Kontext Pro 仍然有位置

看到「Black Forest Labs 建議新專案使用 FLUX.2」後，最容易犯的錯，就是直接把 Kontext Pro 判出局。這其實太快了。只要團隊需要的是快速、容易上生產、而且以編修為中心的模型，並且任務本身也符合官方文檔強調的優勢，那麼 Kontext Pro 仍然非常合理。像是局部修改、文字替換、風格重做、以及在多輪改稿中維持同一個角色，都是典型例子。

這件事對以 revision cycle 為核心的團隊特別重要。行銷、產品、內容團隊不一定每次都需要全新的神圖。很多時候他們只是想改一個詞、換一個背景、做一個顏色版本、替換一個道具、或調整一點氛圍，同時讓其他部分盡量維持不變。在這種情況下，Kontext Pro 現在依然很好用。

路線	官方定位	最適合的用途
FLUX.1 Kontext Pro	快速、production-ready、生成與編修整合、5 到 6 秒、每張 0.04 美元	速度與可反覆修訂能力，比最高終稿品質更重要的編修工作流。
FLUX.1 Kontext Max	最佳輸出品質、強 typography、最大 prompt adherence、premium consistency、每張 0.08 美元	對 typography、穩定性與最終質感要求更高的重要任務。
FLUX.2	新專案推薦使用；品質更高；支援最多 10 張 multi-reference；text editing 更強；輸出最高可到 4MP	希望一開始就走 Black Forest Labs 當前建議路線的新專案。

真正有幫助的 prompt 寫法

Kontext 的官方 prompting 指南之所以實用，是因為它不只問「改什麼」，也問「保留什麼」。如果你想在多輪修改中維持同一角色，Black Forest Labs 建議的結構很簡單：先明確說出參照對象，再寫清楚變化內容，最後把必須保留的 identity markers 明確列出來。指南也特別提醒，不要只用模糊代名詞，而要把人物寫清楚。

放到實作層面，這代表 Kontext Pro 更喜歡像編修指令的 prompt，而不是像散文一樣的描述。把對象講清楚，把變化講清楚，把不能變的地方講清楚。如果變動幅度很大，官方文件也建議拆成多個小步驟，而不是一次要求模型跨太大。

展示文字替換、角色維持與分步風格改造的提示詞結構圖 — 對 Kontext Pro 來說，好 prompt 不是寫得更長，而是邊界更清楚：哪裡要變、哪裡不變、哪些大改動應該拆成多步。

Prompt 模式 1

適合局部物件修改： 想改產品或道具，但不想把整個畫面重建。

Prompt: Change the bottle cap from matte black to brushed silver while keeping the same product shape, label layout, lighting, and background.

Prompt 模式 2

適合同一角色維持： 想讓同一個人物在多輪裡都保持一致。

Prompt: Place the woman with short black hair in a rainy Tokyo street at night while maintaining the same facial features, hairstyle, eye shape, and expression.

Prompt 模式 3

適合文字替換： 依照官方建議採用帶引號的結構。

Prompt: Replace 'SUMMER SALE' with 'FLUX DROP' while maintaining the same font style, color, and placement.

Prompt 模式 4

適合大幅風格改造： 與其一次塞滿，不如拆成數個步驟。

Prompt: Transform the portrait into a claymation style while preserving the same person, then use that output as the base for the next scene change.

為什麼 text editing 和 annotation boxes 這麼實用

官方文件對兩種高價值 workflow 寫得非常具體。第一種是 text editing。Black Forest Labs 明確建議把要替換的文字放進引號裡，並使用 Replace '[original text]' with '[new text]' 這樣的結構。同時也提到：字體越清楚、越容易閱讀，新舊文字長度越接近，效果通常越穩定。

第二種是 annotation boxes。文件說明，醒目的彩色方框可以當作局部編修的視覺標記，尤其在需要移動或縮放文字時很有用。Kontext Pro 會辨識輸入圖中的這些標記，並在最終輸出中將它們移除。對橫幅、海報、包裝與廣告版式來說，這是非常實用的細節。

任務	官方最佳做法	為什麼重要
替換文字	使用引號：`Replace 'old text' with 'new text'`	這樣模型接收到的是明確的替換命令，而不是模糊的排版要求。
維持字體風格	必要時明確寫出，例如 keep the same font style and color	否則文字雖然改對了，視覺風格仍可能偏移。
維持版面穩定	盡量讓新舊文字長度接近	長度差距過大時，spacing 與位置常會變得不穩。
精準局部編修	使用亮色 annotation boxes 作為定位參考	在密集版面裡要移動文字或改大小時尤其有幫助。

什麼時候更該比較其他模型

如果一篇頁面假裝 Kontext Pro 是所有問題的答案，那它其實就不夠好用。Black Forest Labs 自己已經說得很清楚：FLUX.2 是目前給新專案的推薦路線。因此，真正有價值的是在使用者需求開始偏離局部編修時，明確指出更應該比較哪些模型。

繼續用 Kontext Pro

當你的真實 workflow 是圍繞既有圖片做快速、可控、可反覆的修改。

和 Kontext Max 比較

當 typography、premium consistency 與最高程度的指令貼合，比 Pro 的速度與成本平衡更重要。

和 FLUX.2 比較

當你今天就要啟動新的 Black Forest Labs 整合，並想直接走官方 current-generation 路線。

和 Imagen 4 Fast 比較

當你的核心工作不是改既有圖片，而是快速生成多個新的創意方向。

和 Ideogram 比較

當海報文字可讀性、標籤設計、重排版影像才是主要問題。

打開 image model hub

當你還在「生成優先」「編修優先」「排版優先」這幾條路之間猶豫。

比較編修型 Kontext Pro、高階輸出型 Kontext Max 與更新推薦路線 FLUX.2 的決策圖 — 對 Kontext Pro 最誠實的定位，不是「什麼都最強」，而是「當指令式編修與視覺連續性比從零重畫更重要時，它是最合理的選擇」。

整合前必須知道的操作細節

API 文件裡有幾條很容易被忽略、但在正式環境非常關鍵的資訊。做 image editing 時，Kontext Pro 同時需要文字指令與輸入圖片。做 text-to-image 時，如果沒有指定 aspect ratio，預設就是 1024x1024。而在 editing 模式下，只要你不透過 aspect_ratio 覆蓋，它就會盡量保留原圖尺寸並對齊到 32 的倍數。

官方文件也提到取得結果的 polling flow，以及 signed output URL 只有 10 分鐘有效期。這可能不是頁面裡最「吸睛」的部分，但對正式環境的可靠性非常重要。如果你要圍繞 Kontext Pro 建內部工具或自動化，這些細節和畫質本身一樣重要。

Editing 需要 input_image： 它的主要路徑並不是 prompt-only workflow。
輸入限制是真實存在的： 官方文件寫明上限是 20MB 或 20MP。
Aspect ratio 有範圍： 官方範圍是 3:7 到 7:3。
輸出大約是 1MP 等級： 規劃 use case 時最好先有這個尺度概念。
結果要盡快取回： 簽名 URL 10 分鐘後就會失效。

交付前應該檢查什麼

一篇好的 edit-first 頁面，不應該用「相信模型就好」作結。Kontext Pro 可以保留很多內容，但最後的把關仍然要靠人。檢查 typography。檢查角色是否真的還是同一個人。檢查沒有改動的區域是否真的像沒被動過。最後再看：這次編修是否真的解決了業務問題，而不只是產出一個「不同版本」。

確認未修改區域真的像未修改： 好的 Kontext 編修不應該讓人覺得整張圖都被重畫。
重新讀一遍替換後的文字： 即使替換成功，spacing 與長度仍可能需要人工檢查。
多輪後檢查 identity markers： 頭髮、臉部、比例、表情都應該仍屬於同一個人。
把大改動拆開： 很多時候，多次小改比一次大跳更穩定。
重新評估路線： 如果專案需要全新整合或更高一層的輸出品質，Kontext Pro 可能就不是最好的起點。

這篇指南實際驗證了什麼

這篇頁面完全建立在 Black Forest Labs 的一手資料之上：官方 Kontext overview、官方 image editing 文件、官方 text-to-image 文件，以及官方 image-to-image prompting guide。沒有來源的 benchmark、猜測性比較、無依據的技術建議與誇張說法，都已經刻意刪除。

關於 FLUX.1 Kontext Pro 的常見問題

FLUX.1 Kontext Pro 是什麼？
依照 Black Forest Labs 的定義，它是把 text-to-image 與圖像編修整合在一起的上一代模型。
Kontext Pro 比較偏生成還是偏編修？
兩者都能做，但它真正有實務價值的地方還是在保留上下文的 prompt 驅動編修。
官方列出的能力有哪些？
包含 text-to-image、image editing、character consistency、text editing 與 style transformation。
對新專案的官方建議是什麼？
官方文件建議新的圖像生成與編修專案優先使用 FLUX.2。
替換文字的指令應該怎麼寫？
官方建議採用類似 Replace 'old text' with 'new text' 的清楚結構。
Kontext Pro 可以在多輪裡維持同一角色嗎？
可以。官方 guide 把 character consistency 當作一項強項，並建議清楚寫出參照對象與身份特徵。
輸入圖片有什麼限制？
官方 editing 文件指出 input_image 上限為 20MB 或 20MP。
輸出尺寸大概應該怎麼預估？
官方資料提到大約 1MP 規模，而 text-to-image 預設是 1024x1024。
官方標示的速度與價格是多少？
Overview 把 Kontext Pro 描述為約 5 到 6 秒、每張 0.04 美元的快速 production-ready 方案。
什麼時候應該拿它和 Kontext Max 比較？
當 typography、premium consistency 與最高程度的 prompt adherence，比 Pro 的速度與成本平衡更重要時。

FLUX.1 Kontext Pro：AI 圖像編修工具

AI 圖像生成器

上傳您的照片並告訴我們您的想像

享受 AI 為您的圖片注入生命

FLUX.1 Kontext Pro：AI 圖像編修工具

Kontext Pro 真正擅長的工作

官方文件真正確認了哪些事

為什麼到了 2026 年 Kontext Pro 仍然有位置

真正有幫助的 prompt 寫法

為什麼 text editing 和 annotation boxes 這麼實用

什麼時候更該比較其他模型

整合前必須知道的操作細節

交付前應該檢查什麼

這篇指南實際驗證了什麼

關於 FLUX.1 Kontext Pro 的常見問題

超級促銷