What is Z-Image on this page?

On Cleep, this route is best understood as the fast Z-Image-Turbo lane, with both text-to-image and image-to-image available through the live model mapping.

What is the official size of the Z-Image family?

The official Turbo card describes Z-Image as a 6B-parameter image generation family.

Why does this route feel fast?

The official Turbo card says Z-Image-Turbo works with 8 NFEs , which is why it is positioned as the speed-oriented member of the family.

Does Z-Image really handle text inside images well?

The official Turbo card explicitly highlights accurate English and Chinese text rendering as a core strength.

Can I use this route for edits, not only new images?

Yes. Cleep exposes an image-to-image route here, and the wider family also includes a dedicated Z-Image-Edit branch for instruction-following edits.

What is the difference between Z-Image and Z-Image-Turbo?

The official cards say the base model keeps CFG, negative prompting, higher diversity, and fine-tunability, while Turbo is the distilled speed lane built for very fast high-quality output.

What architecture does the family use?

The official paper and model cards say the family uses a Scalable Single-Stream DiT (S3-DiT) that merges text, visual semantic tokens, and image VAE tokens into one stream.

Is the official checkpoint open?

The official Hugging Face cards list apache-2.0 for Z-Image and Z-Image-Turbo. That applies to the official checkpoints, even though Cleep users are working through a hosted route.

When should I compare Z-Image with Qwen?

Compare them when the job becomes more layout-first and typography-led, especially if the image needs to behave like a slide, poster, or structured information surface.

When should I use another image route instead?

Use another route when the task is mainly mood-first, realism-first, or typography-first in a way that matters more than Z-Image’s fast Turbo workflow and bilingual text strengths.

ตัวสร้างภาพ AI

กำกับฉากตามสไตล์ของคุณ สร้างภาพด้วยมุมมอง ความลึก และสไตล์ที่ตั้งใจ

อัปโหลดรูปภาพของคุณและบอกเราว่าคุณจินตนาการอะไร

การรวมทั้งสองให้ผลลัพธ์ที่ดีที่สุด

เพลิดเพลินกับรูปภาพของคุณที่นำมาชีวิตโดย AI

สร้างภาพด้วย Z-Image AI

โมเดลภาพบางตัวเด่นที่อารมณ์และบรรยากาศ บางตัวเด่นที่ความสมจริงแบบพรีเมียม แต่ Z-Image จะน่าใช้จริงเมื่อโจทย์ต้องการความเร็ว การทำตามคำสั่งที่คมขึ้น และข้อความในภาพที่ยังพออ่านได้สะอาดกว่าที่คาดจากโมเดลสายเปิดทั่วไป นี่คือมุมที่มีประโยชน์กับผู้ใช้มากกว่าหน้าเก่าที่พูดกว้าง ๆ แค่ว่าเป็นเครื่องสร้างภาพ AI อีกตัวหนึ่ง

บน Cleep หน้านี้เชื่อมกับ Z-Image-Turbo โดยตรง ไม่ได้อิงกับประสบการณ์รวม ๆ แบบคลุมเครือ ในการตั้งค่าจริงของโปรดักต์ เส้นทางนี้ชี้ไปที่ fal-ai/z-image/turbo สำหรับ text-to-image และ fal-ai/z-image/turbo/image-to-image สำหรับงานแก้ภาพต่อ จุดนี้สำคัญมาก เพราะคนที่เข้ามาที่ /generate/image/z-image ไม่ได้อยากอ่านประวัติการวิจัยทั้งหมด แต่ต้องการรู้ว่า เมื่อไร Z-Image จะเหมาะกับโปสเตอร์ แพ็กเกจจิ้ง การ์ดสินค้า หรือภาพที่ต้องแก้ต่อจากเฟรมแรกที่เกือบดีอยู่แล้ว

แหล่งข้อมูลทางการรองรับมุมมองนี้ค่อนข้างชัด model card ทางการของ Z-Image-Turbo อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters โดยสาย Turbo ถูกออกแบบมาเพื่อความเร็ว ผลลัพธ์แนวภาพถ่ายที่ดี การ เรนเดอร์ข้อความภาษาอังกฤษและภาษาจีนภายในภาพ และการทำตามคำสั่งที่นิ่งขึ้น ส่วน model card ทางการของ Z-Image รุ่นฐาน จะเน้นเรื่อง diversity, negative prompting และ fine-tuning มากกว่า ขณะที่ paper Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer ช่วยอธิบายว่าทำไมตระกูลนี้ถึงน่าสนใจ: มันพยายามให้ประสิทธิภาพดีโดยไม่ต้องพึ่งโมเดลที่ใหญ่เทอะทะ

คำตอบสั้น ๆ

ให้เริ่มจาก Z-Image บน Cleep เมื่อคุณต้องการแตกหลายทิศทางของภาพอย่างรวดเร็ว อยากให้ข้อความสั้นในอังกฤษหรือจีนติดอยู่ในภาพได้สะอาดขึ้น และต้องการ workflow ที่สร้างเฟรมแรกแล้วค่อยแก้แบบ image-to-image ต่อได้ในเส้นทางเดียว

แหล่งอ้างอิงหลักของหน้านี้ คือ model card ทางการของ Z-Image-Turbo, model card ทางการของ Z-Image รุ่นฐาน, GitHub ทางการของ Tongyi-MAI และ paper ทางการ Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Z-Image เด่นกับงานแบบไหนจริง

วิธีอ่านหน้ารุ่นนี้ที่ตรงที่สุดไม่ใช่ “โมเดลเล็กที่พอทำได้ทุกอย่าง” แต่คือ ตระกูลสร้างภาพแบบเปิดที่เร็ว และรับมือกับข้อความภายในภาพได้ดีกว่าที่มักเจอในสาย Turbo model card ของ Turbo ระบุชัดถึงชุดจุดแข็งนี้: สร้างภาพแนว photorealistic ได้ดี, วางข้อความอังกฤษและจีนในภาพได้แม่นขึ้น, และทำตามคำสั่งได้ดี ทั้งหมดนี้เกิดขึ้นในรุ่นที่ถูก distilled มาเพื่อความเร็ว

เพราะแบบนี้ Z-Image จึงเหมาะกับงานที่ภาพต้องทำตัวเหมือน asset ที่พร้อมใช้งาน ไม่ใช่แค่ภาพสวยลอย ๆ เช่น การ์ดสินค้าที่ต้องมีพื้นที่สำหรับข้อความ โปสเตอร์ที่มี headline สั้น แพ็กเกจจิ้งที่ฉลากต้องอ่านพอออก หรือภาพโปรโมชันที่ต้องอัปโหลดภาพเดิมเข้ามาแล้วแก้เพียงพื้นหลัง แสง หรือความคมของข้อความ หากคิดแบบนี้ workflow ของ Cleep บนเส้นทางนี้จะชัดมาก: สร้างให้เร็ว เลือกเฟรมที่ดีที่สุด แล้วค่อยแก้แบบมีเป้าหมาย

ตระกูลโมเดลก็ช่วยอธิบายความต่างของหน้าด้วย model card ของ Turbo บอกว่าครอบครัว Z-Image มีสี่แขนหลักคือ Z-Image-Turbo, Z-Image, Z-Image-Omni-Base และ Z-Image-Edit นั่นไม่ได้แปลว่าหน้า Cleep นี้ต้องเล่าทุกสาขาเท่ากัน แต่ควรอธิบายอย่างตรงไปตรงมาว่า ผู้ใช้กำลังเข้าเส้นทาง Turbo ที่เหมาะกับงานเร็วและการแก้ต่อ ขณะที่ภาพรวมของตระกูลเป็นเหตุผลว่าทำไมเส้นทางนี้จึงดูน่าใช้กว่าหน้า text-to-image ทั่วไปสำหรับงานออกแบบสองภาษาและงาน asset ที่ต้องรีวิวหลายรอบ

บอร์ดสรุปการใช้งานของ Z-Image ที่เน้นการแตกหลายเวอร์ชันอย่างรวดเร็ว ข้อความสองภาษาภายในภาพ และการแก้ต่อแบบ image-to-image — Z-Image เข้าใจง่ายที่สุดเมื่อมองเป็นเส้นทางทำ asset ให้เสร็จไว: แตกหลายทิศทาง รักษาข้อความสั้นให้อ่านง่ายขึ้น และแก้ภาพต่อในจุดที่ยังไม่เรียบร้อย

บน Cleep เส้นทางจริงคือ Turbo

เพราะ route นี้จับกับ fal-ai/z-image/turbo และเวอร์ชัน image-to-image เนื้อหาจึงควรพูดถึงงานจริงที่ต้องเสร็จเร็ว ไม่ใช่พูดแต่ทฤษฎีของรุ่นฐาน

ข้อความในภาพไม่ใช่จุดเสริมเล็ก ๆ

model card ของ Turbo ยกความแม่นของข้อความภาษาอังกฤษและภาษาจีนขึ้นมาเป็นหนึ่งในจุดต่างหลักของรุ่นนี้โดยตรง

ตระกูลนี้เปิดเผยข้อมูลค่อนข้างตรง

ทั้ง model card ของ Z-Image และ Z-Image-Turbo ระบุ apache-2.0 ชัดเจน ซึ่งให้สัญญาณความน่าเชื่อถือที่ดีกว่าคำเคลมกว้าง ๆ ของโมเดลปิด

Turbo กับรุ่นฐานแก้คนละโจทย์

เอกสารทางการบอกว่ารุ่นฐานรองรับ CFG, negative prompting, fine-tuning และ diversity มากกว่า ส่วน Turbo เน้นความเร็วและคุณภาพภาพที่นิ่งในเวลาอันสั้น

แหล่งทางการของ Z-Image ยืนยันอะไรบ้าง

หน้า SEO ที่ดีควรแยก ข้อเท็จจริงที่ยืนยันได้ ออกจากข้อความฟุ้ง ๆ แบบ AI filler และกรณีของ Z-Image ก็มีข้อมูลทางการมากพอให้ทำแบบนั้นได้ชัดเจน

หัวข้อ	สิ่งที่ยืนยันทางการ	ความหมายต่อผู้ใช้
ขนาดของตระกูล	model card ของ Turbo อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters	นี่คือสายโมเดลที่ออกแบบมาเพื่อประสิทธิภาพ ไม่ใช่การโตด้วยพารามิเตอร์อย่างเดียว
ความเร็วของ Turbo	เอกสารทางการระบุว่า Z-Image-Turbo ทำงานได้ดีด้วย 8 NFEs	จึงเหมาะกับการแตกหลายเวอร์ชัน การรีวิวเร็ว และการทำ asset ที่ต้องการการแก้ต่อ
แนวทางด้านฮาร์ดแวร์	paper พูดถึง sub-second latency บน H800 และการทำงานกับฮาร์ดแวร์ผู้ใช้ทั่วไปที่ราว 16GB VRAM ขณะที่ Turbo card ก็ระบุทิศทางคล้ายกัน	ภาพรวมคือโมเดลนี้ถูกสร้างมาให้มีประสิทธิภาพ ไม่ได้อาศัยแต่เครื่องใหญ่มหาศาล
ข้อความในภาพ	Turbo card ชูเรื่อง การเรนเดอร์ข้อความภาษาอังกฤษและภาษาจีนอย่างแม่นขึ้น	จึงเหมาะกับโปสเตอร์ แพ็กเกจจิ้ง การ์ดสินค้า และ creative แบบสองภาษามากกว่า route เปิดทั่วไปหลายตัว
สถาปัตยกรรม	paper และ model card พูดถึง Scalable Single-Stream DiT (S3-DiT) ที่รวม text, visual semantic tokens และ image VAE tokens ไว้ใน stream เดียว	มุมที่คนใช้ควรเข้าใจคือ ความเชื่อมระหว่าง prompt กับโครงสร้างภาพถูกออกแบบให้มีประสิทธิภาพมากขึ้น
trade-off ของรุ่นฐาน	model card ของรุ่นฐานระบุ CFG, negative prompting, 28 ถึง 50 steps, fine-tuning และ diversity ที่สูงกว่า	ถ้าต้องการ exploration ลึกหรือการควบคุมเชิงโมเดลมากขึ้น รุ่นฐานอธิบายว่าทำไม Turbo ไม่ได้ตั้งใจมาทดแทนทุกกรณี
สายแก้ภาพ	Turbo card ระบุว่ามี Z-Image-Edit สำหรับ image editing ที่ทำตามคำสั่งได้ดี	นี่รองรับวิธีอ่าน route บน Cleep ว่าเหมาะกับการสร้างแล้วแก้ต่อ ไม่ใช่แค่ one-shot generation
license	model card ทางการของ Z-Image และ Z-Image-Turbo ระบุ apache-2.0	เรื่อง checkpoint แบบเปิดจึงชัดกว่าหน้าเก่าที่เคยเล่าไว้สับสน แม้ว่าผู้ใช้ Cleep จะใช้งานผ่าน route ที่โฮสต์ไว้
ช่วงค่าที่แนะนำ	model card ของรุ่นฐานแนะนำ 512×512 ถึง 2048×2048, guidance scale 3.0 ถึง 5.0 และ 28 ถึง 50 steps	ตระกูลนี้ไม่ได้ถูกวางไว้สำหรับ output เล็ก ๆ แบบ demo เท่านั้น แต่รองรับงานภาพจริงจังค่อนข้างชัด

เขียน prompt ให้ Z-Image อย่างไร เมื่อความเร็วและความอ่านง่ายสำคัญพร้อมกัน

ข้อผิดพลาดที่เจอบ่อยคือใช้ Z-Image เหมือนโมเดล “ทำภาพให้สวย” แบบกว้าง ๆ ทั้งที่มันจะทำงานดีขึ้นมากเมื่อ prompt อธิบาย หน้าที่ของภาพ อย่างชัดเจน นี่คือโปสเตอร์สองภาษา การ์ดสินค้า ภาพแพ็กเกจจิ้ง หรือภาพโปรโมชันที่ต้องเว้นพื้นที่สำหรับ copy หรือไม่ ถ้าเป็นงานแก้ภาพต่อก็ควรพูดให้ชัดว่าจุดไหนยังใช้ได้และจุดไหนต้องเปลี่ยน

กฎข้อสองคือแยกสิ่งที่ต้องอ่านออกจากสิ่งที่ต้องให้บรรยากาศ ถ้าภาพมีข้อความอยู่ภายใน ควรระบุว่าคำไหนต้องอ่านได้และวางไว้ตรงไหนของเฟรม ถ้าเป็น image-to-image ก็ควรระบุว่ารูปร่าง มุมกล้อง หรือสีหลักของวัตถุเดิมต้องคงอยู่ การระบุ boundary แบบนี้ช่วยให้ Z-Image ใช้จุดแข็งเรื่อง instruction following ได้เต็มกว่า prompt ที่เป็นรายการคำคุณศัพท์ยาว ๆ

กฎข้อสามคือใช้โมเดลนี้แบบ loop สั้น ๆ สร้างก่อน เลือกเฟรมที่มีโอกาสดีที่สุด แล้วค่อยแก้ทีละจุด วิธีนี้สอดคล้องกับเส้นทาง Turbo มากกว่าการพยายามยัดทุกอย่างไว้ใน mega-prompt หนึ่งครั้งเดียว

บอร์ดอธิบายการเขียน prompt สำหรับ Z-Image ที่แยกบทบาทของภาพ พื้นที่ข้อความ ข้อความสองภาษา และกติกาว่าอะไรต้องคงเดิมหรือเปลี่ยนได้ — prompt ของ Z-Image จะนิ่งขึ้นเมื่อกำหนดหน้าที่ของ asset, พื้นที่ข้อความ และขอบเขตของการแก้ไขให้ชัด แทนการกองคำขยายแบบไร้โครงสร้าง

รูปแบบ prompt 1

ใช้กับโปสเตอร์สองภาษา: กำหนดงานของเลย์เอาต์ก่อน แล้วค่อยบอกข้อความและตำแหน่งให้ชัด

ตัวอย่าง: สร้างโปสเตอร์เปิดตัวแบบสี่เหลี่ยมสำหรับชาเย็นแบรนด์พรีเมียม วางแพ็กเกจไว้กึ่งกลาง ใช้แสงสะอาดแบบโฆษณา ใส่ headline ภาษาอังกฤษว่า “Cold Brew Leaves” และมีบรรทัดภาษาจีนสั้น ๆ รองลงมา เว้นพื้นที่ด้านล่างไว้สำหรับ CTA อีกหนึ่งบรรทัด

รูปแบบ prompt 2

ใช้กับการ์ดสินค้า: แยกตำแหน่งวัตถุ พื้นที่ข้อความ และอารมณ์รวมของชิ้นงานออกจากกัน

ตัวอย่าง: สร้างการ์ดสินค้า ecommerce สำหรับโคมไฟตั้งโต๊ะ วางโคมไฟทางขวา เว้นพื้นที่ข้อความด้านซ้ายสำหรับ bullet สั้นสามข้อ ใช้เงานุ่ม พื้นหลังโทนกลางอ่อน และบรรยากาศแบบ editorial ที่ดูพรีเมียม

รูปแบบ prompt 3

ใช้กับ image-to-image: บอกให้ชัดว่าอะไรต้องคงเดิมและอะไรคือการเปลี่ยนแปลงจริง

ตัวอย่าง: ใช้ภาพแพ็กเกจที่อัปโหลดมา คงรูปทรงขวด สีแบรนด์ และมุมกล้องเดิมไว้ทั้งหมด เปลี่ยนเฉพาะพื้นหลังให้สว่างขึ้นเป็นผิวหินอ่อน และทำให้ข้อความบนฉลากด้านหน้าชัดขึ้น

รูปแบบ prompt 4

ใช้กับการแตกหลายเวอร์ชันเร็ว ๆ: ขอความต่างที่ควบคุมได้ แทนการรีเซ็ตภาพทั้งหมด

ตัวอย่าง: สร้าง hero shot ของแก้วเซรามิกสามเวอร์ชัน โดยให้หนึ่งเวอร์ชันอุ่นและสว่างกว่าเดิม หนึ่งเวอร์ชันเข้มและหรูขึ้น และอีกหนึ่งเวอร์ชันมี negative space มากขึ้นสำหรับวางข้อความโฆษณา

Z-Image เหมาะกับ workflow แบบไหนในงานจริง

คุณจะเห็นคุณค่าของ Z-Image ชัดขึ้นเมื่อเลิกมองมันเป็นถ้วยรางวัลทางเทคนิค แล้วมองมันเป็น เส้นทางผลิต asset ที่เร็วและแก้ต่อได้ สำหรับ Cleep คำถามที่สำคัญไม่ใช่ “โมเดลนี้ชนะทุกตัวไหม” แต่คือ “มันช่วยให้เราได้ภาพที่ใช้งานได้เร็วขึ้น มีข้อความที่สะอาดขึ้น และยังปรับแก้ต่อได้โดยไม่ต้องสลับเครื่องมือหรือไม่”

มุมนี้มีประโยชน์ทั้งต่อ SEO และต่อผู้ใช้จริง เพราะมันบอกได้ชัดว่า route นี้เหมาะกับงานประเภทใด และเมื่อไรควรเปรียบเทียบกับโมเดลอื่นแทน เช่น งานที่เน้น typography หนักมาก งานที่ต้องการ photorealism ระดับสุด หรืองานที่อยากสำรวจอารมณ์ภาพแบบเปิดกว้างมากกว่า asset-ready output

กรณีใช้งาน	เหตุผลที่ Z-Image เหมาะ	สิ่งที่ควรระบุให้ชัด
โปสเตอร์สองภาษาและชิ้นงานโปรโมชัน	Turbo card ระบุชัดเรื่องข้อความอังกฤษและจีนภายในภาพ	headline, ข้อความรอง, ตำแหน่ง copy และพื้นที่ว่างที่ยังต้องเหลือไว้
แพ็กเกจจิ้งและ mockup ฉลาก	งานแบบนี้ให้ค่าน้ำหนักกับข้อความสั้นที่อ่านได้และการทำตามคำสั่งมากกว่าการสร้าง mood อย่างเดียว	รูปทรงแพ็ก สีแบรนด์ องค์ประกอบที่ห้ามเปลี่ยน และโซนฉลากที่ต้องชัดขึ้น
การ์ดสินค้าหลายเวอร์ชัน	เส้นทาง Turbo เหมาะกับการแตกหลายทิศทางอย่างเร็วและเลือกเวอร์ชันที่พร้อมใช้งานที่สุด	ตำแหน่งวัตถุ พื้นที่ข้อความ ครอป แสง และจำนวนเวอร์ชันที่ต้องการ
การแก้ภาพแบบ image-to-image	Cleep เปิดให้ใช้ image-to-image ใน route เดียว และตระกูล Z-Image ยังมีสาย Edit รองรับการทำตามคำสั่งเพื่อแก้ภาพ	สิ่งที่ต้องคงเดิม สิ่งที่ต้องแก้ และว่าการเปลี่ยนอยู่ที่แสง พื้นหลัง บรรจุภัณฑ์ หรือความอ่านง่ายของข้อความ
การทดลองกับโมเดลสายเปิด	เอกสารทางการเปิดเผยเรื่อง checkpoint และ license ชัดกว่าหลาย route ที่เล่าคลุมเครือ	ว่าคุณต้องการความเร็วแบบ hosted บน Cleep หรือสนใจแนวคิดของตระกูลโมเดลในระดับลึกกว่า
งานภาพแบบโปสเตอร์ที่ยังต้องสื่อสาร	Z-Image จะน่าสนใจมากขึ้นเมื่อภาพต้อง “สื่อสาร” ไม่ใช่แค่ดูสวย	พื้นที่ตัวอักษร negative space ความต้องการสองภาษา และระดับความเคร่งของ instruction following

ควรเลือก Z-Image หรือไปเทียบกับโมเดลใกล้เคียง

หน้า route ที่ดีไม่ควรอ้างว่าโมเดลตัวหนึ่งชนะทุกอย่าง จุดขายที่ตรงและเชื่อถือได้ของ Z-Image คือ มันเป็นโมเดลภาพสายเปิดที่เร็ว และรับมือกับข้อความอังกฤษหรือจีนภายในภาพได้ดีพอที่จะเอาไปใช้กับงาน asset จริง ถ้าโจทย์เปลี่ยนไปเป็นงาน typography-first, photorealism แบบสุดทาง หรือภาพที่เน้นอารมณ์หลวม ๆ มากกว่าโครงสร้างของชิ้นงาน ก็มีเหตุผลที่จะเทียบกับ route อื่น

เลือก Z-Image

เมื่อคุณต้องการความเร็ว การแตกหลายเวอร์ชัน image-to-image และข้อความสั้นในอังกฤษหรือจีนที่ยังมีโอกาสอ่านได้ดีในภาพเดียวกัน

เทียบกับ Qwen

เมื่องานเริ่มหนักไปทางเลย์เอาต์ ตัวอักษร หรือโครงสร้างแบบสไลด์มากกว่างาน asset ที่เน้นความเร็ว

เทียบกับ Ideogram

ถ้าปัญหาหลักคือโปสเตอร์หรือ graphic composition ที่ typography เป็นแกนหลักของภาพ

เทียบกับ Nano Banana

ถ้าคุณให้ความสำคัญกับ loop การแก้เร็วแบบสนทนาและการ branch แบบเบา ๆ มากกว่าความนิ่งของข้อความสองภาษาในเฟรม

เทียบกับ Imagen 4 Ultra

ถ้าความต้องการหลักคือ photoreal finish ระดับสูงมากกว่าความเร็วพร้อมข้อความที่อ่านง่าย

เทียบกับ Krea

ถ้างานเน้น mood, feel และการสำรวจภาพแบบ editorial มากกว่าการทำ asset ที่มีโซนข้อความและโครงสร้างชัด

บอร์ด workflow ของ Z-Image ที่เริ่มจากเฟรมแรกที่ใช้งานได้ ตรวจโซนข้อความ แก้ต่อแบบ image-to-image และค่อยตัดสินใจว่าจะเปลี่ยนโมเดลหรือไม่ — วิธีใช้ Z-Image ที่ได้ผลคือสร้างเฟรมแรกให้ใช้งานได้ก่อน ตรวจโซนข้อความและส่วนที่ยังอ่อน แล้วแก้ต่อแบบเจาะจง ก่อนค่อยตัดสินใจว่าจบที่ route นี้หรือควรส่งต่อให้โมเดลอื่น

เริ่มจากบทบาทของ asset: โปสเตอร์, pack shot, การ์ดสินค้า, โปรโมชัน หรือการแก้ภาพที่มีอยู่แล้ว
ระบุโซนข้อความ: ถ้ามีคำที่ต้องอ่านได้จริง prompt ควรบอกทั้งข้อความและตำแหน่งในเฟรม
ใช้ image-to-image เมื่อเฟรมแรกเกือบถูกแล้ว: ไม่จำเป็นต้องสุ่มใหม่ทั้งภาพถ้าปัญหาอยู่เพียงบางส่วน
เทียบโมเดลอย่างตรงไปตรงมา: ถ้างานกลายเป็น typography-first มาก ๆ Qwen หรือ Ideogram อาจเหมาะกว่า
จำให้ชัดว่าคุณกำลังใช้เส้นทางใด: บน Cleep หน้านี้คือเส้นทาง Turbo ไม่ใช่การรวมทุกแขนของตระกูล Z-Image ไว้เท่ากัน

เราตรวจสอบอะไรมาแล้วสำหรับไกด์นี้

บทความเวอร์ชันนี้อิงกับเอกสารทางการและการตั้งค่า route จริงของ Cleep ไม่ได้อิงกับ benchmark roundup หรือข้อความโฆษณาแบบกว้าง ๆ แหล่งข้อมูลหลักคือ model card ทางการของ Z-Image-Turbo, model card ทางการของ Z-Image รุ่นฐาน, GitHub ทางการของ Tongyi-MAI และ paper Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer ฉันตัดเนื้อหาเก่าที่เป็นตารางฮาร์ดแวร์แบบเดาสุ่ม การเปรียบเทียบที่ไม่มีแหล่งรองรับ และภาษาที่พยายามทำให้รุ่นนี้ดูเหมือนเก่งทุกอย่างออกไป เพื่อให้หน้า route ซื่อสัตย์กับความสามารถจริงมากขึ้น

คำถามที่พบบ่อยเกี่ยวกับ Z-Image

Z-Image บนหน้านี้หมายถึงอะไร
บน Cleep route นี้ควรถูกเข้าใจก่อนว่าเป็นเส้นทาง Z-Image-Turbo ที่เปิดทั้ง text-to-image และ image-to-image สำหรับงานเร็วและการแก้ต่อ
ตระกูล Z-Image มีขนาดเท่าไรตามเอกสารทางการ
Turbo card อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters
ทำไม route นี้ถึงดูเร็ว
เพราะเอกสารทางการระบุว่า Z-Image-Turbo ทำงานด้วย 8 NFEs จึงถูกวางให้เป็นสายที่เน้นความเร็วของตระกูล
Z-Image รับมือข้อความในภาพได้ดีจริงหรือไม่
Turbo card ระบุชัดว่าจุดแข็งของรุ่นนี้คือการเรนเดอร์ข้อความ ภาษาอังกฤษและภาษาจีน ภายในภาพได้แม่นขึ้น
สามารถใช้ route นี้เพื่อแก้ภาพ ไม่ใช่แค่สร้างภาพใหม่ได้ไหม
ได้ Cleep เปิด image-to-image ไว้ใน route เดียว และตระกูลโมเดลยังมี Z-Image-Edit สำหรับงานแก้ภาพโดยตรง
เมื่อไรควรเลือก Z-Image แทน Qwen
เมื่อคุณต้องการความเร็ว การแตกหลายทิศทางของภาพ และข้อความอังกฤษหรือจีนที่ยังพออ่านได้ภายในภาพเดียวกัน ถ้างานหนักไปทางเลย์เอาต์และ typography มากกว่า Qwen อาจเหมาะกว่า
เมื่อไรควรเปรียบเทียบกับ Ideogram
เมื่อชิ้นงานเป็นปัญหาแบบโปสเตอร์หรือ graphic layout ที่ตัวอักษรคือพระเอกหลักของภาพ
รุ่นฐานของ Z-Image แนะนำขนาดภาพและค่าอะไรบ้าง
model card ของรุ่นฐานแนะนำ 512×512 ถึง 2048×2048, guidance scale 3.0 ถึง 5.0 และ 28 ถึง 50 steps
ทำไมไม่ควรเริ่มด้วย mega-prompt ยาวมาก
เพราะ route นี้มักให้ผลดีกว่าเมื่อ prompt ระบุหน้าที่ของภาพ โซนข้อความ และขอบเขตของการแก้ต่ออย่างชัดเจน แล้วทำงานแบบหลายรอบสั้น ๆ
ตระกูล Z-Image เปิดเผยข้อมูลเรื่อง license หรือไม่
เปิดเผย ทั้ง Z-Image และ Z-Image-Turbo ระบุ apache-2.0 ใน model card ทางการ

โปรโมชันพิเศษ

ส่วนลด 90%

สร้างภาพและวิดีโอ AI ที่น่าทึ่งด้วยเครื่องมือที่จำเป็น

ปลดล็อกแผน Basic ได้เพียง $1

การต่ออายุอัตโนมัติเป็นสถานะออนไลน์ โปรโมชันจะพร้อมใช้งานจนกว่าคุณจะเปลี่ยนแผนของคุณและใช้ AI ของเราเพื่อสร้างรูปภาพที่น่าทึ่ง ข้อเสนอจะหมดอายุเมื่อวันที่ 14 กุมภาพันธ์ และปลดล็อกเท่านั้นวิธีนี้มีคุณค่าสำหรับคุณ ส่วนลด 90%

ด้วยการเลือกอายุของคุณและดำเนินการต่อ คุณตกลงกับ เงื่อนไขการใช้ และ นโยบายความเป็นส่วนตัว
โปรดตรวจสอบก่อนดำเนินการต่อ