ตัวสร้างภาพ AI
กำกับฉากตามสไตล์ของคุณ สร้างภาพด้วยมุมมอง ความลึก และสไตล์ที่ตั้งใจ
อัปโหลดรูปภาพของคุณและบอกเราว่าคุณจินตนาการอะไร
การรวมทั้งสองให้ผลลัพธ์ที่ดีที่สุด
เพลิดเพลินกับรูปภาพของคุณที่นำมาชีวิตโดย AI
สร้างภาพด้วย Z-Image AI
โมเดลภาพบางตัวเด่นที่อารมณ์และบรรยากาศ บางตัวเด่นที่ความสมจริงแบบพรีเมียม แต่ Z-Image จะน่าใช้จริงเมื่อโจทย์ต้องการความเร็ว การทำตามคำสั่งที่คมขึ้น และข้อความในภาพที่ยังพออ่านได้สะอาดกว่าที่คาดจากโมเดลสายเปิดทั่วไป นี่คือมุมที่มีประโยชน์กับผู้ใช้มากกว่าหน้าเก่าที่พูดกว้าง ๆ แค่ว่าเป็นเครื่องสร้างภาพ AI อีกตัวหนึ่ง
บน Cleep หน้านี้เชื่อมกับ Z-Image-Turbo โดยตรง ไม่ได้อิงกับประสบการณ์รวม ๆ แบบคลุมเครือ ในการตั้งค่าจริงของโปรดักต์ เส้นทางนี้ชี้ไปที่ fal-ai/z-image/turbo สำหรับ text-to-image และ fal-ai/z-image/turbo/image-to-image สำหรับงานแก้ภาพต่อ จุดนี้สำคัญมาก เพราะคนที่เข้ามาที่ /generate/image/z-image ไม่ได้อยากอ่านประวัติการวิจัยทั้งหมด แต่ต้องการรู้ว่า เมื่อไร Z-Image จะเหมาะกับโปสเตอร์ แพ็กเกจจิ้ง การ์ดสินค้า หรือภาพที่ต้องแก้ต่อจากเฟรมแรกที่เกือบดีอยู่แล้ว
แหล่งข้อมูลทางการรองรับมุมมองนี้ค่อนข้างชัด model card ทางการของ Z-Image-Turbo อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters โดยสาย Turbo ถูกออกแบบมาเพื่อความเร็ว ผลลัพธ์แนวภาพถ่ายที่ดี การ เรนเดอร์ข้อความภาษาอังกฤษและภาษาจีนภายในภาพ และการทำตามคำสั่งที่นิ่งขึ้น ส่วน model card ทางการของ Z-Image รุ่นฐาน จะเน้นเรื่อง diversity, negative prompting และ fine-tuning มากกว่า ขณะที่ paper Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer ช่วยอธิบายว่าทำไมตระกูลนี้ถึงน่าสนใจ: มันพยายามให้ประสิทธิภาพดีโดยไม่ต้องพึ่งโมเดลที่ใหญ่เทอะทะ
ให้เริ่มจาก Z-Image บน Cleep เมื่อคุณต้องการแตกหลายทิศทางของภาพอย่างรวดเร็ว อยากให้ข้อความสั้นในอังกฤษหรือจีนติดอยู่ในภาพได้สะอาดขึ้น และต้องการ workflow ที่สร้างเฟรมแรกแล้วค่อยแก้แบบ image-to-image ต่อได้ในเส้นทางเดียว
แหล่งอ้างอิงหลักของหน้านี้ คือ model card ทางการของ Z-Image-Turbo, model card ทางการของ Z-Image รุ่นฐาน, GitHub ทางการของ Tongyi-MAI และ paper ทางการ Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer
Z-Image เด่นกับงานแบบไหนจริง
วิธีอ่านหน้ารุ่นนี้ที่ตรงที่สุดไม่ใช่ “โมเดลเล็กที่พอทำได้ทุกอย่าง” แต่คือ ตระกูลสร้างภาพแบบเปิดที่เร็ว และรับมือกับข้อความภายในภาพได้ดีกว่าที่มักเจอในสาย Turbo model card ของ Turbo ระบุชัดถึงชุดจุดแข็งนี้: สร้างภาพแนว photorealistic ได้ดี, วางข้อความอังกฤษและจีนในภาพได้แม่นขึ้น, และทำตามคำสั่งได้ดี ทั้งหมดนี้เกิดขึ้นในรุ่นที่ถูก distilled มาเพื่อความเร็ว
เพราะแบบนี้ Z-Image จึงเหมาะกับงานที่ภาพต้องทำตัวเหมือน asset ที่พร้อมใช้งาน ไม่ใช่แค่ภาพสวยลอย ๆ เช่น การ์ดสินค้าที่ต้องมีพื้นที่สำหรับข้อความ โปสเตอร์ที่มี headline สั้น แพ็กเกจจิ้งที่ฉลากต้องอ่านพอออก หรือภาพโปรโมชันที่ต้องอัปโหลดภาพเดิมเข้ามาแล้วแก้เพียงพื้นหลัง แสง หรือความคมของข้อความ หากคิดแบบนี้ workflow ของ Cleep บนเส้นทางนี้จะชัดมาก: สร้างให้เร็ว เลือกเฟรมที่ดีที่สุด แล้วค่อยแก้แบบมีเป้าหมาย
ตระกูลโมเดลก็ช่วยอธิบายความต่างของหน้าด้วย model card ของ Turbo บอกว่าครอบครัว Z-Image มีสี่แขนหลักคือ Z-Image-Turbo, Z-Image, Z-Image-Omni-Base และ Z-Image-Edit นั่นไม่ได้แปลว่าหน้า Cleep นี้ต้องเล่าทุกสาขาเท่ากัน แต่ควรอธิบายอย่างตรงไปตรงมาว่า ผู้ใช้กำลังเข้าเส้นทาง Turbo ที่เหมาะกับงานเร็วและการแก้ต่อ ขณะที่ภาพรวมของตระกูลเป็นเหตุผลว่าทำไมเส้นทางนี้จึงดูน่าใช้กว่าหน้า text-to-image ทั่วไปสำหรับงานออกแบบสองภาษาและงาน asset ที่ต้องรีวิวหลายรอบ
บน Cleep เส้นทางจริงคือ Turbo
เพราะ route นี้จับกับ fal-ai/z-image/turbo และเวอร์ชัน image-to-image เนื้อหาจึงควรพูดถึงงานจริงที่ต้องเสร็จเร็ว ไม่ใช่พูดแต่ทฤษฎีของรุ่นฐาน
ข้อความในภาพไม่ใช่จุดเสริมเล็ก ๆ
model card ของ Turbo ยกความแม่นของข้อความภาษาอังกฤษและภาษาจีนขึ้นมาเป็นหนึ่งในจุดต่างหลักของรุ่นนี้โดยตรง
ตระกูลนี้เปิดเผยข้อมูลค่อนข้างตรง
ทั้ง model card ของ Z-Image และ Z-Image-Turbo ระบุ apache-2.0 ชัดเจน ซึ่งให้สัญญาณความน่าเชื่อถือที่ดีกว่าคำเคลมกว้าง ๆ ของโมเดลปิด
Turbo กับรุ่นฐานแก้คนละโจทย์
เอกสารทางการบอกว่ารุ่นฐานรองรับ CFG, negative prompting, fine-tuning และ diversity มากกว่า ส่วน Turbo เน้นความเร็วและคุณภาพภาพที่นิ่งในเวลาอันสั้น
แหล่งทางการของ Z-Image ยืนยันอะไรบ้าง
หน้า SEO ที่ดีควรแยก ข้อเท็จจริงที่ยืนยันได้ ออกจากข้อความฟุ้ง ๆ แบบ AI filler และกรณีของ Z-Image ก็มีข้อมูลทางการมากพอให้ทำแบบนั้นได้ชัดเจน
| หัวข้อ | สิ่งที่ยืนยันทางการ | ความหมายต่อผู้ใช้ |
|---|---|---|
| ขนาดของตระกูล | model card ของ Turbo อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters | นี่คือสายโมเดลที่ออกแบบมาเพื่อประสิทธิภาพ ไม่ใช่การโตด้วยพารามิเตอร์อย่างเดียว |
| ความเร็วของ Turbo | เอกสารทางการระบุว่า Z-Image-Turbo ทำงานได้ดีด้วย 8 NFEs | จึงเหมาะกับการแตกหลายเวอร์ชัน การรีวิวเร็ว และการทำ asset ที่ต้องการการแก้ต่อ |
| แนวทางด้านฮาร์ดแวร์ | paper พูดถึง sub-second latency บน H800 และการทำงานกับฮาร์ดแวร์ผู้ใช้ทั่วไปที่ราว 16GB VRAM ขณะที่ Turbo card ก็ระบุทิศทางคล้ายกัน | ภาพรวมคือโมเดลนี้ถูกสร้างมาให้มีประสิทธิภาพ ไม่ได้อาศัยแต่เครื่องใหญ่มหาศาล |
| ข้อความในภาพ | Turbo card ชูเรื่อง การเรนเดอร์ข้อความภาษาอังกฤษและภาษาจีนอย่างแม่นขึ้น | จึงเหมาะกับโปสเตอร์ แพ็กเกจจิ้ง การ์ดสินค้า และ creative แบบสองภาษามากกว่า route เปิดทั่วไปหลายตัว |
| สถาปัตยกรรม | paper และ model card พูดถึง Scalable Single-Stream DiT (S3-DiT) ที่รวม text, visual semantic tokens และ image VAE tokens ไว้ใน stream เดียว | มุมที่คนใช้ควรเข้าใจคือ ความเชื่อมระหว่าง prompt กับโครงสร้างภาพถูกออกแบบให้มีประสิทธิภาพมากขึ้น |
| trade-off ของรุ่นฐาน | model card ของรุ่นฐานระบุ CFG, negative prompting, 28 ถึง 50 steps, fine-tuning และ diversity ที่สูงกว่า | ถ้าต้องการ exploration ลึกหรือการควบคุมเชิงโมเดลมากขึ้น รุ่นฐานอธิบายว่าทำไม Turbo ไม่ได้ตั้งใจมาทดแทนทุกกรณี |
| สายแก้ภาพ | Turbo card ระบุว่ามี Z-Image-Edit สำหรับ image editing ที่ทำตามคำสั่งได้ดี | นี่รองรับวิธีอ่าน route บน Cleep ว่าเหมาะกับการสร้างแล้วแก้ต่อ ไม่ใช่แค่ one-shot generation |
| license | model card ทางการของ Z-Image และ Z-Image-Turbo ระบุ apache-2.0 | เรื่อง checkpoint แบบเปิดจึงชัดกว่าหน้าเก่าที่เคยเล่าไว้สับสน แม้ว่าผู้ใช้ Cleep จะใช้งานผ่าน route ที่โฮสต์ไว้ |
| ช่วงค่าที่แนะนำ | model card ของรุ่นฐานแนะนำ 512×512 ถึง 2048×2048, guidance scale 3.0 ถึง 5.0 และ 28 ถึง 50 steps | ตระกูลนี้ไม่ได้ถูกวางไว้สำหรับ output เล็ก ๆ แบบ demo เท่านั้น แต่รองรับงานภาพจริงจังค่อนข้างชัด |
เขียน prompt ให้ Z-Image อย่างไร เมื่อความเร็วและความอ่านง่ายสำคัญพร้อมกัน
ข้อผิดพลาดที่เจอบ่อยคือใช้ Z-Image เหมือนโมเดล “ทำภาพให้สวย” แบบกว้าง ๆ ทั้งที่มันจะทำงานดีขึ้นมากเมื่อ prompt อธิบาย หน้าที่ของภาพ อย่างชัดเจน นี่คือโปสเตอร์สองภาษา การ์ดสินค้า ภาพแพ็กเกจจิ้ง หรือภาพโปรโมชันที่ต้องเว้นพื้นที่สำหรับ copy หรือไม่ ถ้าเป็นงานแก้ภาพต่อก็ควรพูดให้ชัดว่าจุดไหนยังใช้ได้และจุดไหนต้องเปลี่ยน
กฎข้อสองคือแยกสิ่งที่ต้องอ่านออกจากสิ่งที่ต้องให้บรรยากาศ ถ้าภาพมีข้อความอยู่ภายใน ควรระบุว่าคำไหนต้องอ่านได้และวางไว้ตรงไหนของเฟรม ถ้าเป็น image-to-image ก็ควรระบุว่ารูปร่าง มุมกล้อง หรือสีหลักของวัตถุเดิมต้องคงอยู่ การระบุ boundary แบบนี้ช่วยให้ Z-Image ใช้จุดแข็งเรื่อง instruction following ได้เต็มกว่า prompt ที่เป็นรายการคำคุณศัพท์ยาว ๆ
กฎข้อสามคือใช้โมเดลนี้แบบ loop สั้น ๆ สร้างก่อน เลือกเฟรมที่มีโอกาสดีที่สุด แล้วค่อยแก้ทีละจุด วิธีนี้สอดคล้องกับเส้นทาง Turbo มากกว่าการพยายามยัดทุกอย่างไว้ใน mega-prompt หนึ่งครั้งเดียว
ใช้กับโปสเตอร์สองภาษา: กำหนดงานของเลย์เอาต์ก่อน แล้วค่อยบอกข้อความและตำแหน่งให้ชัด
ตัวอย่าง: สร้างโปสเตอร์เปิดตัวแบบสี่เหลี่ยมสำหรับชาเย็นแบรนด์พรีเมียม วางแพ็กเกจไว้กึ่งกลาง ใช้แสงสะอาดแบบโฆษณา ใส่ headline ภาษาอังกฤษว่า “Cold Brew Leaves” และมีบรรทัดภาษาจีนสั้น ๆ รองลงมา เว้นพื้นที่ด้านล่างไว้สำหรับ CTA อีกหนึ่งบรรทัด
ใช้กับการ์ดสินค้า: แยกตำแหน่งวัตถุ พื้นที่ข้อความ และอารมณ์รวมของชิ้นงานออกจากกัน
ตัวอย่าง: สร้างการ์ดสินค้า ecommerce สำหรับโคมไฟตั้งโต๊ะ วางโคมไฟทางขวา เว้นพื้นที่ข้อความด้านซ้ายสำหรับ bullet สั้นสามข้อ ใช้เงานุ่ม พื้นหลังโทนกลางอ่อน และบรรยากาศแบบ editorial ที่ดูพรีเมียม
ใช้กับ image-to-image: บอกให้ชัดว่าอะไรต้องคงเดิมและอะไรคือการเปลี่ยนแปลงจริง
ตัวอย่าง: ใช้ภาพแพ็กเกจที่อัปโหลดมา คงรูปทรงขวด สีแบรนด์ และมุมกล้องเดิมไว้ทั้งหมด เปลี่ยนเฉพาะพื้นหลังให้สว่างขึ้นเป็นผิวหินอ่อน และทำให้ข้อความบนฉลากด้านหน้าชัดขึ้น
ใช้กับการแตกหลายเวอร์ชันเร็ว ๆ: ขอความต่างที่ควบคุมได้ แทนการรีเซ็ตภาพทั้งหมด
ตัวอย่าง: สร้าง hero shot ของแก้วเซรามิกสามเวอร์ชัน โดยให้หนึ่งเวอร์ชันอุ่นและสว่างกว่าเดิม หนึ่งเวอร์ชันเข้มและหรูขึ้น และอีกหนึ่งเวอร์ชันมี negative space มากขึ้นสำหรับวางข้อความโฆษณา
Z-Image เหมาะกับ workflow แบบไหนในงานจริง
คุณจะเห็นคุณค่าของ Z-Image ชัดขึ้นเมื่อเลิกมองมันเป็นถ้วยรางวัลทางเทคนิค แล้วมองมันเป็น เส้นทางผลิต asset ที่เร็วและแก้ต่อได้ สำหรับ Cleep คำถามที่สำคัญไม่ใช่ “โมเดลนี้ชนะทุกตัวไหม” แต่คือ “มันช่วยให้เราได้ภาพที่ใช้งานได้เร็วขึ้น มีข้อความที่สะอาดขึ้น และยังปรับแก้ต่อได้โดยไม่ต้องสลับเครื่องมือหรือไม่”
มุมนี้มีประโยชน์ทั้งต่อ SEO และต่อผู้ใช้จริง เพราะมันบอกได้ชัดว่า route นี้เหมาะกับงานประเภทใด และเมื่อไรควรเปรียบเทียบกับโมเดลอื่นแทน เช่น งานที่เน้น typography หนักมาก งานที่ต้องการ photorealism ระดับสุด หรืองานที่อยากสำรวจอารมณ์ภาพแบบเปิดกว้างมากกว่า asset-ready output
| กรณีใช้งาน | เหตุผลที่ Z-Image เหมาะ | สิ่งที่ควรระบุให้ชัด |
|---|---|---|
| โปสเตอร์สองภาษาและชิ้นงานโปรโมชัน | Turbo card ระบุชัดเรื่องข้อความอังกฤษและจีนภายในภาพ | headline, ข้อความรอง, ตำแหน่ง copy และพื้นที่ว่างที่ยังต้องเหลือไว้ |
| แพ็กเกจจิ้งและ mockup ฉลาก | งานแบบนี้ให้ค่าน้ำหนักกับข้อความสั้นที่อ่านได้และการทำตามคำสั่งมากกว่าการสร้าง mood อย่างเดียว | รูปทรงแพ็ก สีแบรนด์ องค์ประกอบที่ห้ามเปลี่ยน และโซนฉลากที่ต้องชัดขึ้น |
| การ์ดสินค้าหลายเวอร์ชัน | เส้นทาง Turbo เหมาะกับการแตกหลายทิศทางอย่างเร็วและเลือกเวอร์ชันที่พร้อมใช้งานที่สุด | ตำแหน่งวัตถุ พื้นที่ข้อความ ครอป แสง และจำนวนเวอร์ชันที่ต้องการ |
| การแก้ภาพแบบ image-to-image | Cleep เปิดให้ใช้ image-to-image ใน route เดียว และตระกูล Z-Image ยังมีสาย Edit รองรับการทำตามคำสั่งเพื่อแก้ภาพ | สิ่งที่ต้องคงเดิม สิ่งที่ต้องแก้ และว่าการเปลี่ยนอยู่ที่แสง พื้นหลัง บรรจุภัณฑ์ หรือความอ่านง่ายของข้อความ |
| การทดลองกับโมเดลสายเปิด | เอกสารทางการเปิดเผยเรื่อง checkpoint และ license ชัดกว่าหลาย route ที่เล่าคลุมเครือ | ว่าคุณต้องการความเร็วแบบ hosted บน Cleep หรือสนใจแนวคิดของตระกูลโมเดลในระดับลึกกว่า |
| งานภาพแบบโปสเตอร์ที่ยังต้องสื่อสาร | Z-Image จะน่าสนใจมากขึ้นเมื่อภาพต้อง “สื่อสาร” ไม่ใช่แค่ดูสวย | พื้นที่ตัวอักษร negative space ความต้องการสองภาษา และระดับความเคร่งของ instruction following |
ควรเลือก Z-Image หรือไปเทียบกับโมเดลใกล้เคียง
หน้า route ที่ดีไม่ควรอ้างว่าโมเดลตัวหนึ่งชนะทุกอย่าง จุดขายที่ตรงและเชื่อถือได้ของ Z-Image คือ มันเป็นโมเดลภาพสายเปิดที่เร็ว และรับมือกับข้อความอังกฤษหรือจีนภายในภาพได้ดีพอที่จะเอาไปใช้กับงาน asset จริง ถ้าโจทย์เปลี่ยนไปเป็นงาน typography-first, photorealism แบบสุดทาง หรือภาพที่เน้นอารมณ์หลวม ๆ มากกว่าโครงสร้างของชิ้นงาน ก็มีเหตุผลที่จะเทียบกับ route อื่น
เลือก Z-Image
เมื่อคุณต้องการความเร็ว การแตกหลายเวอร์ชัน image-to-image และข้อความสั้นในอังกฤษหรือจีนที่ยังมีโอกาสอ่านได้ดีในภาพเดียวกัน
เทียบกับ Qwen
เมื่องานเริ่มหนักไปทางเลย์เอาต์ ตัวอักษร หรือโครงสร้างแบบสไลด์มากกว่างาน asset ที่เน้นความเร็ว
เทียบกับ Ideogram
ถ้าปัญหาหลักคือโปสเตอร์หรือ graphic composition ที่ typography เป็นแกนหลักของภาพ
เทียบกับ Nano Banana
ถ้าคุณให้ความสำคัญกับ loop การแก้เร็วแบบสนทนาและการ branch แบบเบา ๆ มากกว่าความนิ่งของข้อความสองภาษาในเฟรม
เทียบกับ Imagen 4 Ultra
ถ้าความต้องการหลักคือ photoreal finish ระดับสูงมากกว่าความเร็วพร้อมข้อความที่อ่านง่าย
เทียบกับ Krea
ถ้างานเน้น mood, feel และการสำรวจภาพแบบ editorial มากกว่าการทำ asset ที่มีโซนข้อความและโครงสร้างชัด
- เริ่มจากบทบาทของ asset: โปสเตอร์, pack shot, การ์ดสินค้า, โปรโมชัน หรือการแก้ภาพที่มีอยู่แล้ว
- ระบุโซนข้อความ: ถ้ามีคำที่ต้องอ่านได้จริง prompt ควรบอกทั้งข้อความและตำแหน่งในเฟรม
- ใช้ image-to-image เมื่อเฟรมแรกเกือบถูกแล้ว: ไม่จำเป็นต้องสุ่มใหม่ทั้งภาพถ้าปัญหาอยู่เพียงบางส่วน
- เทียบโมเดลอย่างตรงไปตรงมา: ถ้างานกลายเป็น typography-first มาก ๆ Qwen หรือ Ideogram อาจเหมาะกว่า
- จำให้ชัดว่าคุณกำลังใช้เส้นทางใด: บน Cleep หน้านี้คือเส้นทาง Turbo ไม่ใช่การรวมทุกแขนของตระกูล Z-Image ไว้เท่ากัน
เราตรวจสอบอะไรมาแล้วสำหรับไกด์นี้
บทความเวอร์ชันนี้อิงกับเอกสารทางการและการตั้งค่า route จริงของ Cleep ไม่ได้อิงกับ benchmark roundup หรือข้อความโฆษณาแบบกว้าง ๆ แหล่งข้อมูลหลักคือ model card ทางการของ Z-Image-Turbo, model card ทางการของ Z-Image รุ่นฐาน, GitHub ทางการของ Tongyi-MAI และ paper Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer ฉันตัดเนื้อหาเก่าที่เป็นตารางฮาร์ดแวร์แบบเดาสุ่ม การเปรียบเทียบที่ไม่มีแหล่งรองรับ และภาษาที่พยายามทำให้รุ่นนี้ดูเหมือนเก่งทุกอย่างออกไป เพื่อให้หน้า route ซื่อสัตย์กับความสามารถจริงมากขึ้น
คำถามที่พบบ่อยเกี่ยวกับ Z-Image
-
Z-Image บนหน้านี้หมายถึงอะไร
บน Cleep route นี้ควรถูกเข้าใจก่อนว่าเป็นเส้นทาง Z-Image-Turbo ที่เปิดทั้ง text-to-image และ image-to-image สำหรับงานเร็วและการแก้ต่อ
-
ตระกูล Z-Image มีขนาดเท่าไรตามเอกสารทางการ
Turbo card อธิบายว่า Z-Image เป็น ตระกูลโมเดลสร้างภาพขนาด 6B parameters
-
ทำไม route นี้ถึงดูเร็ว
เพราะเอกสารทางการระบุว่า Z-Image-Turbo ทำงานด้วย 8 NFEs จึงถูกวางให้เป็นสายที่เน้นความเร็วของตระกูล
-
Z-Image รับมือข้อความในภาพได้ดีจริงหรือไม่
Turbo card ระบุชัดว่าจุดแข็งของรุ่นนี้คือการเรนเดอร์ข้อความ ภาษาอังกฤษและภาษาจีน ภายในภาพได้แม่นขึ้น
-
สามารถใช้ route นี้เพื่อแก้ภาพ ไม่ใช่แค่สร้างภาพใหม่ได้ไหม
ได้ Cleep เปิด image-to-image ไว้ใน route เดียว และตระกูลโมเดลยังมี Z-Image-Edit สำหรับงานแก้ภาพโดยตรง
-
เมื่อไรควรเลือก Z-Image แทน Qwen
เมื่อคุณต้องการความเร็ว การแตกหลายทิศทางของภาพ และข้อความอังกฤษหรือจีนที่ยังพออ่านได้ภายในภาพเดียวกัน ถ้างานหนักไปทางเลย์เอาต์และ typography มากกว่า Qwen อาจเหมาะกว่า
-
เมื่อไรควรเปรียบเทียบกับ Ideogram
เมื่อชิ้นงานเป็นปัญหาแบบโปสเตอร์หรือ graphic layout ที่ตัวอักษรคือพระเอกหลักของภาพ
-
รุ่นฐานของ Z-Image แนะนำขนาดภาพและค่าอะไรบ้าง
model card ของรุ่นฐานแนะนำ 512×512 ถึง 2048×2048, guidance scale 3.0 ถึง 5.0 และ 28 ถึง 50 steps
-
ทำไมไม่ควรเริ่มด้วย mega-prompt ยาวมาก
เพราะ route นี้มักให้ผลดีกว่าเมื่อ prompt ระบุหน้าที่ของภาพ โซนข้อความ และขอบเขตของการแก้ต่ออย่างชัดเจน แล้วทำงานแบบหลายรอบสั้น ๆ
-
ตระกูล Z-Image เปิดเผยข้อมูลเรื่อง license หรือไม่
เปิดเผย ทั้ง Z-Image และ Z-Image-Turbo ระบุ apache-2.0 ใน model card ทางการ
โปรโมชันพิเศษ
สร้างภาพและวิดีโอ AI ที่น่าทึ่งด้วยเครื่องมือที่จำเป็น
ปลดล็อกแผน Basic ได้เพียง $1
การต่ออายุอัตโนมัติเป็นสถานะออนไลน์ โปรโมชันจะพร้อมใช้งานจนกว่าคุณจะเปลี่ยนแผนของคุณและใช้ AI ของเราเพื่อสร้างรูปภาพที่น่าทึ่ง ข้อเสนอจะหมดอายุเมื่อวันที่ 14 กุมภาพันธ์ และปลดล็อกเท่านั้นวิธีนี้มีคุณค่าสำหรับคุณ ส่วนลด 90%
ด้วยการเลือกอายุของคุณและดำเนินการต่อ คุณตกลงกับ เงื่อนไขการใช้ และ นโยบายความเป็นส่วนตัว
โปรดตรวจสอบก่อนดำเนินการต่อ