مولد صور بالذكاء الاصطناعي
وجّه المشهد بطريقتك. أنشئ صورًا مرئية بزوايا وعمق وأسلوب مقصود
حمّل صورتك وأخبرنا بما تتخيل
الجمع بين الاثنين يعطي أفضل النتائج
استمتع بصورتك التي أحياها الذكاء الاصطناعي
أنشئ صورًا باستخدام Z-Image AI
بعض نماذج الصور تكون مفيدة عندما يكون كل ما تحتاجه هو استكشاف مزاج بصري بسرعة. وبعضها يلمع عندما تكون الأولوية للفوتوريالية العالية. أما Z-Image فيظهر فعله الحقيقي عندما تكون المهمة عملية أكثر: تحتاج إلى السرعة، وإلى التزام أوضح بالتعليمات، وإلى نص قصير داخل الصورة يبقى أكثر قابلية للقراءة مما تتوقعه عادة من مسار سريع ومفتوح. هذا هو الفهم الأصدق لهذه الصفحة، وليس الوعد القديم الفضفاض بأنها مجرد أداة أخرى لصنع صور جميلة.
على Cleep ترتبط هذه الصفحة مباشرة بـ Z-Image-Turbo. وفي الإعداد الحي للمنتج، يشير المسار إلى fal-ai/z-image/turbo لتوليد الصور من النص، وإلى fal-ai/z-image/turbo/image-to-image لتعديل الصور انطلاقًا من صورة موجودة. وهذه نقطة مهمة لأن الزائر الذي يصل إلى /generate/image/z-image لا يريد في العادة كل تفاصيل الورقة البحثية؛ بل يريد أن يعرف متى يكون هذا المسار السريع مناسبًا للملصقات، والتغليف، وبطاقات المنتجات، أو للصور التي اقتربت من الشكل الصحيح لكنها ما تزال تحتاج إلى تصحيح ذكي.
المصادر الرسمية تدعم هذا التموضع بوضوح. يصف الـ model card الرسمي لـ Z-Image-Turbo العائلة على أنها عائلة لتوليد الصور بحجم 6B parameters، ويضع Turbo بوصفه المسار المخصص للسرعة، وللنتائج الفوتوريالية القوية، ولـ إظهار النص الإنجليزي والصيني داخل الصورة بشكل أدق، وللالتزام الأفضل بالتعليمات. أما الـ model card الرسمي لنسخة Z-Image الأساسية فيركز أكثر على التنوع، والـ negative prompting، والـ fine-tuning. ثم تأتي الورقة البحثية Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer لتوضح لماذا تستحق العائلة الانتباه أصلًا: بنية أكثر كفاءة تحاول أن تعطي نتائج قوية من دون أن تتحول إلى نموذج ضخم بشكل مرهق.
ابدأ بـ Z-Image على Cleep عندما تريد اختبار أكثر من اتجاه بصري بسرعة، والحفاظ على نص قصير بالإنجليزية أو بالصينية بشكل أنظف داخل الصورة، ثم أخذ النسخة الأفضل وتطويرها عبر image-to-image من دون مغادرة المسار نفسه.
المراجع الأساسية وراء هذه الصفحة هي الـ model card الرسمي لـ Z-Image-Turbo، والـ model card الرسمي لنسخة Z-Image الأساسية، ومستودع Tongyi-MAI الرسمي على GitHub، والورقة الرسمية Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer.
أين يبدو Z-Image مفيدًا فعلًا
ليس من الدقة أن ننظر إلى هذه الصفحة على أنها “نموذج أصغر يفعل كل شيء بشكل مقبول”. الوصف الأقرب للحقيقة هو عائلة صور مفتوحة وسريعة، مع قدرة غير معتادة على التعامل مع النص داخل الصورة مقارنة بما اعتدناه من المسارات السريعة. الـ Turbo card يضع هذه التركيبة في الواجهة بوضوح: جودة بصرية جيدة، ونص إنجليزي وصيني أكثر ثباتًا داخل الصورة، واتباع أقوى للتعليمات، وكل ذلك داخل نسخة مقطرة من أجل السرعة.
وهذا ما يجعل Z-Image مناسبًا خصوصًا عندما ينبغي للصورة أن تتصرف كـ أصل عملي قابل للاستخدام، لا مجرد صورة جميلة. بطاقة منتج تحتاج إلى منطقة واضحة للنص. ملصق فيه عنوان قصير يجب أن يبقى مقروءًا. تصور لتغليف يحتاج إلى بطاقة أو ملصق أوضح. أو أصل إعلاني مرفوع سابقًا يحتاج فقط إلى إصلاح الخلفية أو الإضاءة أو وضوح الكلمات. وبما أن Cleep يفتح في هذا المسار كلًا من text-to-image وimage-to-image، فإن أفضل طريقة لاستعماله هي: ولّد بسرعة، اختر النسخة الأقرب، ثم صحح بوعي.
كما أن فهم بنية العائلة يساعد في قراءة الصفحة بشكل أدق. فبحسب الـ Turbo card تضم العائلة Z-Image-Turbo وZ-Image وZ-Image-Omni-Base وZ-Image-Edit. وهذا لا يعني أن صفحة Cleep يجب أن تشرح كل فرع بالتفصيل نفسه، لكنه يعني أننا نستطيع أن نكون صريحين: المستخدم هنا يدخل من باب Turbo، بينما تفسر العائلة الأوسع لماذا يبدو هذا المسار أكثر إقناعًا لتصميمات ثنائية اللغة ولعمليات التنقيح السريعة من صفحة text-to-image عامة.
المسار الحي على Cleep هو Turbo
لأن الصفحة ترتبط فعليًا بـ fal-ai/z-image/turbo وبنسخة image-to-image المرتبطة به، فمن الطبيعي أن يتكلم المحتوى عن مهام واقعية لا عن نظرية عامة حول النموذج الأساسي فقط.
النص داخل الصورة ليس تفصيلة جانبية
الـ Turbo card يضع دعم النص الإنجليزي والصيني داخل الصورة بوصفه واحدًا من أوضح الفروق في العائلة كلها.
العائلة موثقة بشكل مفتوح
كل من Z-Image وZ-Image-Turbo مميزان بترخيص apache-2.0 في المصادر الرسمية، وهذا أوضح بكثير من السرد الضبابي الذي يحيط عادة بالنماذج المغلقة.
Turbo وBase ليسا لشيء واحد
المقارنة الرسمية تقول إن النسخة الأساسية أقوى في CFG والـ negative prompts والـ fine-tuning والتنوع، بينما صُمم Turbo للسرعة ولمستوى جودة بصري مرتفع ومستقر.
ما الذي تؤكده المصادر الرسمية حول Z-Image؟
الصفحة القوية في SEO لا تبني نفسها على خطاب عام، بل على حقائق يمكن التحقق منها. وفي حالة Z-Image يمكن القيام بهذا الفصل بسهولة معقولة لأن المواد الرسمية تتضمن نقاطًا واضحة.
| المجال | ما تؤكده المصادر رسميًا | المعنى العملي للمستخدم |
|---|---|---|
| حجم العائلة | يصف الـ Turbo card Z-Image على أنه عائلة لتوليد الصور بحجم 6B parameters. | هذا يضعه ضمن عائلة كفؤة ومصممة للعمل العملي، لا ضمن فئة النماذج العملاقة فقط. |
| سرعة مسار Turbo | يذكر الـ Turbo card أن Z-Image-Turbo يحقق نتائج قوية مع 8 NFEs. | ولهذا يبدو المسار مناسبًا للتكرار السريع، وجولات المراجعة القصيرة، وصناعة عدة نسخ بسرعة. |
| التوجه العتادي | تشير الورقة إلى sub-second latency على H800، وإلى توافق مع عتاد استهلاكي في حدود 16GB VRAM. | هذا يعني أن العائلة صممت بروح الكفاءة، لا بروح التضخم في الحجم فقط. |
| النص داخل الصورة | يبرز الـ Turbo card القدرة على إظهار النص الإنجليزي والصيني بدقة أكبر داخل الصورة. | وهذا ما يجعل النموذج أكثر فائدة للملصقات، والتغليف، وبطاقات المنتجات، والأصول التسويقية ثنائية اللغة. |
| المعمارية | تتحدث الورقة والبطاقات عن Scalable Single-Stream DiT (S3-DiT) الذي يجمع النص، والـ visual semantic tokens، وimage VAE tokens داخل مسار واحد. | عمليًا، يعني ذلك علاقة أكثر كفاءة بين ما تكتبه وبين البنية التي تخرج بها الصورة. |
| المقايضة مع النموذج الأساسي | تذكر البطاقة الأساسية CFG وnegative prompting و28 إلى 50 steps وfine-tuning وتنوعًا أعلى. | هذا يفسر لماذا لا يحاول Turbo أن يكون بديلًا عن كل أشكال الاستكشاف المتقدم. |
| فرع التحرير | يشير الـ Turbo card إلى Z-Image-Edit بوصفه فرعًا مخصصًا لتحرير الصور مع instruction following قوي. | وهذا يدعم قراءة عملية للمسار: إنتاج ثم مراجعة ثم تصحيح، لا توليد مرة واحدة فقط. |
| الترخيص | تظهر كل من بطاقتي Z-Image وZ-Image-Turbo ترخيص apache-2.0. | وهذا يجعل قصة الانفتاح أوضح كثيرًا مما كانت توحي به الصفحة القديمة. |
| الإعدادات الموصى بها | توصي البطاقة الأساسية بـ 512×512 إلى 2048×2048، وguidance scale بين 3.0 و5.0، و28 إلى 50 step. | ما يعني أن العائلة ليست مجرد نموذج للعرض السريع، بل موجهة أيضًا إلى إخراج بصري جاد. |
كيف تكتب Prompt جيدًا لـ Z-Image عندما تكون السرعة والوضوح مهمين معًا؟
الخطأ الأكثر شيوعًا هو استعمال Z-Image كأنه أداة “أعطني شيئًا جميلًا” فقط. في الواقع تظهر قوته عندما يشرح الـ prompt وظيفة الصورة. هل هي ملصق ثنائي اللغة؟ بطاقة منتج؟ محاكاة لتغليف؟ أصل إعلاني بعنوان قصير؟ أم صورة مرفوعة تحتاج إلى تصحيح الخلفية أو الإضاءة أو الملصق؟ هذا النوع من الوصف العملي أكثر فائدة من تجميع صفات عامة.
القاعدة الثانية هي التمييز بين ما يجب أن يكون مقروءًا وما يكفي أن يكون جماليًا. إذا كان هناك نص داخل الصورة فقل ما الكلمات التي يجب أن تظهر بوضوح وأين يجب أن توضع. وإذا كنت تعمل بـ image-to-image فاشرح أيضًا ما الذي يجب أن يبقى ثابتًا. هذا النوع من الحدود يجعل المسار أكثر قوة، لأنه يمنعك من إعادة توليد أجزاء تعمل أصلًا.
أما القاعدة الثالثة فهي استخدام Z-Image في حلقات قصيرة: ولّد، اختر النسخة الأقرب، ثم أصلح نقطة أو نقطتين واضحتين. هذا الأسلوب ينسجم مع منطق Turbo أكثر بكثير من prompt طويل يحاول حل كل شيء دفعة واحدة.
للملصقات ثنائية اللغة: ابدأ بمهمة التخطيط البصري، ثم أضف النص ومكانه.
مثال: أنشئ ملصق إطلاق مربع لعلامة شاي بارد فاخرة. ضع العبوة في المنتصف، واستخدم إضاءة دعائية نظيفة، وأضف العنوان الإنجليزي “Cold Brew Leaves” مع سطر داعم قصير بالصينية أسفله، واترك في الأسفل مساحة لسطر CTA واحد.
لبطاقات المنتجات: افصل بين مكان العنصر ومنطقة النص والانطباع العام.
مثال: أنشئ بطاقة منتج نظيفة لمتجر إلكتروني خاص بمصباح مكتبي. ضع المصباح إلى اليمين، واترك مساحة نص إلى اليسار لثلاث نقاط قصيرة، واستخدم ظلالًا ناعمة وخلفية محايدة فاتحة وطابعًا تحريريًا راقيًا.
للتعديل عبر image-to-image: اذكر بوضوح ما الذي يجب أن يبقى، وما الذي يجب تغييره بالفعل.
مثال: استخدم صورة التغليف المرفوعة. حافظ على شكل الزجاجة، ولون العلامة، وزاوية الكاميرا كما هي. غيّر الخلفية فقط إلى سطح حجري أكثر إشراقًا، واجعل النص على الملصق الأمامي أوضح في القراءة.
لإخراج نسخ متعددة بسرعة: اطلب فروقًا مضبوطة بدل إعادة ضبط المشهد كله.
مثال: أنشئ ثلاث نسخ من اللقطة الرئيسية نفسها لكوب خزفي: نسخة أكثر دفئًا وإشراقًا، ونسخة أغمق وأكثر فخامة، ونسخة أنظف مع مساحة سلبية أكبر لوضع نص إعلاني.
أين يدخل Z-Image في سير العمل الحقيقي؟
يصبح Z-Image أوضح كثيرًا عندما تتوقف عن اعتباره إنجازًا تقنيًا، وتبدأ في النظر إليه على أنه مسار سريع لإنتاج أصل بصري يمكن تطويره. السؤال المهم على Cleep ليس هل النموذج أفضل من الجميع، بل هل يساعدك على الحصول على صورة أولى قابلة للاستعمال بسرعة، والحفاظ على نص قصير بشكل أنظف، ثم تحسين الصورة من دون تبديل الأدوات.
هذا الإطار مفيد للمستخدم ولـ SEO معًا، لأنه يحدد متى يناسب المسار، ومتى يصبح من المنطقي مقارنة نماذج أخرى. فإذا كانت المهمة أكثر اعتمادًا على الطباعة، أو تحتاج إلى فوتوريالية قصوى، أو تبحث عن استكشاف مزاجي أكثر تحررًا، فمن الأفضل فتح مقارنات إضافية.
| سيناريو الاستخدام | لماذا يناسبه Z-Image | ما الذي يجب تحديده |
|---|---|---|
| ملصقات ثنائية اللغة وبطاقات ترويجية | لأن الـ Turbo card يبرز النص الإنجليزي والصيني داخل الصورة بشكل مباشر. | العنوان، والسطر الداعم، ومكان النص، وحجم المساحة الفارغة المطلوبة. |
| التغليف ومحاكاة الملصقات | في هذا النوع من الأعمال تكون قابلية القراءة واتباع التعليمات أهم من الجو العام وحده. | شكل العبوة، وألوان العلامة، والعناصر الثابتة، ومنطقة الملصق التي تحتاج إلى وضوح أكبر. |
| نسخ متعددة من بطاقات المنتجات | لأن Turbo مصمم أصلًا للسرعة، وهو ما يناسب اختبار عدة اتجاهات في وقت قصير. | موضع العنصر، ومساحة النص، والقص، والإضاءة، وعدد النسخ المطلوبة. |
| التنظيف عبر image-to-image | لأن Cleep يقدمه داخل المسار نفسه، والعائلة لديها أيضًا فرع Edit للتصحيحات الأدق. | ما الذي يجب الحفاظ عليه، وما الذي يجب تحسينه، وهل التغيير في الضوء أم الخلفية أم التغليف أم وضوح النص. |
| استكشاف النماذج المفتوحة | لأن المصادر الرسمية توثق العائلة وترخيصها بشكل واضح نسبيًا. | هل تحتاج إلى السرعة المستضافة على Cleep، أم تريد فهم العائلة كنظام أوسع. |
| صور تشبه الملصقات لكنها يجب أن توصل رسالة | يصبح Z-Image أكثر إقناعًا عندما يكون على الصورة أن تبدو جيدة وأن تنقل معنى واضحًا أيضًا. | منطقة الطباعة، والمساحة السلبية، ومتطلبات اللغة، ومدى صرامة التعليمات. |
متى تختار Z-Image، ومتى تنظر إلى نموذج آخر؟
الصفحة الجيدة لا تتظاهر بأن نموذجًا واحدًا هو الأفضل لكل شيء. الموضع الأقوى لـ Z-Image هو أنه مسار صور مفتوح وسريع، مع معالجة أكثر إقناعًا للنص القصير بالإنجليزية أو الصينية مما نتوقعه عادة من فئة Turbo. أما إذا أصبحت المهمة أكثر اعتمادًا على الطباعة، أو أكثر تطرفًا في الفوتوريالية، أو أكثر تحررًا ومزاجية، فمن الطبيعي أن تقارن بمسارات أخرى.
اختر Z-Image
عندما تكون السرعة، وإخراج نسخ متعددة، وimage-to-image، والنص القصير بالإنجليزية أو الصينية مهمة في الصورة نفسها.
قارنه مع Qwen
إذا أصبحت المهمة أقرب إلى التخطيط البصري المعتمد على النص والبنية، أو إلى منطق الشرائح واللافتات.
قارنه مع Ideogram
إذا كانت المشكلة الأساسية هي الملصق أو التكوين الجرافيكي، وكانت الطباعة هي بطل الصورة الحقيقي.
قارنه مع Nano Banana
إذا كانت التعديلات السريعة الحوارية والتجريب الخفيف أهم لك من النص الثنائي اللغة داخل المشهد.
قارنه مع Imagen 4 Ultra
إذا كانت الأولوية القصوى هي التشطيب الفوتوريالي النهائي، لا السرعة الممزوجة بثبات النص.
قارنه مع Krea
إذا كانت المهمة أكثر مزاجية وتحريرية، وأقل اعتمادًا على مناطق النص أو البنية العملية للأصل البصري.
- ابدأ من وظيفة الأصل البصري: ملصق، أو pack shot، أو بطاقة منتج، أو أصل ترويجي، أو مراجعة لصورة موجودة.
- سمِّ منطقة النص بوضوح: إذا كانت هناك كلمات يجب أن تُقرأ، فاكتبها واذكر مكانها داخل التكوين.
- استخدم image-to-image عندما تكون النسخة الأولى قريبة: لا حاجة لإعادة المشهد كله إذا كان الخلل محصورًا في جزء صغير.
- قارن بصدق: إذا تحولت المهمة إلى typography-first بشكل واضح، فقد يكون Qwen أو Ideogram أنسب.
- تذكر طبيعة هذا المسار: على Cleep تمثل هذه الصفحة مسار Turbo، لا العائلة كاملة دفعة واحدة.
ما الذي تحققنا منه في هذه الصفحة؟
إعادة الكتابة هذه تعتمد على المصادر الرسمية وعلى إعداد المسار الحي داخل Cleep، لا على benchmark roundup ولا على filler AI قديم. والمراجع الأساسية هي الـ model card الرسمي لـ Z-Image-Turbo، والـ model card الرسمي للنسخة الأساسية، ومستودع Tongyi-MAI الرسمي، والورقة Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer. وقد حذفت من الصفحة القديمة جداول العتاد غير الموثقة، والمقارنات التخيلية، واللغة المتضخمة التي تصف المسار كأنه الأفضل لكل السيناريوهات.
الأسئلة الشائعة حول Z-Image
-
ما المقصود بـ Z-Image في هذه الصفحة؟
على Cleep يُفهم هذا المسار أولًا بوصفه مسار Z-Image-Turbo مع دعم كل من text-to-image وimage-to-image.
-
ما حجم عائلة Z-Image وفق المصادر الرسمية؟
يصف الـ Turbo card العائلة بأنها عائلة لتوليد الصور بحجم 6B parameters.
-
لماذا يبدو هذا المسار سريعًا؟
لأن Z-Image-Turbo مصمم لإعطاء نتائج قوية مع 8 NFEs، كما توضح البطاقة الرسمية.
-
هل Z-Image جيد فعلًا في النص داخل الصورة؟
نعم. يبرز الـ Turbo card دعم النص الإنجليزي والصيني داخل الصورة كواحدة من نقاط القوة الأساسية.
-
هل يمكن استخدام المسار للتعديل، وليس فقط لتوليد صور جديدة؟
نعم. Cleep يفتح image-to-image هنا، كما أن العائلة تضم أيضًا Z-Image-Edit كفرع مخصص للتعديل.
-
متى يكون Z-Image أنسب من Qwen؟
عندما تكون السرعة، والنسخ المتعددة، والنص القصير بالإنجليزية أو الصينية مهمة في الصورة نفسها. أما إذا أصبحت المهمة أكثر اعتمادًا على التخطيط والطباعة فمقارنة Qwen منطقية.
-
متى يجب أن أنظر إلى Ideogram بدلًا من ذلك؟
عندما تصبح المهمة أقرب إلى تصميم ملصق أو تكوين جرافيكي، وتكون الطباعة هي العنصر الأكثر أهمية في النتيجة.
-
ما الأحجام والقيم الموصى بها في النموذج الأساسي؟
توصي البطاقة الأساسية بأحجام من 512×512 إلى 2048×2048، وguidance scale بين 3.0 و5.0، و28 إلى 50 step.
-
لماذا لا يُفضَّل البدء بـ mega-prompt طويل جدًا؟
لأن هذا المسار يعمل بصورة أفضل عندما تكون وظيفة الأصل البصري، ومنطقة النص، وحدود التعديل اللاحق مكتوبة بوضوح، ثم تُدار المهمة على شكل جولات قصيرة.
-
هل الترخيص واضح في المصادر الرسمية؟
نعم. كل من Z-Image وZ-Image-Turbo يحملان ترخيص apache-2.0 في البطاقات الرسمية.
عرض ترويجي خاص
أنشئ صور وفيديوهات ذكية مذهلة باستخدام الأدوات الأساسية
فتح خطة الأساسية مقابل $1
التجديد التلقائي نشط عبر الإنترنت. سيكون العرض الترويجي متاحاً حتى تغير خطتك واستخدم ذكاؤنا الاصطناعي لإنشاء صور مذهلة. ينتهي العرض في 14 فبراير، وفتح فقط هذه الميزة تستحق الاهتمام خصم 90%
باختيارك عمرك والمتابعة فأنت توافق على شروط الاستخدام و سياسة الخصوصية
يرجى المراجعة قبل المتابعة