يتيح لك مولد الذكاء الاصطناعي الجديد من Google استخدام المراجع المرئية عندما لا تتمكن من العثور على الكلمات

لقد كانت مولدات الصور ذات الذكاء الاصطناعي تسعدنا (وتطاردنا) منذ عدة سنوات، وذلك بفضل OpenAI وImagen وAdobe Firefly وDALL-E-3 والمزيد. مع تقدم التكنولوجيا، يبدو أن لدينا المزيد والمزيد من الخيارات لتحسين نتائجنا. الآن، أصدرت Google Labs Whisk، وهي أداة تتيح لك تحميل الصور كإرشادات بدلاً من المطالبات النصية.
يقوم مخفق Google Labs بإنشاء صور — من صور أخرى
إذا كنت تعيش في الولايات المتحدة، فسيكون بإمكانك الآن الوصول إلى Whisk من Google Labs، وهي “تجربة في الذكاء الاصطناعي التوليدي”، وفقًا مدونة جوجل. باستخدام Whisk، بدلاً من الاعتماد فقط على المطالبات النصية الوصفية، يمكنك إضافة صور كمراجع. ستطلب المنصة ثلاث خصائص رئيسية: الموضوع والمشهد والأسلوب. ستقوم الأداة بعد ذلك بخلط أو “خفق” هذه المكونات معًا وإنشاء الصورة المثالية لك.
يستخدم Whisk Imagen 3، أحدث نموذج لإنشاء الصور من Google.
لم تتخلص Google من المطالبات النصية تمامًا باستخدام Whisk. لا يزال لديك خيار كتابة مطالبات الإنشاء لكل فئة من الفئات الثلاث، أو إضافة ملاحظة عامة. يمكنك أيضًا تحسين الصورة بعد رؤية المحاولة الأولى لـ Whisk. على سبيل المثال، لنفترض أنك قمت بإنشاء بطاقة عطلة على الطراز القديم لقطط مستلقية على الثلج. عند رؤية الجيل، قد يكون مصدر إلهام لك إضافة رقاقات الثلج كلمسة نهائية.
في كل مرة تقوم فيها بإضافة أو إنشاء صورة في أي من فئات Whisk الثلاث، ستقوم المنصة بعمل إنشاء وصف مكتوب مفصل لها. ومن ثم، إذا كنت تريد إضافة صورة موجودة أو تعديلها، فيمكنك فقط تخصيص النص.
وأخيرًا، إذا كنت تشعر بعدم الإلهام، فيمكنك ترتيب مكوناتك المرئية بشكل عشوائي عن طريق تحديد رمز القالب. بالنسبة للأجيال الأكثر تعقيدًا، يمكنك أيضًا إضافة أكثر من مرجع موضوع أو مشهد أو نمط.
بمجرد أن تصبح سعيدًا بتحفتك الفنية، يمكنك إما حفظها على النظام الأساسي أو تنزيلها للوصول إليها محليًا.
يستحق الخفق؟
مع كل خيارات إنشاء الصور المتقدمة بالذكاء الاصطناعي المتوفرة لتحسين صورك أو إنتاج أعمال فنية “أصلية”، قد تبدو أداة Google الجديدة مجرد وسيلة للتحايل. لكن الطريقة التي تستفيد بها Whisk من المراجع المرئية في إنشاء الصور هي فريدة من نوعها، ويمكنني أن أرى مدى أهميتها في السيناريوهات الإبداعية والمهنية.
لنفترض أنك تعمل على عرض تقديمي مخطّط وتحتاج إلى صور تشبه مرجعًا لديك بالفعل. بدلاً من محاولة إجراء هندسة عكسية لهذا المرجع بالكلمات، يمكنك ببساطة تحميل الملف، بالإضافة إلى وصف نصي مختصر لكيفية ظهور الصورة الجديدة التي تريدها.
لتمييز Whisk عن برامج الصور الأخرى التي تعمل بالذكاء الاصطناعي، أثبتت Google أن النظام الأساسي يهدف إلى أن يكون استكشافيًا، وليس من أجل الجودة. في حين أن المنتجات الأخرى قد تكون أكثر ملاءمة لإجراء تعديلات دقيقة، فإن Whisk هو الأفضل للعصف الذهني:
“لقد قمنا ببنائه للاستكشاف البصري السريع، وليس لإجراء تعديلات مثالية للبكسل. يتعلق الأمر باستكشاف الأفكار بطرق جديدة ومبتكرة، مما يسمح لك بالعمل من خلال عشرات الخيارات وتنزيل الخيارات التي تحبها.”
لنكن صادقين: في بعض الأحيان، يكون من الصعب العثور على الكلمات. ثق بي، أجد نفسي دائمًا متمسكًا بالقش غير المرئي في محاولة للعثور على الوصف الصحيح. بالنسبة لي، يمنح هذا Whisk بعض الإمكانات الجادة، في كل تلك الأوقات التي يكون فيها من الأسهل فقط أن تقول “أريد صورة تبدو كهذه”.