
ثورة الذكاء الاصطناعي تصل إلى كل المستخدمين تدريجيًا
في خطوة تمثل تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، أعلنت شركة جوجل عن بدء توفير ميزة توليد وتعديل الصور داخل منصتها الذكية Gemini، وذلك كجزء من جهودها المستمرة لتوسيع نطاق قدرات هذه المنصة وجعلها أكثر شمولية وتكاملًا.
هذه الميزة الجديدة، التي تعتمد على أحدث تقنيات الذكاء الاصطناعي في فهم اللغة ومعالجة الصور، بدأت في الوصول تدريجيًا إلى المستخدمين حول العالم، مما يعكس التزام جوجل بتحقيق تجربة إبداعية سلسة ومفتوحة للجميع.
ما هي ميزة توليد وتعديل الصور في Gemini؟
الميزة الجديدة تتيح للمستخدمين إنشاء صور مخصصة بالكامل من خلال أوامر نصية، بالإضافة إلى إمكانية تعديل الصور الموجودة عبر التعليمات النصية أو المعالجة المباشرة.
بفضل تكامل هذه الوظيفة داخل Gemini، بات بالإمكان إنشاء مشاهد فنية، شخصيات، رسوم توضيحية، أو حتى صور واقعية شبه فوتوغرافية بمجرد كتابة وصف دقيق للصورة المطلوبة.
على سبيل المثال، يمكن للمستخدم أن يكتب: “أرسم فتاة تجلس بجانب نافذة في مقهى صغير تحت المطر في طوكيو”، وسيتولى Gemini توليد الصورة وفقًا للوصف، مع مراعاة التفاصيل الدقيقة، مثل التعبيرات، والإضاءة، والخلفية، وأسلوب التصميم (واقعي، كرتوني، ثلاثي الأبعاد، إلخ).
أما التعديلات، فهي تتيح على سبيل المثال كتابة أمر مثل: “غير لون السماء إلى الأزرق الداكن وأضف قوس قزح”، فيقوم الذكاء الاصطناعي بتنفيذ التعديل فورًا على الصورة الموجودة.
البنية التقنية وراء الميزة ما الذي يجعلها ممكنة؟
تعتمد الميزة الجديدة على نموذج Imagen 2، وهو من أحدث النماذج التي طورتها جوجل لتوليد الصور.
يتميز Imagen 2 بقدرته العالية على فهم الأوامر اللغوية المعقدة، وتقديم نتائج دقيقة من حيث الشكل والمحتوى، بفضل تدريبه على مجموعات ضخمة من البيانات البصرية والنصوص.
وقد تم دمج Imagen داخل Gemini بطريقة سلسة، بحيث يمكن للمستخدم التفاعل معه كما يتفاعل مع مساعد ذكي، دون الحاجة لفتح تطبيق خارجي أو استعمال أدوات منفصلة. هذا التكامل العميق يجعل تجربة المستخدم أكثر سلاسة وفعالية.
التطبيقات العملية لمن تصلح هذه الميزة؟
تمثل هذه الميزة نقلة نوعية للمستخدمين في مختلف المجالات، ومن أبرز الاستخدامات:
- المصممون والمبدعون: يمكنهم توليد أفكار أولية لتصاميمهم بسرعة واختبار أشكال جديدة.
- المحتوى التسويقي: ابتكار صور إعلانية فريدة دون الحاجة لفريق تصوير أو تصميم.
- الطلاب والمعلمون: استخدام الصور التوضيحية في الشروحات والمشاريع.
- الكتاب والمؤلفون: توليد صور تعبيرية توضيحية للنصوص الإبداعية.
الخصوصية والمسؤولية هل هناك حدود أخلاقية؟
جوجل شددت على أن ميزة توليد الصور تم تطويرها مع مراعاة صارمة لمعايير السلامة والأخلاقيات. على سبيل المثال، هناك قيود على إنتاج صور قد تكون عنيفة أو جنسية أو تروج للكراهية، كما يتم فلترة الصور بشكل ذكي لتجنب أي إساءة أو انتهاك.
كما أن جوجل تعمل على تقنيات وضع علامات مائية رقمية غير مرئية (مثل SynthID) لتمييز الصور المولدة بالذكاء الاصطناعي، بهدف الحد من استخدامها في التضليل أو النشر غير المسؤول للمحتوى.
هل الميزة متاحة للجميع الآن
ذكرت جوجل أن الميزة بدأت في الوصول تدريجيًا إلى مستخدمي Gemini، وخاصة أولئك الذين يستخدمون النسخة المدفوعة Gemini Advanced، كما ستتوفر قريبًا لمزيد من المستخدمين حول العالم. وتعمل الشركة على توسيع نطاق توفرها لتشمل كافة مستخدمي Google Workspace وGoogle One لاحقًا.
التكامل مع باقي منتجات جوجل
من المتوقع أن يتم ربط ميزة توليد الصور بمنتجات أخرى من جوجل، مثل Google Slides وGoogle Docs، حيث يمكن للمستخدم إدراج صور تم إنشاؤها داخل العروض التقديمية والمستندات مباشرة.
كما تخطط الشركة لتوفير أدوات جديدة للمطورين للاستفادة من ميزة التوليد داخل تطبيقاتهم عبر Google AI Studio وواجهات برمجة التطبيقات (APIs).
الذكاء الإبداعي في متناول الجميع
يبدو أن جوجل تخطو خطوات واسعة نحو جعل الذكاء الاصطناعي التوليدي أداة يومية في حياة الناس، ليس فقط للبحث أو الإجابة عن الأسئلة، بل أيضًا للإبداع وتوليد المحتوى البصري.
ومع توفر ميزة توليد وتعديل الصور داخل Gemini، يمكن القول إننا أمام بداية عصر جديد من الإبداع التفاعلي، حيث تصبح الكلمات وسيلة لصناعة عالم بصري فوري، يجمع بين الخيال والتقنية.
في ظل هذا التطور السريع، يبقى السؤال: كيف سيتغير شكل الإبداع البشري حين يصبح لكل شخص أداة توليد صور محترفة في متناول اليد؟ الأيام القادمة وحدها ستحمل الإجابة.
