أعلن Openai تحديث جديد بالنسبة إلى ChatGPT ، يتيح روبوت الذكاء الاصطناعي للمستخدمين إنشاء صور بناءً على تعليمات مفصلة ومعقدة وغير تقليدية ، في خطوة تشكل تطوراً بارزاً في أهم منتج للشركة.
يعتمد الإصدار الجديد من ChatGPT على طراز GPT-4O ، والذي يسمح للروبوت بتحليل النص والصور معًا داخل نظام متكامل واحد ، مما يمنحه قدرة غير مسبوقة على توليد صور أكثر تعقيدًا ودقة.
وفقًا للشركة ، يمكن للمستخدمين – على سبيل المثال – وصف صورة كرتونية تتكون من أربع لوحات ، مع تحديد الشخصيات التي تظهر في كل لوحة وما تقوله ، لإنشاء ChatGPT على الفور رسم كرتون متكامل بناءً على هذه التفاصيل.

على الرغم من أن الإصدارات السابقة من ChatGPT كانت قادرة على إنشاء صور ، إلا أنها لم تكن لديها القدرة على دمج مفاهيم متعددة ومتنوعة في صورة واحدة بدقة وموثوقة ، ولم تتمكن من التعامل مع النصوص داخل الصور وكذلك مع التحديث الجديد.
عانت النماذج السابقة من الذكاء الاصطناعي من مشكلات في إدراج النصوص داخل الصور ، حيث كانت النتائج في كثير من الأحيان غير واضحة أو غير مفهومة ، ولكن GPT-4O تتفوق في هذا المجال ، حيث يمكن أن تخلق علامات تحتوي على نصوص قراءة واضحة ، وهو تحسن كبير مقارنة مع الإصدارات السابقة.
عادةً ما تبدأ عملية إنشاء الصور بوصف نص ، ثم يقوم المستخدم بضبطه تدريجياً للحصول على النتيجة المطلوبة. لكن GPT-4O يسمح بمزيد من الخبرة التفاعلية ، حيث يمكن للمستخدم طلب صورة ، ثم توفير إرشادات متتالية لتعديلها ، مثل تغيير الألوان أو إضافة تفاصيل جديدة ، دون الحاجة إلى إعادة كتابة الوصف بالكامل.
يوفر طراز GPT-4O تجربة أكثر تفاعلية في تعديل الصور ، حيث يمكن للمستخدم طلب صورة أو تحميلها ، ثم توفير إرشادات متتالية لتعديلها ، مثل تغيير الألوان أو إضافة تفاصيل جديدة ، دون الحاجة إلى إعادة كتابة الوصف بالكامل.

أوضح غابرييل غو ، باحث في Openai ، أن هذه التقنية تشكل “نوعًا جديدًا تمامًا من الذكاء الاصطناعي” ، مضيفًا أن نماذج الشركة “لم تعد تفصل بين توليد النصوص وإنشاء الصور ، بل تجمع بين العمليتين معًا للحصول على نتائج أكثر سلاسة ودقيقة”.
أشار جوي إلى أن نماذج توليد الصور التقليدية كانت تواجه دائمًا صعوبة في إنشاء صور لمفاهيم غير مألوفة ، مثل دراجة العجلات الثلاثي ، ولكن الإصدار الجديد من ChatGPT قادر على التعامل مع هذه الطلبات المعقدة بسهولة.

أعلن Openai أن تحديث ChatGpt Android الجديد سيكون متاحًا لجميع المستخدمين ، سواء من خلال الإصدار المجاني أو من خلال الاشتراكات المدفوعة. من الجدير بالذكر أن ميزة إنشاء الصور متاحة لحاملي الحسابات المجانية ، ولكن بطريقة محدودة ، وسيتم تأجيل إطلاق التحديث الأخير ، وفقًا للشركة.
نشر Openai عدة مقاطع الفيديو إمكانيات GPT-4O في إنشاء الصور ، حيث يمكن للمستخدمين معرفة كيفية تحرير الصور خطوة بخطوة والتفاعل مع ChatGPT لتحسين النتائج.
كانت Chatgpt هي المرة الأولى في نهاية عام 2022 ، وكان يعتمد على تحليل كميات كبيرة من النصوص عبر الإنترنت ، مما مكنه من الإجابة على الأسئلة ، وكتابة القصائد ، وحتى رموز البرمجة ، لكنه لم يكن قادرًا على إنشاء صور في ذلك الوقت.
بعد حوالي عام ، أطلقت Openai طراز Dall-E لإنشاء صور ، لكنها كانت منفصلة عن ChatGPT. الآن ، قامت الشركة بدمج النظامين على منصة واحدة تجمع بين إمكانيات النصوص والصور ، مما يعزز إمكانيات الذكاء الاصطناعي التوليدي في ChatGPT بطريقة غير مسبوقة.
https://www.youtube.com/watch؟v=e9rn8jx-uc
https://www.youtube.com/watch؟v=no7uo2i1sw