كشفت شركة جوجل، أمس، عن نموذجها الجديد للذكاء الاصطناعي (Gemini 2.0)، والذي يمثل قفزة طموحة نحو أنظمة الذكاء الاصطناعي التي يمكنها إنجاز المهام المعقدة بشكل مستقل. كما يتميز النموذج بقدرته على توليد صور واقعية بدقة عالية، وأصوات بشرية بلغات متعددة، وهذه المزايا تضع جوجل في منافسة مباشرة مع OpenAI، وتخوض شركة Anthropic سباقاً ساخناً للسيطرة على مجال الذكاء الاصطناعي.
ويأتي الجيل الثاني من طراز Gemini بعد حوالي 10 أشهر من إطلاق Google لنموذج Gemini 1.5. تصف Google الجيل الثاني من النموذج بأنه مصمم لعصر جديد قائم على الوكلاء. وبدلاً من تقديم استجابات مباشرة للمستخدمين، يمكن لعملاء الذكاء الاصطناعي فهم السياق بشكل أعمق. والتخطيط لسلسلة من الإجراءات، وحتى اتخاذ قرارات محددة نيابة عن المستخدم، مما يجعله أكثر استقلالية وفعالية.
وقد وصف ساندرا بيتشايووصف الرئيس التنفيذي لشركة جوجل إطلاق هذا النموذج بأنه بداية عصر جديد للوكلاء، في إشارة إلى المساعدين الافتراضيين الذين يمكنهم أداء المهام بشكل مستقل.
وقال بيتشاي: “على مدى العام الماضي، استثمرنا في تطوير نماذج الذكاء الاصطناعي القادرة على التفاعل بشكل أكثر استقلالية مع العالم من حولنا، والتفكير في العديد من الخطوات المقبلة، والتصرف نيابة عنا، ولكن تحت إشرافنا، وبينما (Gemini 1.0) ) ركز على تنظيم المعلومات وفهمها، ويهدف Gemini 2.0 إلى جعلها أكثر فائدة من خلال تحقيق تفاعل أعمق بين الإنسان والآلة.
لكن هذا التطور يثير العديد من الأسئلة حول مستقبلنا الرقمي. كيف سيغير مساعد الذكاء الاصطناعي الجديد من جوجل نمط حياتنا اليومي، وهل سيؤدي إلى زيادة الإنتاجية والكفاءة، أم أننا قد نشهد اعتماداً مفرطاً على التكنولوجيا، مما يثير مخاوف جديدة؟
كيف سيغير مساعد الذكاء الاصطناعي الجديد من جوجل حياتنا اليومية؟
أوضح تولسي دوشي، مدير إدارة المنتجات في Gemini، خلال مقابلة بودكاست جديدة، القدرات المحسنة لنموذج Gemini 2.0. بالإضافة إلى فهم لغات متعددة وإجراء محادثات سلسة، يمكن للنموذج الآن إنشاء صور أصلية وأصوات بشرية بلغات مختلفة، ويمكنه أيضًا المساعدة في عمليات البحث والمشاريع. برمجة.
وقال تولسي: “إن قدرات جيميني الجديدة تمهد الطريق لبناء عملاء ذكاء اصطناعي يمكنهم التفكير والتخطيط واتخاذ القرارات نيابة عنك، مما يجعلهم شركاء فعالين في إنجاز المهام اليومية”.
وأصدرت جوجل نسخة واحدة من النموذج للمطورين وهي (Gemini 2.0 Flash). نسخة تجريبية وتدعي جوجل أنها تعمل بسرعة مضاعفة للإصدار السابق مع الحفاظ على مستوى عالٍ من الأداء يفوق قدرات النماذج الأكثر قوة. وحققت Google هذا الإنجاز من خلال إدخال تحسينات على البنية الأساسية للنموذج والخوارزميات المستخدمة، مما سمح بزيادة سرعة المعالجة دون التضحية بدقة النتائج أو تقليل وظائف النموذج. .
مشروع أسترا:
كشفت جوجل عن ثلاثة نماذج أولية لعملاء الذكاء الاصطناعي المبنية على (Gemini 2.0)، أبرزها مشروع (Astra). أسترامساعد ذكاء اصطناعي متقدم، وبفضل اعتماده على بنية Gemini 2.0، أصبح Astra أكثر ذكاءً وقدرة على فهم السياق وتقديم مساعدة أكثر شمولاً.
وأوضح بيبو شو، مدير منتجات المجموعة في Google DeepMind، خلال عرض توضيحي مباشر أن Venture Astra أصبح الآن قادرًا على الاحتفاظ بذاكرة سياقية قوية تمتد لمدة تصل إلى 10 دقائق خلال الجلسة الواحدة، ويمكنه أيضًا تذكر المحادثات التي أجريتها معه في الماضي، وتكييف استجاباته. استنادًا إلى السياق، مما يوفر تجربة تفاعل أكثر طبيعية وشخصية.
ليس هذا فحسب، بل يتميز مشروع أسترا الآن أيضًا بقدرته على إجراء محادثات معقدة ومعقدة بلغات متعددة، حيث يمكن للمستخدم التحدث مع أسترا بأي لغة يدعمها النظام، وسيتمكن المساعد من فهم الاستفسارات و الرد عليهم بسلاسة ودقة.
يتميز Venture Astra أيضًا بالتكامل العميق مع مجموعة أدوات Google، مما يوفر للمستخدمين تجربة أكثر شمولاً، حيث يمكنه الآن الوصول إلى المعلومات في الوقت الفعلي من خلال بحث Google وخرائط Google، مما يشير إلى مستوى من التكامل لم يسبق له مثيل في منتجات الذكاء الاصطناعي الاستهلاكية.
جوجل تصعد المنافسة:
وكشفت جوجل بالأمس أيضًا عن مشاريع جديدة للمطورين والمؤسسات تعتمد على نموذج Gemini 2.0، بما في ذلك: (Venture Mariner). مشروع مارينروهو امتداد تجريبي لمتصفح Chrome، ويمكن استخدام المتصفح وتنفيذ المهام من خلاله تلقائيًا.
يعتبر مشروع مارينر إنجازا كبيرا في مجال أتمتة مهام الويب. وقد حقق هذا المشروع نتائج مذهلة بنسبة نجاح بلغت 83.5% معيار WebVoyagerمعيار صارم يقيس قدرة العميل على أداء مهام الويب المعقدة في بيئة العالم الحقيقي.
المشروع الثاني هو برنامج (جولز)، وكيل مخصص لمساعدة المطورين في العثور على أخطاء البرامج وإصلاحها، بالإضافة إلى وكيل مخصص لمساعدة المستخدمين على تحسين أدائهم في ألعاب الفيديو.
ماذا يعني هذا بالنسبة للمنظمات؟
وتمثل هذه النتائج نقلة نوعية في مجال أتمتة المهام، حيث يمكن للمؤسسات الاستفادة من هذه التقنية لتسريع عملياتها وتحسين كفاءتها. على سبيل المثال، يمكن لمشروع Mariner أن يتولى المهام الروتينية والمتكررة، مما يسمح للموظفين بالتركيز على المهام الأكثر إبداعًا وأهمية.
جوجل تراهن على عملاء الذكاء الاصطناعي:
يمثل تحول جوجل نحو الوكلاء المستقلين أهم تحول استراتيجي في مجال الذكاء الاصطناعي منذ أن أطلقت شركة OpenAI روبوتها ChatGPT. وبينما ركز المنافسون على تعزيز قدرات النماذج اللغوية الكبيرة، راهنت جوجل على أن المستقبل ملك لأنظمة الذكاء الاصطناعي التي يمكنها التنقل حول العالم بشكل فعال. البيئات الرقمية وإكمال المهام المعقدة بأقل قدر من التدخل البشري.
وتمثل الرؤية الجديدة لعملاء الذكاء الاصطناعي تحولا جذريا في المجال، حيث ستنقل هذه الخطوة المساعدين الأذكياء من مجرد مساعدين تفاعليين إلى أنظمة أكثر استقلالية وقدرة على اتخاذ القرارات. وإذا نجحت هذه الخطوة، فمن المرجح أن تعيد تشكيل المشهد التنافسي في هذا المجال، ويشير استثمار جوجل الضخم في تطوير الرقائق الإلكترونية والبنية التحتية المخصصة إلى أنها مستعدة للمنافسة بقوة في هذا الاتجاه الجديد.
وقد وأكد ديميس هاسابيسقال الرئيس التنفيذي لشركة Google DeepMind، إن بناء أنظمة ذكاء اصطناعي قادرة على اتخاذ إجراءات من تلقاء نفسها كان محور تركيز DeepMind منذ أيامها الأولى في تعليم أجهزة الكمبيوتر كيفية لعب ألعاب مثل الشطرنج وGo.
وقال هاسابيس: “إن أنظمة الذكاء الاصطناعي التي يمكن أن تعمل كوكلاء شبه مستقلين تمثل خطوة وسيطة مهمة على الطريق نحو الذكاء الاصطناعي العام (AGI)، وهو ذكاء اصطناعي يمكن أن يضاهي القدرات البشرية”.
وأضاف: “إذا فكرنا في الطريق إلى الذكاء العام الاصطناعي، فمن الواضح أننا بحاجة إلى نظام يمكنه التفكير وتحليل المشكلات وتنفيذ الإجراءات في العالم الحقيقي”.
عندما أطلقت جوجل الإصدار الأول من جيميني قبل عام تقريبًا، كانت روبوتات الدردشة تهيمن على مشهد الذكاء الاصطناعي، والتي يمكنها المشاركة في محادثة ذكية ولكنها تكافح من أجل أداء المهام في العالم الحقيقي. الآن، بينما يبدأ عملاء الذكاء الاصطناعي في اتخاذ خطواتهم الأولى نحو الاستقلالية، تقف الصناعة عند نقطة تحول أخرى.
لم يعد السؤال هو ما إذا كان الذكاء الاصطناعي يستطيع أن يفهمنا، بل ما إذا كنا على استعداد للسماح للذكاء الاصطناعي بالتصرف نيابة عنا. ومن الواضح أن جوجل متأكدة من أننا مستعدون لهذه المرحلة.
وفي النهاية يمكننا القول أن نموذج جيميني 2.0 يمثل بداية فصل جديد في قصة الذكاء الاصطناعي.