انفجرت شركة Google في ساحة الذكاء الاصطناعي هذا الأسبوع، وحصلت بقوة على المركز الأول في كل تصنيف رئيسي للذكاء الاصطناعي. من الفيديو والصور إلى نماذج اللغات الكبيرة ومساعدي الذكاء الاصطناعي المبتكرين، لم تترك شركة التكنولوجيا العملاقة أي مجال للشك في هيمنتها. إذا كنت تعتقد أنك حصلت على كل الأخبار، فمن المؤكد تقريبًا أنك فاتتك بعض الأخبار. فيما يلي نظرة عامة على جميع الإنجازات الرئيسية التي توضح سبب كون Google ملك الذكاء الاصطناعي في الوقت الحالي.
قررت Google إظهار من هو الرئيس الحقيقي في عالم الذكاء الاصطناعي. في حين أن المنافسين مثل أوبن إيه آي و نعناعومع اكتساب الاهتمام بالنماذج والوعود الجديدة، أطلقت جوجل سلسلة من الابتكارات في أسبوع واحد أعادت كتابة قواعد اللعبة حرفيًا. من نموذج مذهل فيو 2، الذي ينشئ مقاطع فيديو مذهلة بدقة 4K، حتى الأحدث الجوزاء 2.0، والتي أعادت تعريف معايير نماذج اللغات الكبيرة، فمن الواضح أن Google لا يقتصر دورها على اللعبة فحسب، بل إن Google هي التي تدير اللعبة.
ولكن هذه مجرد البداية. بالإضافة إلى التقدم في مجال توليد الفيديو والصور، تعمل جوجل على بناء نظام بيئي كامل للذكاء الاصطناعي، بدءًا من مساعدي الذكاء الاصطناعي الشخصي إلى الحلول المبتكرة في الواقع المعزز (XR). هذه المشاريع ليست مجرد إنجازات تقنية، بل هي تنبؤ بمستقبل حيث ستصبح التكنولوجيا أكثر ارتباطًا بالحياة اليومية من أي وقت مضى.
استعد للتعمق في قلب إنجازات Google بينما نستكشف كيف اصطدم عملاق التكنولوجيا مرة أخرى بالرياح في أشرعته ولماذا لا يستطيع أحد اللحاق به الآن.
VEO 2: مقاطع فيديو مذهلة بتقنية الذكاء الاصطناعي
لقد اتخذت Google خطوة إلى الأمام في مجال إنشاء الفيديو من خلال هذا النموذج فيو 2، والذي يضع معيارًا جديدًا تمامًا لإنشاء الفيديو. يتيح لك النموذج إنشاء مقاطع فيديو عالية الجودة بدقة تصل إلى 4K، وهو أمر مثير للإعجاب في حد ذاته، لكن السحر الحقيقي يكمن في الدقة التي يفهم بها النموذج ويأخذ في الاعتبار فيزياء العالم الحقيقي والتفاصيل المتحركة. يتفوق VEO 2 على جميع المنافسين، بما في ذلك Meta MovieGen وSora Turbo (أحدث محاولة لـ OpenAI لإنشاء الفيديو) والعديد من النماذج الأخرى التي كانت تعتبر متفوقة حتى الآن.
أعظم أصوله؟ فهي لا تتبع تعليمات معقدة مثل زوايا الكاميرا والإضاءة والأنماط الفنية المحددة فحسب، بل إنها تفعل ذلك بدقة لا تشوبها شائبة. على سبيل المثال، إذا كنت تريد مقطع فيديو بأسلوب فيلم نوار كلاسيكي، فإن VEO 2 لا يعيد إنشاء الجماليات فحسب، بل يلتقط أيضًا الحالة المزاجية والجو، مما يجعل النتيجة لا مثيل لها. على الشبكات الاجتماعية مثل تويتر، ينشر المستخدمون مقارنات بين VEO 2 والنماذج المنافسة، حيث يفوز نموذج Google دائمًا. لا يقتصر الأمر على الكمال التقني فحسب، بل إن VEO 2 تبهر بالعمق والجودة الفنية التي تدفع حدود ما هو ممكن.
الصورة 3: فن توليد الصور المثالية
إذا كنت تعتقد أنك قد رأيت كل ما يمكن أن يفعله إنشاء الصور باستخدام الذكاء الاصطناعي، فانتظر حتى تجرب أحدث طراز من Google الصورة 3. يقوم هذا النظام المتطور بإنشاء صور مفصلة ودقيقة بشكل مذهل تضع معايير جديدة في مجال الذكاء الاصطناعي. يتقن النموذج مجموعة واسعة من الأساليب، بدءًا من الصور الشخصية الواقعية للغاية وحتى المناظر الطبيعية الخيالية والرسوم التوضيحية المتطورة تقنيًا. لا يتفوق Imagen 3 على الإصدارات السابقة من نماذج Google فحسب، بل يتفوق أيضًا على الحلول المنافسة مثل MidJourney وStable Diffusion وFlux في كل المجالات القابلة للقياس تقريبًا.
مثال؟ تخيل مشهدًا لمنصة قطار ضبابية تعود إلى أربعينيات القرن العشرين محاطة بأقواس حديدية معقدة ونوافذ زجاجية. لا يقوم Imagen 3 بإنشاء هذا المشهد فحسب، بل إنه يجسد جوهره. بدءًا من أصغر التفاصيل، مثل انعكاسات الضوء على الأرضية المبللة، وحتى الفروق الدقيقة في الإضاءة التي تؤكد على الجو الكئيب، تكون النتيجة حقيقية جدًا بحيث تشعر كما لو كان بإمكانك الدخول إليها مباشرةً. إن Imagen 3 هو أكثر من مجرد إنجاز تكنولوجي؛ إنه الفن في أنقى صوره.
الجوزاء 2.0: جيل جديد من نماذج اللغات الكبيرة
في مجال نماذج اللغات الكبيرة، جوجل s الجوزاء 2.0 متجاوزًا كل ما تم تحقيقه حتى الآن. في حين أن GPT-4 من OpenAI كان يعتبر منذ فترة طويلة الملك بلا منازع، فقد أظهر Gemini في أعلى التصنيفات بشكل مقنع أن Google لا تتمتع بميزة تكنولوجية فحسب، بل تتمتع أيضًا برؤية للمستقبل. يسجل Gemini ما يقرب من 10 نقاط أعلى من GPT-4 في التصنيفات الشائعة مثل Chatbot Arena، وهو ليس إنجازًا مثيرًا للإعجاب فحسب، ولكنه أيضًا إشارة واضحة إلى أن Google لا تستقر على المركز الثاني.
الجوزاء ليس أكثر تقدمًا فحسب، بل أكثر مرونة أيضًا. قدرته على حل المشكلات متعددة المستويات لا مثيل لها، مع توفير فهم عميق للاستعلامات المعقدة. يمكن للنموذج توليد إجابات متماسكة، وصياغة الخطط وتقديم الحلول للمشكلات التي كانت تعتبر حتى الآن معقدة للغاية بالنسبة للذكاء الاصطناعي. وبهذا، تضع Google الأسس لمستقبل يصبح فيه التفاعل مع الذكاء الاصطناعي أكثر إنسانية وأكثر بديهية، وقبل كل شيء، أكثر كفاءة.
مشروع أسترا: مساعد الذكاء الاصطناعي للمستقبل
ض مشروع أسترا تعمل Google على وضع معايير جديدة للمساعدين الشخصيين الذين لا يقتصرون على الذكاء فحسب، بل يتسمون أيضًا بالبديهية. Astra ليس مجرد مساعد صوتي - إنه حل كامل يتضمن فهم السياق وتذكر التفاعلات السابقة واستخدام أدوات متنوعة للمساعدة في الحياة اليومية. بدءًا من طهي العشاء وحتى المساعدة في المشاريع الفنية مثل تجميع الأثاث، تجمع Astra بين جميع الوظائف التي يمكنك تخيلها وتغلفها في تجربة سهلة الاستخدام.
تخيل أنك ترتدي نظارات ذكية وتتجول في مدينة مجهولة. لا ترشدك Astra إلى الطريق فحسب، بل تترجم العلامات في الوقت الفعلي، وتقترح المطاعم حسب ذوقك وتساعدك أيضًا في اختيار هدية لصديق. لا يعد هذا المشروع بتحول تقني فحسب، بل يعد أيضًا بتغيير كامل في طريقة تفاعل الناس مع التكنولوجيا في حياتهم اليومية.
مشروع مارينر: الاستكشاف العميق
مشروع مارينر تعد واحدة من أكثر الخطوات إثارة للأمام في نظام الذكاء الاصطناعي البيئي من Google. إنه عميل ذكاء اصطناعي لا يعرف فقط كيفية الإجابة على أسئلتك، ولكنه في الواقع يتصفح الويب نيابةً عنك كما يفعل الإنسان. تخيل أنك تبحث عن قطعة فنية على Etsy - لن يقوم Project Mariner بالعثور على بعض القطع المناسبة فحسب، بل سيضيفها إلى سلة التسوق الخاصة بك، وإذا سمحت بذلك، فسوف يكمل عملية الشراء. وتحاكي قدرتها على التنقل عبر الويب التفاعل البشري: فهي تحرك الماوس، وتنقر على الأزرار، وتملأ النماذج، بل وتتحقق من البيانات للتأكد من دقتها قبل تقديم الطلب.
ولكن هذا ليس كل شيء. بالاشتراك مع الأداة بحث عميق يثبت Mariner أنه لا غنى عنه لأي شخص يتعامل مع مشاريع بحثية معقدة أو يحتاج إلى إجابات متعمقة لأسئلة متعددة المستويات. بحث عميق فهو يعمل عن طريق تقسيم المشكلات المعقدة إلى خطوات يمكن التحكم فيها، ووضع خطة عمل مفصلة، ثم إنشاء تقارير شاملة تتضمن النتائج والتوصيات الرئيسية.
تخيل أنك تبحث في تاريخ الفن أو تقوم بإعداد تحليل لسوق الأعمال. بدلاً من البحث عن الموارد بنفسك، يقوم Deep Research تلقائيًا بالزحف إلى الويب وتحليل البيانات ذات الصلة ويقدم لك نتائج منظمة وجاهزة للاستخدام في دقائق. يتضمن ذلك الملخصات والرسوم البيانية والموارد وحتى اقتراحات لمزيد من البحث.
تفتح مثل هذه القدرات الباب أمام عصر جديد تمامًا من الاستكشاف الرقمي. لا يجعل Project Mariner وDeep Research المهام اليومية أسهل فحسب، بل يسمحان لك بالتركيز على التفكير الاستراتيجي بينما يقوم الذكاء الاصطناعي "بالعمل الشاق". وهذا لا يغير الطريقة التي نصل بها إلى المعلومات فحسب، بل يعيد تعريف مفهوم الإنتاجية في العصر الرقمي.
Android XR ومستقبل الأجهزة المحمولة
جوجل تتطور بشكل مكثف أندرويد اكس آر، وهي منصة مبتكرة للواقع المعزز تعد بإحداث ثورة في طريقة استخدام التكنولوجيا. تم تصميم Android XR للنظارات الذكية والأجهزة الأخرى التي ستسمح بالتكامل المباشر مع مساعدي الذكاء الاصطناعي مثل مشروع أسترا. وهذا يعني أن المستخدمين سيكونون قادرين على التفاعل مع الذكاء الاصطناعي في الوقت الفعلي، بغض النظر عن مكان تواجدهم أو ما يفعلونه.
تخيل أنك ترتدي نظارات ذكية تترجم لك إشارات اللغة الأجنبية بسرعة، أو تقدم لك الاتجاهات إلى مدينة غير مألوفة، أو تعرض تعليمات للمشاريع الفنية. يذهب Android XR إلى أبعد من ذلك - فهو يسمح للذكاء الاصطناعي بالتعرف على السياق الخاص بك، على سبيل المثال من خلال دراسة البيئة المحيطة بك وتقديم معلومات مخصصة بناءً على ذلك. أثناء تجولك في المتجر، يمكن أن يقترح الذكاء الاصطناعي منتجات بناءً على مشترياتك السابقة أو يعرض لك وصفات للمكونات الموجودة في عربة التسوق الخاصة بك.
سيكون Android XR بمثابة منصة مفتوحة، مما يعني أن المطورين في جميع أنحاء العالم سيكونون قادرين على المساهمة بالتطبيقات والوظائف التي تستفيد من إمكانيات التكنولوجيا. بدءًا من دروس اليوغا واللياقة البدنية التفاعلية وحتى الأدوات الافتراضية للتعلم والعمل الإبداعي، فإن الاحتمالات لا حصر لها عمليًا.
ومن خلال هذه المنصة، لا تقوم جوجل بتطوير أداة للواقع المعزز فحسب، بل تعمل على إنشاء نظام بيئي كامل يربط بين الأجهزة والبيانات وتجارب المستخدم بطريقة لم يكن من الممكن تصورها حتى الآن. وبالتالي فإن Android XR لا يمثل المرحلة التالية من تطوير الأجهزة المحمولة فحسب، بل يعد بثورة في كيفية دخول التكنولوجيا إلى حياتنا - أكثر سهولة وأكثر كفاءة وأكثر اتصالاً بالعالم الحقيقي.