گوگل یا Open AI ؛ برنده رقابت حکومت بر هوش مصنوعی کیست؟

زمان مطالعه: 3 دقیقه

گوگل با سرعت بالایی در حال توسعه محصولات خود در حوزه هوش مصنوعی است. هوش مصنوعی از یک سال گذشته هر روز چهره جدیدی از خودش را به رخ ما می‌کشد. چهره‌ای که حالا خیلی‌ها را ترسانده یا سورپرایز کرده است.

از چت جی‌پی‌تی گرفته تا کلادی و بارد و حالا هم جمینا. در ادامه به این رقابت‌ها می‌پردازیم.

۱. رونمایی از جمینا توسط گوگل

گوگل از مدل هوش مصنوعی جدید خود به نام جمینای رونمایی کرد. بنابر اعلام مدیران آلفابت، جمینای شامل سه سرویس عمده می‌شود. نخستین سرویس «جمینای پرو» نام دارد که با ادغام در سرویس‌های هوش مصنوعی گوگل، در چت‌بات بارد به کار خواهد رفت تا به شکل متنی و در قالب مکالمه به نیازهای کاربران پاسخ دهد. سرویس دوم به اسم «جمینای نانو» شناخته می‌شود که برای تلفن‌های همراه و توسعه‌دهندگان اندرویدی از جمله گوشی‌های پیکسل ۸ پرو ساخته شده است. سرویس آخر «جمینای اولترا» نام گرفته که قدرتمندترین مدل زبانی بزرگ خلق‌شده توسط آلفابت تا کنون به شمار می‌رود. 

۲. ادعای گوگل: جمینا یک سرویس چندبعدی است

ساندار پیچای، مدیر اجرایی آلفابت شرکت مادر گوگل، روز چهارشنبه گذشته در یک پست وبلاگی نوشت: «جمینای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های سراسر آلفابت، از جمله همکاران ما در واحد تحقیقات آلفابت است. این سرویس از ابتدا برای چند بعدی بودن ساخته شده است؛ به این معنی که می‌تواند موضوع را تعمیم دهد، به‌طور یکپارچه درک کرده و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.

۳. جمینا قدرتمند‌تر است یا چت جی‌پی‌تی۴؟

مدیران اجرایی گوگل گفته‌اند جمینای پرو از چت جی‌پی‌تی نسخه ۳.۵ بهتر عمل می‌کند. با این حال آنها درباره عملکرد سرویس جدید خود در مقایسه با الگوی هوش مصنوعی جی‌پی‌تی‌۴ هیچ اظهارنظری نکرده‌اند. با این همه دمیس هاسابیس، مدیرعامل دیپ‌مایند که در خلق جمینای نقش داشته است، اظهار کرد که جمینای اولترا در ۳۰ مورد از ۳۲ مورد آزمون معیار، بهتر از چت جی‌پی‌تی۴ عمل کرده است. با این همه شواهد نشان می‌دهد که در همین ابتدای کار گوگل به در بسته خورده است؛ چون مشخص شد ویدئوی هیجان‌انگیزی که برای نمایش ویژگی‌‎های هوش مصنوعی جمینای منتشر کرده بود، واقعی نیست. 

گوگل

۴. دوپینگ جمینا

این غول فناوری عملکرد جمینای را در ویدئو اشتباه نشان داده است. در ویدئویی که گوگل منتشر کرده است، هوش مصنوعی جمینای می‌تواند آنچه کاربر با دست‌های خود انجام می‌دهد، تشخیص دهد و به دستورهای صوتی پاسخ دهد. به گفته بلومبرگ، در این ویدئو جمینای بیش از حد توانمند نشان داده شده است.

۵. قابلیت‌های Multimodal جمینا واقعی هستند؟

ویدئوی ۶ دقیقه‌ای گوگل، قابلیت‌های Multimodal جمینای (برای مثال دستورهای گفتاری با قابلیت تشخیص تصویر) را نشان می‌دهد. در این ویدئو جمینای ظاهرا تصاویر را تشخیص می‌دهد و به سرعت به سوالات پاسخ می‌دهد. با این همه بنابر گزارش بلومبرگ، گوگل اعتراف کرده است که اتفاقات ویدئو همراه با پرامپت‌های صوتی در لحظه رخ نداده‌ است. از طرفی کاربران با تماشای ویدئو تصور می‌کنند که یک کاربر در حال مکالمه با جمینای است و هوش مصنوعی گوگل در لحظه به صحبت‌ها پاسخ می‌دهد، در حالی‌ که در واقعیت چنین اتفاقاتی رخ نداده‌ است. 

بلومبرگ: چت‌ جی‌پی‌تی عملکرد بهتری دارد

6. طبق ادعای خبرنگار بلومبرگ، گوگل برای پنهان‌ کردن این موضوع که جمینای از چت‌بات چت‌ جی‌پی‌تی شرکت اوپن‌ای‌آی عملکرد ضعیف‌تری دارد، تصمیم به انتشار چنین ویدئویی گرفته است. البته گوگل چنین موضوعی را رد کرده است. اوریول وینیالز، معاون ریاست بخش تحقیق و یادگیری عمیق دیپ‌مایند که یکی از رهبران پروژه جمینای هم محسوب می‌شود، با انتشار پستی در ایکس نحوه ساخت ویدئو را چنین توضیح داده است: «تمام دستورها و خروجی‌ها در ویدئو واقعی هستند و برای اختصار، کوتاه شده‌اند. این ویدئو نشان‌دهنده تجربه کاربری است که افراد می‌توانند با جمینای داشته باشند. ما این ویدئو را برای الهام‌بخشیدن به توسعه‌دهندگان ساخته‌ایم.»

در این زمینه بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *