گوگل با سرعت بالایی در حال توسعه محصولات خود در حوزه هوش مصنوعی است. هوش مصنوعی از یک سال گذشته هر روز چهره جدیدی از خودش را به رخ ما میکشد. چهرهای که حالا خیلیها را ترسانده یا سورپرایز کرده است.
از چت جیپیتی گرفته تا کلادی و بارد و حالا هم جمینا. در ادامه به این رقابتها میپردازیم.
۱. رونمایی از جمینا توسط گوگل
گوگل از مدل هوش مصنوعی جدید خود به نام جمینای رونمایی کرد. بنابر اعلام مدیران آلفابت، جمینای شامل سه سرویس عمده میشود. نخستین سرویس «جمینای پرو» نام دارد که با ادغام در سرویسهای هوش مصنوعی گوگل، در چتبات بارد به کار خواهد رفت تا به شکل متنی و در قالب مکالمه به نیازهای کاربران پاسخ دهد. سرویس دوم به اسم «جمینای نانو» شناخته میشود که برای تلفنهای همراه و توسعهدهندگان اندرویدی از جمله گوشیهای پیکسل ۸ پرو ساخته شده است. سرویس آخر «جمینای اولترا» نام گرفته که قدرتمندترین مدل زبانی بزرگ خلقشده توسط آلفابت تا کنون به شمار میرود.
۲. ادعای گوگل: جمینا یک سرویس چندبعدی است
ساندار پیچای، مدیر اجرایی آلفابت شرکت مادر گوگل، روز چهارشنبه گذشته در یک پست وبلاگی نوشت: «جمینای نتیجه تلاشهای مشترک در مقیاس بزرگ توسط تیمهای سراسر آلفابت، از جمله همکاران ما در واحد تحقیقات آلفابت است. این سرویس از ابتدا برای چند بعدی بودن ساخته شده است؛ به این معنی که میتواند موضوع را تعمیم دهد، بهطور یکپارچه درک کرده و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.
۳. جمینا قدرتمندتر است یا چت جیپیتی۴؟
مدیران اجرایی گوگل گفتهاند جمینای پرو از چت جیپیتی نسخه ۳.۵ بهتر عمل میکند. با این حال آنها درباره عملکرد سرویس جدید خود در مقایسه با الگوی هوش مصنوعی جیپیتی۴ هیچ اظهارنظری نکردهاند. با این همه دمیس هاسابیس، مدیرعامل دیپمایند که در خلق جمینای نقش داشته است، اظهار کرد که جمینای اولترا در ۳۰ مورد از ۳۲ مورد آزمون معیار، بهتر از چت جیپیتی۴ عمل کرده است. با این همه شواهد نشان میدهد که در همین ابتدای کار گوگل به در بسته خورده است؛ چون مشخص شد ویدئوی هیجانانگیزی که برای نمایش ویژگیهای هوش مصنوعی جمینای منتشر کرده بود، واقعی نیست.
۴. دوپینگ جمینا
این غول فناوری عملکرد جمینای را در ویدئو اشتباه نشان داده است. در ویدئویی که گوگل منتشر کرده است، هوش مصنوعی جمینای میتواند آنچه کاربر با دستهای خود انجام میدهد، تشخیص دهد و به دستورهای صوتی پاسخ دهد. به گفته بلومبرگ، در این ویدئو جمینای بیش از حد توانمند نشان داده شده است.
۵. قابلیتهای Multimodal جمینا واقعی هستند؟
ویدئوی ۶ دقیقهای گوگل، قابلیتهای Multimodal جمینای (برای مثال دستورهای گفتاری با قابلیت تشخیص تصویر) را نشان میدهد. در این ویدئو جمینای ظاهرا تصاویر را تشخیص میدهد و به سرعت به سوالات پاسخ میدهد. با این همه بنابر گزارش بلومبرگ، گوگل اعتراف کرده است که اتفاقات ویدئو همراه با پرامپتهای صوتی در لحظه رخ نداده است. از طرفی کاربران با تماشای ویدئو تصور میکنند که یک کاربر در حال مکالمه با جمینای است و هوش مصنوعی گوگل در لحظه به صحبتها پاسخ میدهد، در حالی که در واقعیت چنین اتفاقاتی رخ نداده است.
بلومبرگ: چت جیپیتی عملکرد بهتری دارد
6. طبق ادعای خبرنگار بلومبرگ، گوگل برای پنهان کردن این موضوع که جمینای از چتبات چت جیپیتی شرکت اوپنایآی عملکرد ضعیفتری دارد، تصمیم به انتشار چنین ویدئویی گرفته است. البته گوگل چنین موضوعی را رد کرده است. اوریول وینیالز، معاون ریاست بخش تحقیق و یادگیری عمیق دیپمایند که یکی از رهبران پروژه جمینای هم محسوب میشود، با انتشار پستی در ایکس نحوه ساخت ویدئو را چنین توضیح داده است: «تمام دستورها و خروجیها در ویدئو واقعی هستند و برای اختصار، کوتاه شدهاند. این ویدئو نشاندهنده تجربه کاربری است که افراد میتوانند با جمینای داشته باشند. ما این ویدئو را برای الهامبخشیدن به توسعهدهندگان ساختهایم.»