با اعلام رسمی کمپانی گوگل در رویداد Google I/O 2024، مولد هوش مصنوعی Gemini 1.5 Pro بههمراه Gemini 1.5 Flash با قابلیتهایی مانند آنالیز، دستهبندی و خلاصهسازی متون بسیار طولانی و پیشرفته معرفی شد تا افراد با استفاده ازآن بهترین تجربه کاربری را داشته باشند.
همانطورکه میدانید، چندماه پیش کمپانی آمریکایی گوگل از مولد هوش مصنوعی Gemini 1.0 بهصورت رسمی رونمایی کرد که قابلیتهای نسبتا پیشرفتهای داشت؛ باوجوداین، بهنظر میرسد این غول نرمافزاری قصد دارد بهبرترین مولد جهان دست پیدا کند؛ بنابراین، امروز در رویداد Google I/O 2024 بهصورت رسمی Gemini 1.5 Pro و Gemini 1.5 Flash را معرفی شد تا ویژگیها و عملکرد چشمگیرتری را بهنمایش بگذارد. همچنین، گوگل ادعا میکند یکی از بهترین موارد درخصوص بهروزرسانی Gemini 1.5 پنجره بسیار بزرگتر برای چتبات است که کاربران با استفاده ازآن میتوانند بهراحتی بهخواستههایشان برسند.
مولد هوش مصنوعی Gemini 1.5 Pro بهعنوان یک نسخه میانی محسوب میشود که قابلیت ارائه ۱۲۸,۰۰۰ توکنبرثانیه را خواهد داشت. درمقاممقایسه، نسخه قدیمی ۳۲,۰۰۰ توکنبرثانیه ارائه میکند، اما نسخه جدید با قابلیتهایی که دارد میتواند بیشتر از ۷۰۰,۰۰۰ کلمه را ترجمه یا ۳۲,۰۰۰ خط کد را بخواند. ازسویدیگر، باید اشاره کنیم این مولد قابلیت شناسایی ۱۱ ساعت فایل صوتی یا یک ساعت فایل ویدئویی است. برای درک بهتر از ویژگیهای Gemini 1.5 Pro باید گفت GPT-4 Turbo تنها ۱۲۸۰۰ توکنبرثانیه ارائه میکند، اما مولد هوش مصنوعی Claude 2.1 بیشتر از ۲۰۰,۰۰۰ توکنبرثانیه دارد که قدرتمندترین مولد شناخته میشود.
علاوهبراین، باید اشاره کنیم گوگل قصد دارد تا یک میلیون توکنبرثانیه ارائه دهد که برای برخی کاربران بتا فعال خواهد شد؛ ازسویدیگر، گزارشها نشان میدهد غول نرمافزاری آمریکایی ۱۰ میلیون توکنبرثانیه را آزمایش میکند تا در بهروزرسانیهای آینده مولد هوش مصنوعی Gemini آن را دراختیار کاربران قرار دهد. باتوجهبه اطلاعات، معماری Gemini 1.5 Pro برپایه Mixture-of-Experts یا بهاختصار MoE توسعهیافته است. درواقع، در چنین معماری شبکههای عصبی بهواحدهای کوچکتر تقسیم میشوند تا برای پاسخ بهسوالها و درخواستهای کاربران بسیار سریعتر و کارآمدتر عمل کنند.
باتوجهبه عملکرد، گوگل اذعان کرد Gemini 1.5 Pro میتواند در 87 درصد معیارها در زمینههای مختلف مانند ارزیابی متن، کد، عکس، صدا و تصویر، عملکرد بهتری از نسخه قدیمیتر داشته باشد؛ همچنین، ویژگیها و عملکرد این بهروزرسانی درمقایسهبا Gemini 1.0 Ultra بهتر است. همانطورکه اشاره کردیم، Gemini 1.5 Pro بهصورت محدود برای برخی کاربران و سازمان فعال میشود؛ بنابراین باید تا اتمام دوره آزمایشی صبور باشید تا بتوانید از تمام قابلیتهای آن بهرهمند شوید. بهنظر میرسد گوگل میتواند با عرضه نسخه عمومی Gemini 1.5 Pro عصر جدیدی را بهکاربران در حوزه هوش مصنوعی معرفی کند.
علاوهبراین، باید اشاره کنیم Gemini 1.5 Flash ازنظر عملکرد بین مولدهای Gemini 1.5 Pro و Gemini 1.5 Nano قرار دارد که بهصورت بومی روی دستگاههای هوشمند مینشیند! باوجود پارامترهای کمتر درمقایسهبا Gemini 1.5 Pro، قدرت بسیار خوبی دارد که میتواند اطلاعات بسیار مهمی را دراختیار کاربران و توسعهدهندگان قرار دهد. درحقیقت، مولد Gemini 1.5 Flash قابلیتهای چندوجهی را بهصورت همزمان با یک میلیون توکنبرثانیه دارد که حداقل توانایی آن تجزیهوتحلیل سندی 1500 صفحهای یا متنی 30000 خطی را دارد؛ چنین قابلیتی برای دانشجویان یا استادان موثر و کاربردی است.
هردو مولدهای هوش مصنوعی Gemini 1.5 Pro و Gemini 1.5 Flash در پیشنمایش اولیه گوکل روی پلتفرمهای Vertex AI و AI Studio قرار دارند که برای کاربران در ایالات متحده آمریکا فعال میشوند! همچنین، گوگل امروز نسخه جدیدی از مدل متنباز Gemma را تحتعنوان Gemma 2 معرفی خواهد کرد که برای توسعهدهندگان و ساخت برنامهها و خدمات هوش مصنوعی بسیار موثر و کاربردی خواهد بود.