هوش مصنوعی Gemini 1.5 Pro و Gemini 1.5 Flash معرفی شد؛ قدرت‌مند و سبک

با اعلام رسمی کمپانی گوگل در رویداد Google I/O 2024، مولد هوش مصنوعی Gemini 1.5 Pro به‌همراه Gemini 1.5 Flash با قابلیت‌هایی مانند آنالیز، دسته‌بندی و خلاصه‌سازی متون بسیار طولانی و پیشرفته معرفی شد تا افراد با استفاده ازآن بهترین تجربه کاربری را داشته باشند.

همان‌طورکه می‌دانید، چندماه پیش کمپانی آمریکایی گوگل از مولد هوش مصنوعی Gemini 1.0 به‌صورت رسمی رونمایی کرد که قابلیت‌های نسبتا پیشرفته‌ای داشت؛ باوجوداین، به‌نظر می‌رسد این غول نرم‌افزاری قصد دارد به‌برترین مولد جهان دست پیدا کند؛ بنابراین، امروز در رویداد Google I/O 2024 به‌صورت رسمی Gemini 1.5 Pro و Gemini 1.5 Flash را معرفی شد تا ویژگی‌ها و عملکرد چشمگیرتری را به‌نمایش بگذارد. همچنین، گوگل ادعا می‌کند یکی از بهترین موارد درخصوص به‌روزرسانی Gemini 1.5 پنجره بسیار بزرگ‌تر برای چت‌بات است که کاربران با استفاده ازآن می‌توانند به‌راحتی به‌خواسته‌هایشان برسند.

مولد هوش مصنوعی Gemini 1.5 Pro به‌عنوان یک نسخه میانی محسوب می‌شود که قابلیت ارائه ۱۲۸,۰۰۰ توکن‌برثانیه را خواهد داشت. درمقام‌مقایسه، نسخه قدیمی ۳۲,۰۰۰ توکن‌برثانیه ارائه می‌کند، اما نسخه جدید با قابلیت‌هایی که دارد می‌تواند بیشتر از ۷۰۰,۰۰۰ کلمه را ترجمه یا ۳۲,۰۰۰ خط کد را بخواند. ازسوی‌دیگر، باید اشاره کنیم این مولد قابلیت شناسایی ۱۱ ساعت فایل صوتی یا یک ساعت فایل ویدئویی است. برای درک بهتر از ویژگی‌های Gemini 1.5 Pro باید گفت GPT-4 Turbo تنها ۱۲۸۰۰ توکن‌برثانیه ارائه می‌کند، اما مولد هوش مصنوعی Claude 2.1 بیشتر از ۲۰۰,۰۰۰ توکن‌برثانیه دارد که قدرت‌مندترین مولد شناخته می‌شود.

علاوه‌براین، باید اشاره کنیم گوگل قصد دارد تا یک میلیون توکن‌برثانیه ارائه دهد که برای برخی کاربران بتا فعال خواهد شد؛ ازسوی‌دیگر، گزارش‌ها نشان می‌دهد غول نرم‌افزاری آمریکایی ۱۰ میلیون توکن‌برثانیه را آزمایش می‌کند تا در به‌روزرسانی‌های آینده مولد هوش مصنوعی Gemini آن را دراختیار کاربران قرار دهد. باتوجه‌به اطلاعات، معماری Gemini 1.5 Pro برپایه Mixture-of-Experts یا به‌اختصار MoE توسعه‌‌یافته است. درواقع، در چنین معماری شبکه‌های عصبی به‌واحد‌های کوچک‌تر تقسیم می‌شوند تا برای پاسخ به‌سوال‌ها و درخواست‌های کاربران بسیار سریع‌تر و کارآمدتر عمل کنند.

باتوجه‌به عملکرد، گوگل اذعان کرد Gemini 1.5 Pro می‌تواند در 87 درصد معیارها در زمینه‌های مختلف مانند ارزیابی متن، کد، عکس، صدا و تصویر، عملکرد بهتری از نسخه قدیمی‌تر داشته باشد؛ همچنین، ویژگی‌ها و عملکرد این به‌روزرسانی درمقایسه‌با Gemini 1.0 Ultra بهتر است. همان‌طورکه اشاره کردیم، Gemini 1.5 Pro به‌صورت محدود برای برخی کاربران و سازمان فعال می‌شود؛ بنابراین باید تا اتمام دوره آزمایشی صبور باشید تا بتوانید از تمام‌ قابلیت‌های آن بهره‌مند شوید. به‌نظر می‌رسد گوگل می‌تواند با عرضه نسخه عمومی Gemini 1.5 Pro عصر جدیدی را به‌کاربران در حوزه هوش مصنوعی معرفی کند.

علاوه‌براین، باید اشاره کنیم Gemini 1.5 Flash ازنظر عملکرد بین مولد‌های Gemini 1.5 Pro و Gemini 1.5 Nano قرار دارد که به‌صورت بومی روی دستگاه‌های هوشمند می‌نشیند! باوجود پارامترهای کمتر درمقایسه‌‌با Gemini 1.5 Pro، قدرت بسیار خوبی دارد که می‌تواند اطلاعات بسیار مهمی را دراختیار کاربران و توسعه‌دهندگان قرار دهد. درحقیقت، مولد Gemini 1.5 Flash قابلیت‌های چندوجهی را به‌صورت هم‌زمان با یک میلیون توکن‌برثانیه دارد که حداقل توانایی آن تجزیه‌وتحلیل سندی 1500 صفحه‌ای یا متنی 30000 خطی را دارد؛ چنین قابلیتی برای دانشجویان یا استادان موثر و کاربردی است.

هردو مولدهای هوش مصنوعی Gemini 1.5 Pro و Gemini 1.5 Flash در پیش‌نمایش اولیه گوکل روی پلتفرم‌های Vertex AI و AI Studio قرار دارند که برای کاربران در ایالات متحده آمریکا فعال می‌شوند! همچنین، گوگل امروز نسخه جدیدی از مدل متن‌باز Gemma را تحت‌عنوان Gemma 2 معرفی خواهد کرد که برای توسعه‌دهندگان و ساخت‌ برنامه‌ها و خدمات هوش مصنوعی بسیار موثر و کاربردی خواهد بود.