در رویداد I/O 2024، گوگل از ابتکارات جدیدی برای ادغام هوش مصنوعی قدرتمند جمینای در سیستم عامل اندروید رونمایی کرد که هدف آن، بازتعریف کامل این پلتفرم و ارائه تجربه‌ای فراتر از یک سیستم عامل موبایل به کاربران است.

رویداد I/O گوگل، همایش سالانه‌ این شرکت امسال با تمرکز ویژه‌ای بر هوش مصنوعی در حال برگزاری است. گوگل با ارائه‌ به‌روزرسانی‌های جدید، عزم خود را برای تسهیل دسترسی همگانی به فناوری هوش مصنوعی جزم کرده است و در این راستا، دستاوردهای قابل توجهی را به نمایش گذاشته است. هوش مصنوعی به‌عنوان هسته‌ مرکزی سیستم‌عامل اندروید، نقش محوری در عملکرد آن ایفا می‌کند. در همین راستا، گوگل با معرفی جمینای، دستیار هوشمند قدرتمند خود، به تقویت زیرساخت‌های هوش مصنوعی در اندروید پرداخته است. جمینای با قابلیت درک بهتر زمینه و ادغام عمیق‌تر با برنامه‌ها و محتوای روی صفحه، به‌طور مستمر در حال توسعه و بهبود است.

این تمرکز بر هوش مصنوعی و معرفی مدل جمینای نشان‌دهنده‌ تلاش‌های مستمر گوگل برای دموكراتیزاسیون یا عمومیت بخشیدن فناوری‌های پیشرفته و ارتقا تجربه‌ کاربری برای آحاد مردم است. با بهره‌گیری از این فناوری‌های نوآورانه، گوگل در نظر دارد تا راه‌حل‌های هوش مصنوعی را در اختیار همگان قرار داده و زمینه‌ استفاده‌ آسان‌تر و گسترده‌تر از آن‌ها را فراهم سازد. در راستای یکپارچه‌سازی هوش مصنوعی با سیستم‌عامل اندروید، شرکت گوگل قابلیت‌های جدیدی را برای دستیار هوشمند قدرتمندش، جمینای ، معرفی کرده است. این قابلیت‌ها با هدف ارتقا بهره‌وری و غنی‌سازی تجربه‌ کاربری کاربران در تعامل با اطلاعات بر روی دستگاه‌های اندرویدی طراحی شده‌اند.

Gemini-nano

یکی از ویژگی‌های قابل توجه، پنل شناور جمینای است که دسترسی به قابلیت‌های جستجوی مبتنی بر هوش مصنوعی را در تمامی بخش‌های سیستم‌عامل تسهیل می‌کند. کاربران می‌توانند نتایج جستجو را به سادگی به سایر برنامه‌ها مانند یادداشت‌برداری یا پیام‌رسان منتقل (Drag & Drop) کنند. این قابلیت، فرآیند انتقال اطلاعات و غنی‌سازی محتوای در حال کار را به شکل مؤثری تسهیل می‌بخشد.

ازسوی‌دیگر قابلیت Ask که در حال حاضر در اپلیکیشن یوتیوب ادغام شده، امکان طرح سؤال در خصوص بخش‌های مختلف ویدیو را با در نظر گرفتن بافت و محتوای آن فراهم می‌کند. این امر به درک عمیق‌تر مفاهیم مطرح‌شده در ویدیوها و یادگیری مؤثرتر کاربران کمک شایانی می‌کند. کاربران نسخه‌ حرفه‌ای جمینای نیز از قابلیت مشابهی تحت عنوان از این پی‌دی‌اف بپرس بهره‌مند خواهند شد که امکان جستجو و پرسش درباره‌ اسناد را به آن‌ها می‌دهد.

مجموعه‌ این قابلیت‌های جدید که قرار است در ماه‌های آینده در سطح جهانی در اختیار کاربران قرار گیرد، دستیار هوش مصنوعی جمینای را به ابزاری قدرتمند و فراگیر برای تعامل با انواع محتوا در دستگاه‌های اندرویدی تبدیل می‌کند. با استفاده از فناوری جمینای نانو که در هسته‌ این قابلیت‌ها قرار دارد، سیستم‌عامل اندروید قادر خواهد بود بر اساس دستورات کاربران به جستجو پرداخته و محتوای متنی یا بصری تولید نماید. این امر نویدبخش دوره‌ جدیدی از تعامل انسان و ماشین با واسطه‌ی رابط کاربری مبتنی بر هوش مصنوعی است.

افزون‌براین، گوگل با ارائه‌ نمایشی از عملکرد جمینای درون اپلیکیشن یوتیوب، توانمندی‌های آن را به شکلی مؤثر به تصویر کشید. ایکون از این ویدیئو بپرس این امکان را برای کاربران فراهم می‌کند تا ضمن تماشای ویدیو و با در نظر گرفتن محتوای آن، پرسش‌های خود را مطرح کرده و به پاسخ‌هایی مرتبط با آن بخش خاص از ویدیو دست یابند. این قابلیت نوآورانه، درک عمیق‌تر مفاهیم مطرح‌شده در ویدیوها و یادگیری مؤثرتر را تسهیل می‌کند.

در مجموع، یکپارچه‌سازی جمینای و جمینای نانو با اندروید، گامی بلند در جهت ارتقا بهره‌وری و غنی‌سازی تجربه‌ کاربری در این سیستم‌عامل است. فناوری جمینای نانو که از سال گذشته معرفی شده است، امسال شاهد ارتقاء قابل توجهی در زمینه‌ پشتیبانی از چندرسانه‌ای multimodality خواهد بود. این قابلیت با در نظر گرفتن تصاویر، صداها و زبان گفتاری تجربه‌ کاربری را به سطح بالاتری ارتقا می‌دهد. جمینای نانوی چندرسانه‌ای در اواخر سال جاری، ابتدا بر روی گوشی‌های پیکسل گوگل عرضه خواهد شد. این قابلیت به کاربران امکان می‌دهد تا با استفاده از TalkBack سرویس گوگل برای افراد کم‌بینا برای تصاویر بدون شرح، توضیحات غنی و کاملی را مستقیماً بر روی دستگاه تولید کنند.

Gemini

به‌عبارت‌دیگر، جمینای نانو با تجزیه و تحلیل همزمان تصاویر، صداها و دستورات صوتی کاربر، درک عمیق‌تری از محتوای در حال مشاهده را برای کاربر فراهم می‌کند. این فناوری همچنین قادر است بر اساس این درک، برای تصاویر بدون شرح، توضیحات متنی تولید کند. ارائه‌ این قابلیت بر روی گوشی‌های پیکسل، گام اولیه‌ای برای بهره‌مندی تمامی کاربران اندروید از جمینای نانوی چندرسانه‌ای در آینده‌ای نزدیک به شمار می‌رود. در رویداد I/O گوگل، این شرکت از پیشرفت‌های قابل توجهی در حوزه‌ی هوش مصنوعی و ادغام آن با سیستم‌عامل اندروید پرده برداشت. این نوآوری‌ها با هدف ارتقای سطح اطلاعات، امنیت و کارایی تجربه‌ی کاربری در دستگاه‌های اندرویدی طراحی شده‌اند.

یکی از قابلیت‌های کلیدی، فناوری جمینای نانو است که با پشتیبانی چندرسانه‌ای تصاویر، صدا و زبان گفتاری به درک عمیق‌تری از محتوای در حال مشاهده توسط کاربر می‌رسد. این امر به پر کردن خلاهای اطلاعاتی منجر می‌شود، برای مثال، در هنگام دریافت تصاویر از دوستان و خانواده، «جمینای نانو» قادر است جزئیات بیشتری را در اختیار کاربر قرار دهد. همچنین، این فناوری در خریدهای آنلاین با تشخیص مدل و برش لباس‌ها، فرایند انتخاب را برای کاربران تسهیل می‌کند.

علاوه‌براین، جمینای نانو با قابلیت نظارت لحظه‌ای بر مکالمات تلفنی، تماس‌های مشکوک احتمالاً کلاهبرداری را شناسایی کرده و به کاربر امکان قطع فوری تماس یا ادامه‌ی مکالمه را می‌دهد. این ویژگی می‌تواند امنیت کاربران را در برابر تماس‌های تلفنیِ جعلی و کلاه‌برداری به طور قابل توجهی ارتقا بخشد. مجموعه‌ این قابلیت‌های مبتنی بر هوش مصنوعی، نویدبخش دوره‌ جدیدی از تعامل انسان و ماشین با واسطه‌ رابط کاربری هوشمند است. گوگل همچنین از عرضه‌ نسخه‌ جدید سیستم‌عامل اندروید با نام اندروید ۱۵ در اواخر سال جاری خبر داد. انتظار می‌رود که رونمایی از اندروید ۱۵ همزمان با معرفی سری جدید گوشی‌های پیکسل ۹ صورت پذیرد. جزئیات بیشتر در خصوص قابلیت‌های اندروید ۱۵ در ادامه‌ی این رویداد، توسط گوگل ارائه خواهد شد.

اخبار مرتبط: