به زودی، قابلیت جدیدی به نام Ask Photos به برنامه محبوب مدیریت عکسهای گوگل، یعنی Google Photos، اضافه خواهد شد. این قابلیت که مبتنی بر هوش مصنوعی قدرتمند Gemini گوگل است، انقلابی در نحوه جستجوی عکسهایتان ایجاد میکند.
در گذشته، کاربران Google Photos برای یافتن محتوای مورد نظر خود در میان تصاویر، به جستجوی دستی افراد، مکانها یا اشیاء خاص تکیه میکردند. اما گوگل در کنفرانس توسعهدهندگان Google I/O 2024 که به تازگی برگزار شد، از یک ارتقاء قابل توجه در زمینه هوش مصنوعی این برنامه خبر داد. این ارتقاء که مبتنی بر پردازش پیشرفته زبان طبیعی است، فرآیند جستجو را از حالت دستی و مبتنی بر کلمات کلیدی، به روشی بسیار شهودیتر و کاربرپسندتر تغییر خواهد داد. با این نوآوری، کاربران میتوانند به سادگی با استفاده از زبان طبیعی و جملات ساده، به جستجوی عکسهای دلخواه خود بپردازند.
با بهرهمندی از قابلیت پردازش پیشرفته زبان طبیعی، جستجو در Google Photos به تجربهای کاملاٌ شهودی و کاربرپسند تبدیل میشود. کاربران میتوانند با جملات ساده و به زبان طبیعی، درخواستهای پیچیدهای را به هوش مصنوعی ارائه دهند. برای مثال، به جای تایپ کردن برج ایفل، میتوانید با گفتن بهترین عکس من از برج ایفل را پیدا کن، نتایج دقیقتری را به دست آورید.
هوش مصنوعی Google Photos برای تعیین بهترین عکس از یک مجموعه، از سیگنالهای مختلفی مانند نور، میزان تاری، نبود اشیا اضافی در پسزمینه و موارد دیگر استفاده میکند. این هوش مصنوعی همچنین قادر است با درک موقعیت جغرافیایی یا تاریخ ثبت عکسها، تنها تصاویری را که مطابق با درخواست کاربر هستند، بازیابی نماید. به عنوان نمونه، با گفتن بهترین عکس از هر کدام از پارکهای ملیای که بازدید کردم را پیدا کن، هوش مصنوعی میتواند تنها تصاویری را که در پارکهای ملی آمریکا گرفته شدهاند، با در نظر گرفتن معیارهای بهترین عکس، بازیابی کند.
این ارتقاء مبتنی بر هوش مصنوعی، فرآیند جستجوی عکس در Google Photos را از یک کارکرد صرفاً دستی به یک ابزار قدرتمند و کارآمد برای کاوش و مدیریت مجموعه عکسهای کاربران تبدیل میکند.
همانطور که اشاره شد، این قابلیت جستجوی پیشرفتهی مبتنی بر هوش مصنوعی، بر پایهی نوآوری دیگری از Google Photos به نام بستههای عکس (Photo Stacks) بنا شده است. بستههای عکس به صورت خودکار عکسهای تقریباً مشابه را در کنار هم قرار میدهد و با استفاده از هوش مصنوعی، بهترین عکس از هر مجموعه را برای کاربر برجسته میکند. هدف هر دوی این قابلیتها، یعنی بستههای عکس و جستجوی مبتنی بر هوش مصنوعی، یاری رساندن به کاربران در یافتن عکسهای مورد نظرشان در میان مجموعههای عظیم عکسهای دیجیتال است. جالب است بدانید که طبق آمار گوگل، روزانه بیش از ۶ میلیارد عکس در Google Photos آپلود میشود که این رقم به خوبی وسعت و حجم بالای عکسهای کاربران را نشان میدهد.
این ادغام هوش مصنوعی، فرآیند جستجوی عکس را از یک عملیات دستی و زمانبر به یک ابزار قدرتمند و کارآمد برای سازماندهی و کاوش در آرشیو دیجیتال کاربران تبدیل میکند.
علاوه بر قابلیت جستجوی قدرتمند، ویژگی جدید Ask Photos امکان پرسیدن سوالات متنوع و دریافت پاسخهای مفید را برای کاربران فراهم میکند. فراتر از درخواست برای یافتن بهترین عکسها از یک سفر یا گروهی از تصاویر، کاربران میتوانند سوالاتی بپرسند که نیازمند درک تقریباً انسانی از محتوای عکسهایشان باشد.
برای مثال، میتوانید بپرسید در کدام عکسها با دوستانم در ساحل بودیم؟ یا عکسی که گربهام در حال پریدن است را پیدا کن. هوش مصنوعی Google Photos با درک عمیق از محتوای عکسها، از جمله تشخیص چهره، اشیاء و موقعیتها، قادر به درک این سوالات پیچیده و ارائه پاسخهای دقیق است. این سطح از درک به کاربران امکان میدهد تا به روشی بسیار طبیعی و شهودی با مجموعه عکسهای خود تعامل برقرار کنند و خاطرات و تجربیات ثبت شده در آنها را به راحتی مرور و بازیابی کنند.
بعنوان مثال، یک والد میتواند با پرسیدن سوالاتی از Ask Photos، خاطرات جشن تولدهای فرزندش را به راحتی مرور کند. برای نمونه، این قابلیت میتواند با درک محتوای تصاویر و ویدیوهای مرتبط با جشن تولد، به سوالاتی مانند برای چهار جشن تولد آخر فرزندم از چه تمهایی استفاده کردیم؟ پاسخ دهد.
Ask Photos نه تنها به این سوال با پاسخی ساده جواب میدهد، بلکه تصاویر و ویدیوهای مربوط به هر جشن تولد را نیز نمایش میدهد. این قابلیت حتی میتواند تاریخ برگزاری هر جشن تولد را نیز تشخیص داده و به کاربر اعلام کند.
این سطح از درک هوش مصنوعی به والدین کمک میکند تا به راحتی به آرشیو دیجیتال جشنهای تولد فرزندشان دسترسی پیدا کنند و لحظات به یادماندنی را با سرعت و به سادگی مرور کنند.
علاوه بر این، قابلیتهای چندوجهی هوش مصنوعی به آن امکان میدهد تا متن موجود در عکسها را نیز درک کند و تشخیص دهد که آیا این متن با موضوع سوال مرتبط است یا خیر. برای مثال، اگر در عکسی از یک جشن تولد، بنری با عبارت تولد ۳ سالگی با تم ابرقهرمان وجود داشته باشد، هوش مصنوعی میتواند این متن را خوانده و آن را به عنوان مدرکی دال بر استفاده از تم ابرقهرمان در آن جشن در نظر بگیرد.
این سطح از درک عمیق، Ask Photos را به ابزاری قدرتمند برای کاوش در آرشیو دیجیتال عکسها تبدیل میکند. هوش مصنوعی نه تنها به سوالات کاربران پاسخ میدهد، بلکه با در نظر گرفتن تمام جزئیات موجود در عکسها و ویدیوها، پاسخی جامع و مرتبط را ارائه می دهد.
در جریان کنفرانس توسعهدهندگان گوگل (Google I/O) که امروز برگزار شد، مدیرعامل این شرکت، آقای ساندار پیچای، نمونهای دیگر از قابلیتهای Ask Photos را به حضار نمایش داد. در این مثال، کاربری از هوش مصنوعی خواست تا پیشرفت شنا کردن فرزندش را به او نشان دهد. هوش مصنوعی گوگل Photos با درک مفهوم این سوال، به سراغ کل آرشیو عکسها و ویدیوهای مرتبط با شنا کردن کودک رفت و مجموعهای از بهترین لحظات را که نشاندهندهی پیشرفت او در طول زمان بود، برای کاربر گردآوری و نمایش داد.
این مثال به خوبی نشان میدهد که Ask Photos فراتر از پاسخ به سوالات ساده عمل میکند. هوش مصنوعی پیشرفته گوگل میتواند با درک مفاهیم پیچیدهتر، به کاربران در مرور و سازماندهی آرشیو دیجیتال عکسها و ویدیوهایشان کمک نماید.
ابلیت جدید دیگری که در Google Photos معرفی شد، از قابلیت جستجو برای یافتن پاسخ از متن موجود در عکسها استفاده میکند. به این ترتیب، میتوانید از هر چیزی که میخواهید بعداً به خاطر بسپارید، مانند پلاک خودرو یا شماره گذرنامهتان، عکس بگیرید و سپس از هوش مصنوعی بخواهید زمانی که به آن اطلاعات نیاز داشتید، آنها را بازیابی کند.
فرض کنید میخواهید پلاک خودرو اجارهایتان را که قرار است چند روز دیگر تحویل دهید، به خاطر بسپارید. کافی است با گوشی خود از پلاک عکس بگیرید و آن را در Google Photos ذخیره کنید. سپس، چند روز بعد، میتوانید از Ask Photos سوال کنید عکسی که از پلاک خودرو اجارهای گرفتم را نشان بده و هوش مصنوعی به سرعت آن عکس را برای شما پیدا خواهد کرد.
این قابلیت کاربردهای فراوانی دارد. برای مثال، میتوانید از رسیدهای خرید، کارتهای ویزیت، برچسبهای دارو یا هر مدرک دیگری که حاوی اطلاعات متنی است، عکس بگیرید و بعداً به راحتی با پرسیدن سوال از Ask Photos آنها را پیدا کنید. دیگر نیازی نیست نگران فراموش کردن اطلاعات مهم باشید، زیرا هوش مصنوعی قدرتمند Google Photos آنها را به خاطر میسپارد.
همانطور که با Ask Photos کار میکنید، هوش مصنوعی گوگل Photos به طور مداوم در حال یادگیری و بهبود است. اگر هوش مصنوعی اشتباهی مرتکب شود و شما آن را اصلاح کنید، برای مثال عکسی را که مربوط به جشن تولد نیست علامتگذاری کنید یا عکسی را که از تعطیلات خود به عنوان برجسته انتخاب کنید ، هوش مصنوعی این بازخورد را به خاطر میسپارد تا عملکرد خود را در آینده ارتقا دهد.
این فرآیند یادگیری مداوم به این معناست که هرچه بیشتر با Ask Photos تعامل داشته باشید، هوش مصنوع درک بهتر و شخصیتری نسبت به نیازها و ترجیحات شما پیدا میکند. در نتیجه، با گذشت زمان، پاسخها و پیشنهادات Ask Photos مرتبطتر و کارآمدتر خواهد شد. به عبارت دیگر، Ask Photosبا شما هماهنگ میشود تا به ابزاری ایدهآل برای مدیریت و جستجوی آسان عکسهایتان تبدیل شود.
علاوه بر جستجوی قدرتمند و درک عمیق از محتوا، Ask Photos حتی میتواند به شما در به اشتراک گذاری آسانتر عکسها نیز کمک کند. زمانی که تصاویری را برای به اشتراک گذاری انتخاب میکنید، هوش مصنوعی میتواند به طور خودکار پیشنهادی برای نوشتن توضیحاتی خلاصه از محتوای آن عکسها ارائه دهد.
البته فعلاً این قابلیت تنها متن خلاصهای را پیشنهاد میکند و امکان انتخاب از سبکهای مختلف نوشتاری را ندارد. اما با توجه به این که Ask Photos از مدل هوش مصنوعی قدرتمند Gemini استفاده میکند، شاید با پرسیدن سوالات هوشمندانه بتوانید هوش مصنوعی را برای تولید توضیحاتی با سبک خاص هدایت کنید. به عنوان مثال، میتوانید بپرسید «عکسی که در ساحل با دوستانم گرفتهام را با توضیحی در مورد خوشگذرانی در تعطیلات به اشتراک بگذار.
به طور کلی، این قابلیت جدید میتواند در صرفهجویی در وقت شما برای نوشتن توضیحات عکسها مفید باشد و به اشتراک گذاری لحظات به یادماندنی با دوستان و خانواده را آسانتر کند.
ویژگی Ask Photos در ابتدا به زبان انگلیسی و تنها در آمریکا در دسترس خواهد بود و بعدا به مناطق بیشتری گسترش پیدا میکند. همچنین فعلا این قابلیت فقط متنی است و شبیه به پرسیدن سوال از یک چتبات مبتنی بر هوش مصنوعی عمل میکند. با گذشت زمان، این قابلیت میتواند با مدل هوش مصنوعی که روی دستگاههایی مثل اندروید اجرا میشود، ادغام عمیقتری پیدا کند.
این شرکت میگوید اطلاعات شخصی کاربران در Google Photos برای تبلیغات استفاده نمیشود. گوگل میگوید، همچنین مکالمات هوش مصنوعی و دادههای شخصی را در Ask Photos بررسی نمیکنند، مگر در موارد نادر برای رسیدگی به سوء استفاده یا آسیب همچنین از دادههای شخصی افراد در Google Photos برای آموزش هیچ محصول هوش مصنوعی مولد دیگری مانند Gemini استفاده نمیشود.