به‌تازگی شاهد رونمایی از هوش مصنوعی علی‌بابا به‌نام QwQ-32B-Preview بودیم که قرار است مدل o1 شرکت OpenAI را به چالش بکشد.

این هوش مصنوعی که توسط تیم Qwen شرکت علی‌بابا توسعه یافته، شامل 32.5 میلیارد پارامتر بوده و می‌تواند پیام‌هایی تا 32 هزار کلمه نیز به نمایش دربیاورد. عملکرد آن بنچمارک‌های مختلف از o1-preview و o1-mini شرکت OpenAI بهتر بوده و تبدیل به رقیبی قدر برای این کمپانی معروف شده است.

تا پارامترهای یک هوش مصنوعی بیشتر باشد، تاثیر نسبتاً بیشتری بر روی قابلیت‌ها و مهارت‌های حل مسئله آن خواهد گذاشت. متاسفانه شرکت OpenAI جزئیاتی از پارامترهای مدل o1 خود عنوان نکرده و به‌همین دلیل، به‌صورت دقیق نمی‌توانیم این دو هوش مصنوعی را از این لحاظ با یکدیگر مقایسه کنیم.

هوش مصنوعی علی‌بابا در تست‌های AIME و MATH که توسط خود علی‌بابا برگزار شد، از مدل o1-preview شرکت OpenAI پیشی گرفت. بنچمارک AIME از مدل‌های هوش مصنوعی دیگر استفاده می‌کند و با مقایسه آنان، نمره‌ای به عملکرد هوش مصنوعی در دست بررسی می‌دهد. از طرف دیگر، بنچمارک MATH نیز هوش مصنوعی را مجموعه‌ای مسائل روبرو می‌کند تا سرعت و دقت آن در حل این مسائل را شناسایی کند.

به لطف قابلیت‌های تحلیلی که در هوش مصنوعی QwQ-32B-Preview گنجانده شده، این مدل قابلیت حل پازل‌های منطقی و سوالات سخت و سنگین ریاضی را دارد. بااین‌حال، این مدل هنوز فاصله زیادی تا بهترین و کامل‌ترین شدن دارد. بر اساس گزارش شرکت علی‌بابا، مشکلات این مدل شامل عوض‌کردن ناگهانی و ناخواسته زبان، تکرار برخی نوشته‌ها و عملکرد نامناسب در برخی تسک‌هاست که نیاز به تفکر منطقی و استدلال دارد.

هوش مصنوعی علی‌بابا

برخلاف بیشتر مدل‌های هوش مصنوعی فعلی، مدل QwQ-32B-Preview و سایر مدل‌هایی که از دلیل و منطق استفاده می‌کنند، به‌طور مرتب اطلاعات خود را چک می‌کنند تا چیزی درست، دقیق و بروز ارائه دهند. به لطف این قابلیت‌ها، این مدل هوش مصنوعی درگیر مشکلات سایر هوش مصنوعی‌ها نخواهد شد اما از طرف دیگر، پاسخ‌هایش را نیز دیرتر از سایر مدل‌ها ارائه خواهد کرد.

عملکرد هوش مصنوعی علی‌بابا مشابه o1 شرکت OpenAI است و از طریق بررسی تسک‌ها، برنامه‌ریزی و در نهایت انجام مجموعه‌ای از اعمال، به جواب موردنظرش در پاسخ به درخواست کاربر می‌رسد. درحال‌حاضر، می‌توانید هوش مصنوعی QwQ-32B-Preview را از طریق وبسایت Hugging Face دانلود و استفاده کنید. جالب است بدانید که این مدل، شباهت‌هایی به هوش مصنوعی DeepSeek نیز داشته و به شکلی ماهرانه، از پاسخ به برخی سوالات سیاسی، اجتناب می‌کند.

باتوجه به این که هردو شرکت DeepSeek و علی‌بابا چینی هستند و به شدت نیز تحت نظارت سازمان‌های رگولاتوری این کشور قرار گرفته‌اند، طبیعی است که محدودیت‌هایی در این زمینه برای هوش مصنوعی خود اعمال کرده باشند. بسیاری از هوش مصنوعی‌های چینی، از پاسخ به سوالات سیاسی و مسائلی پیرامون رژیم‌های خاص در تاریخ چین، اجتناب می‌ورزند زیرا در صورت پاسخ به این سوال، مشکلاتی با رگولاتوری‌ها برایشان پیش می‌آید.

جالب است بدانید که از QwQ-32B-Preview سوال شد که آیا تایوان بخشی از کشور چین است؟ این هوش مصنوعی پاسخی عجیب ارائه کرده و این مسئله را تایید کرد. این موضوع، فقط توسط دولت چین تایید می‌شود و سایر کشورهای دنیا، تایوان را به‌عنوان یک کشور مستقل قبول دارند. از طرف دیگر، سوالاتی در مورد میدان تیان‌مان نیز از این هوش مصنوعی پرسیده شد که در کمال تعجب، هیچ جواب خاصی در این مورد ارائه نداد.

هوش مصنوعی علی‌بابا

درحال‌حاضر، مدل QwQ-32B-Preview به صورت عمومی و تحت لیسانس Apache 2.0 در دسترس است پس می‌توانید از آن برای مصارف تبلیغاتی بهره ببرید. بااین‌حال، فقط برخی از قسمت‌ها و جزئیات این هوش مصنوعی در دسترس عموم قرار گرفته پس بازسازی آن یا دسترسی به جزئیات سیستمی و فرآیند ساختش، غیرممکن شده است. در دسترس بودن مدل‌های هوش مصنوعی برای عموم، به دو شکل است که برخی از آنان، تا حد ممکن بسته بوده و فقط API خود را در دسترس قرار داده‌اند در حالی که برخی دیگر، تمامی اطلاعات خود را به صورت عمومی منتشر کرده‌اند. حال هوش مصنوعی QwQ-32B-Preview تقریباً بین این دو روش قرار می‌گیرد.

به تازگی، توجه به مدل‌های هوش مصنوعی که از منطق و استدلال استفاده می‌کند، بیشتر از پیش شده است. ظاهراً این مسئله در راستای تئوری ارائه قدرت پردازشی و اطلاعات بیشتر به هوش مصنوعی‌ها، باعث هوشمندتر و توانمندتر شدنشان می‌شود، رخ داده است. بااین‌حال، ‌می‌بینیم هوش مصنوعی‌های عظیم شرکت‌هایی همچون OpenAI، گوگل و Anthropic به نوعی ثابت مانده و آن سرعت پیشرفتی که در روزهای اول داشته‌اند را در حال حاضر از دست داده‌اند.

این مسئله باعث شده که شرکت‌ها به دنبال رویکردهای جدید معماری، توسعه و طراحی برای مدل‌های هوش منصوعی باشند که یکی از آنان تست محاسبه زمان نام دارد. در این رویکرد، به مدل‌ها زمان بیشتری برای پردازش درخواست‌های کاربر داده می‌شود، چیزی که در حال حاضر در QwQ-32B-Preview و o1 شاهدش هستیم.

به غیر از OpenAI و غول‌های چینی، شرکت‌های شناخته‌شده دیگری نیز در آینده به سراغ تست محاسبه زمان خواهند رفت. یکی از آنان، گوگل است که برطبق گزارشی از سوی The Information، این غول تکنولوژی تیمی حدود 200 نفر را برای کار بر روی مدل‌های هوش منصوعی با توانایی منطق و استدلال اختصاص داده است و قدرت پردازشی فراوانی را نیز در اختیارشان گذاشته تا مدلی قابل و توانا خلق کنند.

AMA