بهتازگی شاهد رونمایی از هوش مصنوعی علیبابا بهنام QwQ-32B-Preview بودیم که قرار است مدل o1 شرکت OpenAI را به چالش بکشد.
این هوش مصنوعی که توسط تیم Qwen شرکت علیبابا توسعه یافته، شامل 32.5 میلیارد پارامتر بوده و میتواند پیامهایی تا 32 هزار کلمه نیز به نمایش دربیاورد. عملکرد آن بنچمارکهای مختلف از o1-preview و o1-mini شرکت OpenAI بهتر بوده و تبدیل به رقیبی قدر برای این کمپانی معروف شده است.
تا پارامترهای یک هوش مصنوعی بیشتر باشد، تاثیر نسبتاً بیشتری بر روی قابلیتها و مهارتهای حل مسئله آن خواهد گذاشت. متاسفانه شرکت OpenAI جزئیاتی از پارامترهای مدل o1 خود عنوان نکرده و بههمین دلیل، بهصورت دقیق نمیتوانیم این دو هوش مصنوعی را از این لحاظ با یکدیگر مقایسه کنیم.
هوش مصنوعی علیبابا در تستهای AIME و MATH که توسط خود علیبابا برگزار شد، از مدل o1-preview شرکت OpenAI پیشی گرفت. بنچمارک AIME از مدلهای هوش مصنوعی دیگر استفاده میکند و با مقایسه آنان، نمرهای به عملکرد هوش مصنوعی در دست بررسی میدهد. از طرف دیگر، بنچمارک MATH نیز هوش مصنوعی را مجموعهای مسائل روبرو میکند تا سرعت و دقت آن در حل این مسائل را شناسایی کند.
به لطف قابلیتهای تحلیلی که در هوش مصنوعی QwQ-32B-Preview گنجانده شده، این مدل قابلیت حل پازلهای منطقی و سوالات سخت و سنگین ریاضی را دارد. بااینحال، این مدل هنوز فاصله زیادی تا بهترین و کاملترین شدن دارد. بر اساس گزارش شرکت علیبابا، مشکلات این مدل شامل عوضکردن ناگهانی و ناخواسته زبان، تکرار برخی نوشتهها و عملکرد نامناسب در برخی تسکهاست که نیاز به تفکر منطقی و استدلال دارد.


برخلاف بیشتر مدلهای هوش مصنوعی فعلی، مدل QwQ-32B-Preview و سایر مدلهایی که از دلیل و منطق استفاده میکنند، بهطور مرتب اطلاعات خود را چک میکنند تا چیزی درست، دقیق و بروز ارائه دهند. به لطف این قابلیتها، این مدل هوش مصنوعی درگیر مشکلات سایر هوش مصنوعیها نخواهد شد اما از طرف دیگر، پاسخهایش را نیز دیرتر از سایر مدلها ارائه خواهد کرد.
عملکرد هوش مصنوعی علیبابا مشابه o1 شرکت OpenAI است و از طریق بررسی تسکها، برنامهریزی و در نهایت انجام مجموعهای از اعمال، به جواب موردنظرش در پاسخ به درخواست کاربر میرسد. درحالحاضر، میتوانید هوش مصنوعی QwQ-32B-Preview را از طریق وبسایت Hugging Face دانلود و استفاده کنید. جالب است بدانید که این مدل، شباهتهایی به هوش مصنوعی DeepSeek نیز داشته و به شکلی ماهرانه، از پاسخ به برخی سوالات سیاسی، اجتناب میکند.
باتوجه به این که هردو شرکت DeepSeek و علیبابا چینی هستند و به شدت نیز تحت نظارت سازمانهای رگولاتوری این کشور قرار گرفتهاند، طبیعی است که محدودیتهایی در این زمینه برای هوش مصنوعی خود اعمال کرده باشند. بسیاری از هوش مصنوعیهای چینی، از پاسخ به سوالات سیاسی و مسائلی پیرامون رژیمهای خاص در تاریخ چین، اجتناب میورزند زیرا در صورت پاسخ به این سوال، مشکلاتی با رگولاتوریها برایشان پیش میآید.
جالب است بدانید که از QwQ-32B-Preview سوال شد که آیا تایوان بخشی از کشور چین است؟ این هوش مصنوعی پاسخی عجیب ارائه کرده و این مسئله را تایید کرد. این موضوع، فقط توسط دولت چین تایید میشود و سایر کشورهای دنیا، تایوان را بهعنوان یک کشور مستقل قبول دارند. از طرف دیگر، سوالاتی در مورد میدان تیانمان نیز از این هوش مصنوعی پرسیده شد که در کمال تعجب، هیچ جواب خاصی در این مورد ارائه نداد.


درحالحاضر، مدل QwQ-32B-Preview به صورت عمومی و تحت لیسانس Apache 2.0 در دسترس است پس میتوانید از آن برای مصارف تبلیغاتی بهره ببرید. بااینحال، فقط برخی از قسمتها و جزئیات این هوش مصنوعی در دسترس عموم قرار گرفته پس بازسازی آن یا دسترسی به جزئیات سیستمی و فرآیند ساختش، غیرممکن شده است. در دسترس بودن مدلهای هوش مصنوعی برای عموم، به دو شکل است که برخی از آنان، تا حد ممکن بسته بوده و فقط API خود را در دسترس قرار دادهاند در حالی که برخی دیگر، تمامی اطلاعات خود را به صورت عمومی منتشر کردهاند. حال هوش مصنوعی QwQ-32B-Preview تقریباً بین این دو روش قرار میگیرد.
به تازگی، توجه به مدلهای هوش مصنوعی که از منطق و استدلال استفاده میکند، بیشتر از پیش شده است. ظاهراً این مسئله در راستای تئوری ارائه قدرت پردازشی و اطلاعات بیشتر به هوش مصنوعیها، باعث هوشمندتر و توانمندتر شدنشان میشود، رخ داده است. بااینحال، میبینیم هوش مصنوعیهای عظیم شرکتهایی همچون OpenAI، گوگل و Anthropic به نوعی ثابت مانده و آن سرعت پیشرفتی که در روزهای اول داشتهاند را در حال حاضر از دست دادهاند.
این مسئله باعث شده که شرکتها به دنبال رویکردهای جدید معماری، توسعه و طراحی برای مدلهای هوش منصوعی باشند که یکی از آنان تست محاسبه زمان نام دارد. در این رویکرد، به مدلها زمان بیشتری برای پردازش درخواستهای کاربر داده میشود، چیزی که در حال حاضر در QwQ-32B-Preview و o1 شاهدش هستیم.
به غیر از OpenAI و غولهای چینی، شرکتهای شناختهشده دیگری نیز در آینده به سراغ تست محاسبه زمان خواهند رفت. یکی از آنان، گوگل است که برطبق گزارشی از سوی The Information، این غول تکنولوژی تیمی حدود 200 نفر را برای کار بر روی مدلهای هوش منصوعی با توانایی منطق و استدلال اختصاص داده است و قدرت پردازشی فراوانی را نیز در اختیارشان گذاشته تا مدلی قابل و توانا خلق کنند.

