مدل دیپ‌سیک R2 با ۹۷ درصد هزینه کمتر از GPT-4 معرفی می‌شود

منابع خبری می‌گوید مدل جدید هوش مصنوعی دیپ‌سیک R2 با استفاده از پردازنده‌های بومی هواوی حدود ۹۷ هزینه کمتری برای آموزش درمقایسه‌با

گزارش‌ها از منابع رسانه‌ای چینی حاکی از آن‌است‌که شرکت دیپ‌سیک در آستانه معرفی مدل هوش مصنوعی جدید تحت‌عنوان DeepSeek R2 قرار دارد. خبر یادشده پس از موفقیت مدل پیشین این شرکت، R1، منتشر می‌شود؛ مدلی که توانمندی چین در توسعه هوش مصنوعی پیشرفته را به‌نمایش گذاشت و نشان داد که دستیابی به این فناوری لزوما با هزینه‌های گزافی که پیشتر تصور می‌شد، همراه نیست. عرضه R1 تاثیر چشم‌گیری روی بازارهای غربی داشت و اکنون انتظار می‌رود R2 نیز بتواند تحول غیرمنتظره دیگری را رقم بزند.

باید خاطرنشان کنیم که جزئیات منتشرشده پیرامون R2 فعلا درحد شایعه بوده و توسط دیپ‌سیک به‌صورت رسمی تایید نشده‌اند. بااین‌حال، شایعات به مشخصات فنی چشم‌گیری اشاره دارند و گفته می‌شود R2 از یک معماری پیشرفته و ترکیبی مبتنی‌بر MoE بهره خواهد برد که احتمالا با مکانیزم‌های کنترلی پیشرفته یا ترکیبی از لایه‌های MoE و متراکم برای بهینه‌سازی عملکرد در پردازش‌های سنگین همراه است.

ازنظر مقیاس، انتظار می‌رود R2 از ۱.۲ تریلیون پارامتر بهره می‌برد که دو برابر مدل R1 است و آن‌را در رده مدل‌های تراز اول جهان مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل قرار می‌دهد. وجه تمایز اصلی دیپ‌سیک R2، بهره‌وری هزینه فوق‌العاده آن پیش‌بینی می‌شود و ادعا می‌شود که هزینه پردازش توکن در این مدل تا ۹۷.۴ درصد کمتر از GPT-4 خواهد بود که معادل ۰.۰۷ دلار به‌ازای‌هر میلیون توکن ورودی و ۰.۲۷ دلار به‌ازای‌هر میلیون توکن خروجی می‌شود. کاهش چشم‌گیر هزینه می‌تواند R2 را به‌گزینه‌ای بسیار جذاب برای شرکت‌ها و سازمان‌ها تبدیل کرده و تاثیری تعیین‌کننده روی اقتصاد هوش مصنوعی بگذارد.

علاوه‌براین، گزارش‌ها حاکی از اتکای دیپ‌سیک به منابع داخلی است. گفته می‌شود R2 روی خوشه تراشه‌های Ascend 910B هوآوی آموزش داده شده و به بهره‌وری ۸۲ درصدی از توان محاسباتی ۵۱۲ پتافلاپسی با دقت FP16 این سخت‌افزار دست یافته است. این امر نشان‌دهنده یکپارچه‌سازی عمودی زنجیره تأمین هوش مصنوعی توسط دیپ‌سیک با همکاری هوآوی است.