منابع خبری میگوید مدل جدید هوش مصنوعی دیپسیک R2 با استفاده از پردازندههای بومی هواوی حدود ۹۷ هزینه کمتری برای آموزش درمقایسهبا
گزارشها از منابع رسانهای چینی حاکی از آناستکه شرکت دیپسیک در آستانه معرفی مدل هوش مصنوعی جدید تحتعنوان DeepSeek R2 قرار دارد. خبر یادشده پس از موفقیت مدل پیشین این شرکت، R1، منتشر میشود؛ مدلی که توانمندی چین در توسعه هوش مصنوعی پیشرفته را بهنمایش گذاشت و نشان داد که دستیابی به این فناوری لزوما با هزینههای گزافی که پیشتر تصور میشد، همراه نیست. عرضه R1 تاثیر چشمگیری روی بازارهای غربی داشت و اکنون انتظار میرود R2 نیز بتواند تحول غیرمنتظره دیگری را رقم بزند.


باید خاطرنشان کنیم که جزئیات منتشرشده پیرامون R2 فعلا درحد شایعه بوده و توسط دیپسیک بهصورت رسمی تایید نشدهاند. بااینحال، شایعات به مشخصات فنی چشمگیری اشاره دارند و گفته میشود R2 از یک معماری پیشرفته و ترکیبی مبتنیبر MoE بهره خواهد برد که احتمالا با مکانیزمهای کنترلی پیشرفته یا ترکیبی از لایههای MoE و متراکم برای بهینهسازی عملکرد در پردازشهای سنگین همراه است.
ازنظر مقیاس، انتظار میرود R2 از ۱.۲ تریلیون پارامتر بهره میبرد که دو برابر مدل R1 است و آنرا در رده مدلهای تراز اول جهان مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل قرار میدهد. وجه تمایز اصلی دیپسیک R2، بهرهوری هزینه فوقالعاده آن پیشبینی میشود و ادعا میشود که هزینه پردازش توکن در این مدل تا ۹۷.۴ درصد کمتر از GPT-4 خواهد بود که معادل ۰.۰۷ دلار بهازایهر میلیون توکن ورودی و ۰.۲۷ دلار بهازایهر میلیون توکن خروجی میشود. کاهش چشمگیر هزینه میتواند R2 را بهگزینهای بسیار جذاب برای شرکتها و سازمانها تبدیل کرده و تاثیری تعیینکننده روی اقتصاد هوش مصنوعی بگذارد.
علاوهبراین، گزارشها حاکی از اتکای دیپسیک به منابع داخلی است. گفته میشود R2 روی خوشه تراشههای Ascend 910B هوآوی آموزش داده شده و به بهرهوری ۸۲ درصدی از توان محاسباتی ۵۱۲ پتافلاپسی با دقت FP16 این سختافزار دست یافته است. این امر نشاندهنده یکپارچهسازی عمودی زنجیره تأمین هوش مصنوعی توسط دیپسیک با همکاری هوآوی است.

