جنجال پیرامون هزینه‌های مدل R1 دیپ‌ سیک، بازارها را به تکاپو انداخت؛ اما به‌نظر می‌رسد نوعی فریبکاری صورت گرفته، زیرا ارقام واقعی بسیار تعجب‌آورتر از آنچه که در ابتدا تصور می‌شد، بوده‌اند.

کمپانی تحقیقاتی SemiAnalysis در تحلیلی جامع، روایت رایج درخصوص هزینه‌های توسعه مدل هوش مصنوعی DeepSeek را به چالش کشیده و این ادعا که مدل R1 این کمپانی به‌قدری کارآمد توسعه یافته که دیگر نیازی به منابع محاسباتی NVIDIA و دیگر کمپانی‌ها ندارد را زیر سوال برده است. پیش از پرداختن به جزئیات سخت‌افزاری دیپ‌سیک، مرور بر تصورات اولیه درخصوص این مدل ضروری به‌نظر می‌رسد.

در ابتدا، گزارش‌هایی منتشر شد مبنی‌بر این‌که DeepSeek تنها با صرف هزینه‌ای معادل ۵ میلیون دلار موفق به توسعه مدل R1 شده است؛ رقمی که تقریبا معادل هزینه توسعه مدل o1 کمپانی OpenAI بود. این ادعا موجب ایجاد شوک و نگرانی در بازار شد و حتی ریزش قابل‌توجهی در شاخص سهام ایالات متحده به‌دنبال داشت. اما اکنون که هیجانات اولیه فروکش کرده، زمان آن رسیده که با نگاهی واقع‌بینانه‌تر و براساس داده‌های دقیق‌تر، به تحلیل و ارزیابی هزینه‌های واقعی دیپ سیک پرداخته شود.

برای افرادی که با جزئیات آشنا نیستند، گفته می‌شود که دیپ‌سیک در ابتدا به‌عنوان یک پروژه جانبی از کمپانی سرمایه‌گذاری چینی High-Flyer آغاز به‌کار کرده است. براساس گزارش کمپانی SemiAnalysis، آن‌ها در سال ۲۰۲۱، زمانی که محدودیت‌های صادراتی چندان سخت‌گیرانه نبود، ۱۰ هزار واحد از کارت‌های گرافیک A100 کمپانی NVIDIA خریداری کردند. سپس DeepSeek به یک نهاد مستقل تبدیل شد چراکه کمپانی مادر، High-Flyer، تصمیم گرفت پروژه را از خود جدا کند و اینجا بود که فعالیت‌های دیپ‌سیک به‌صورت جدی آغاز شد.

هزینه‌های واقعی دیپ سیک

از آن زمان، این نهاد مستقل شروع به جمع‌آوری منابع محاسباتی کرد که در ادامه به بررسی آن‌ها پرداخته خواهد شد. براساس این گزارش، DeepSeek به حدود ۱۰ هزار پردازنده گرافیکی H800 (نسخه مخصوص چین) و ۱۰ هزار پردازنده گرافیکی H100 انویدیا دسترسی دارد. علاوه‌براین، این کمپانی روی شتاب‌دهنده‌های H20 انویدیا نیز سرمایه‌گذاری کرده که به‌صورت مشترک با High-Flyer برای فعالیت‌های تجاری، استنتاجی، آموزشی و تحقیقاتی استفاده می‌شوند.

باتوجه‌به این سرمایه‌گذاری کلان در سخت‌افزار، هزینه سرمایه‌ای (CapEx) DeepSeek حدود ۱.۶ میلیارد دلار و هزینه‌های عملیاتی آن نیز به‌صورت غیررسمی ۹۴۴ میلیون دلار برآورد می‌شود. این ارقام نشان می‌دهند که هزینه‌های واقعی دیپ سیک بسیار بیشتر از آن چیزی است که در ابتدا تصور می‌شد.

برای شفاف‌سازی، باید ذکر شود که رقم ۵ میلیون دلار تنها به‌عنوان بخشی ویژه از کل هزینه‌های آموزش، نه تمام هزینه‌های توسعه مدل نهایی R1 اعلام شده است. یکی از نقاط قوت واقعی DeepSeek، توانایی آن در جذب استعدادهای برتر داخلی بود که با برگزاری رویدادهای استخدامی در دانشگاه‌های معتبر و ارائه حقوق و مزایای عالی، از جمله حقوق بالاتر از ۱.۳ میلیون دلار برای برخی از کارکنان کلیدی، محقق شد.

بی‌شک، تیم فنی دیپ‌سیک که مدل R1 را توسعه داده‌اند، از مهارت و دانش بالایی برخوردار بوده و قادر به ارائه راه‌حل‌های کارآمد برای رقابت با غول‌هایی همچون OpenAI هستند. بااین‌حال، اشتباه در گزارش ارقام مالی و انتشار گسترده آن، نقش مهمی در ایجاد شوک و نگرانی در بازار و در نهایت وقوع رویداد قوی سیاه هفته گذشته داشت که به اتفاقات غیرمنتظره و بحران‌هایی اشاره دارد که پیش‌بینی آن‌ها ممکن نبود.

AMA