جنجال پیرامون هزینههای مدل R1 دیپ سیک، بازارها را به تکاپو انداخت؛ اما بهنظر میرسد نوعی فریبکاری صورت گرفته، زیرا ارقام واقعی بسیار تعجبآورتر از آنچه که در ابتدا تصور میشد، بودهاند.
کمپانی تحقیقاتی SemiAnalysis در تحلیلی جامع، روایت رایج درخصوص هزینههای توسعه مدل هوش مصنوعی DeepSeek را به چالش کشیده و این ادعا که مدل R1 این کمپانی بهقدری کارآمد توسعه یافته که دیگر نیازی به منابع محاسباتی NVIDIA و دیگر کمپانیها ندارد را زیر سوال برده است. پیش از پرداختن به جزئیات سختافزاری دیپسیک، مرور بر تصورات اولیه درخصوص این مدل ضروری بهنظر میرسد.
در ابتدا، گزارشهایی منتشر شد مبنیبر اینکه DeepSeek تنها با صرف هزینهای معادل ۵ میلیون دلار موفق به توسعه مدل R1 شده است؛ رقمی که تقریبا معادل هزینه توسعه مدل o1 کمپانی OpenAI بود. این ادعا موجب ایجاد شوک و نگرانی در بازار شد و حتی ریزش قابلتوجهی در شاخص سهام ایالات متحده بهدنبال داشت. اما اکنون که هیجانات اولیه فروکش کرده، زمان آن رسیده که با نگاهی واقعبینانهتر و براساس دادههای دقیقتر، به تحلیل و ارزیابی هزینههای واقعی دیپ سیک پرداخته شود.
برای افرادی که با جزئیات آشنا نیستند، گفته میشود که دیپسیک در ابتدا بهعنوان یک پروژه جانبی از کمپانی سرمایهگذاری چینی High-Flyer آغاز بهکار کرده است. براساس گزارش کمپانی SemiAnalysis، آنها در سال ۲۰۲۱، زمانی که محدودیتهای صادراتی چندان سختگیرانه نبود، ۱۰ هزار واحد از کارتهای گرافیک A100 کمپانی NVIDIA خریداری کردند. سپس DeepSeek به یک نهاد مستقل تبدیل شد چراکه کمپانی مادر، High-Flyer، تصمیم گرفت پروژه را از خود جدا کند و اینجا بود که فعالیتهای دیپسیک بهصورت جدی آغاز شد.
از آن زمان، این نهاد مستقل شروع به جمعآوری منابع محاسباتی کرد که در ادامه به بررسی آنها پرداخته خواهد شد. براساس این گزارش، DeepSeek به حدود ۱۰ هزار پردازنده گرافیکی H800 (نسخه مخصوص چین) و ۱۰ هزار پردازنده گرافیکی H100 انویدیا دسترسی دارد. علاوهبراین، این کمپانی روی شتابدهندههای H20 انویدیا نیز سرمایهگذاری کرده که بهصورت مشترک با High-Flyer برای فعالیتهای تجاری، استنتاجی، آموزشی و تحقیقاتی استفاده میشوند.
باتوجهبه این سرمایهگذاری کلان در سختافزار، هزینه سرمایهای (CapEx) DeepSeek حدود ۱.۶ میلیارد دلار و هزینههای عملیاتی آن نیز بهصورت غیررسمی ۹۴۴ میلیون دلار برآورد میشود. این ارقام نشان میدهند که هزینههای واقعی دیپ سیک بسیار بیشتر از آن چیزی است که در ابتدا تصور میشد.
برای شفافسازی، باید ذکر شود که رقم ۵ میلیون دلار تنها بهعنوان بخشی ویژه از کل هزینههای آموزش، نه تمام هزینههای توسعه مدل نهایی R1 اعلام شده است. یکی از نقاط قوت واقعی DeepSeek، توانایی آن در جذب استعدادهای برتر داخلی بود که با برگزاری رویدادهای استخدامی در دانشگاههای معتبر و ارائه حقوق و مزایای عالی، از جمله حقوق بالاتر از ۱.۳ میلیون دلار برای برخی از کارکنان کلیدی، محقق شد.
بیشک، تیم فنی دیپسیک که مدل R1 را توسعه دادهاند، از مهارت و دانش بالایی برخوردار بوده و قادر به ارائه راهحلهای کارآمد برای رقابت با غولهایی همچون OpenAI هستند. بااینحال، اشتباه در گزارش ارقام مالی و انتشار گسترده آن، نقش مهمی در ایجاد شوک و نگرانی در بازار و در نهایت وقوع رویداد قوی سیاه هفته گذشته داشت که به اتفاقات غیرمنتظره و بحرانهایی اشاره دارد که پیشبینی آنها ممکن نبود.