GPT-4 درحال حاضر به‌عنوان قدرتمندترین مدل هوش مصنوعی مولد شناخته می‌شود، براین اساس انتظار می‌رود نسل جدید مدل زبانی GPT-4.5 در سال جدید رونمایی شود.

پیشرفت سریع رقبای قدرتمند GPT-4 همچون Claude و Llama، شرکت OpenAI را ملزم‌به ارائه مدل جدیدی از سری GPT می‌کند. بسیاری از کاربران مشتاقانه منتظرند که OpenAI مدل جدید هوش مصنوعی‌اش را به نام GPT-5 را در سال‌جاری عرضه کند. اما بعضی از متخصصان می‌گویند که این اتفاق بعید است، چون ساخت این مدل خیلی سخت و پرهزینه است. با این تفاسیر احتمال انتشار نسل جدید مدل زبانی GPT-4.5 در سال‌جاری به‌مراتب بیشتر است.

مدل جدید هوش مصنوعی GPT-5، خیلی قوی‌تر از مدل قبلی آن یعنی GPT-4 است. ولی آموزش به کامپیوترهای خیلی قوی نیاز به تعداد 100 برابر کامپیوتر بیشتر از GPT-4 یا یک میلیون کامپیوتر خاص به نام H100 برای آموزش مدل GPT-5 است. با این تفاسیر انتشار این مدل در سال‌جاری امری بعید به‌نظر می‌رسد.

به گفته دن هندریکس، مدیر مرکز ایمنی هوش مصنوعی، هر بار که مدل زبانی بزرگ GPT شرکت OpenAI ارتقا می‌یابد، به 10 برابر منابع محاسباتی بیشتری نیاز دارد. اگر این شرکت مستقیماً از نسخه 4.5 به نسخه 5 مدل GPT برود، به 100 برابر منابع محاسباتی بیشتر از GPT-4 نیاز خواهد داشت. این ارقام معادل استفاده از حدود 1 میلیون تراشه H100 به مدت سه ماه متوالی است.

GPT-4.5

محققان OpenAI می‌گویند که این شرکت امسال یک مدل هوش مصنوعی شگفت‌انگیز را منتشر خواهد کرد، اما هنوز نام آن مشخص نیست. این نظریه توسط داریو آمودی، مدیرعامل شرکت آنتروپیک، تأیید می‌شود. او به‌تازگی اعلام کرده است که هزینه آموزش یک مدل زبانی بزرگ پیشرفته درحال حاضر حدود 1 میلیارد دلار است و پیش‌بینی می‌شود این هزینه تا سال 2025/26 به 5 تا 10 میلیارد دلار افزایش یابد. این موضوع با اظهارات پیشین این شرکت مبنی بر نیاز GPT-4.5 به 10 برابر منابع محاسباتی بیشتر از GPT-4 هم‌راستا است.

مصرف برق کارت‌های گرافیک شرکت انویدیا در سال‌جاری به‌طور قابل توجهی افزایش یافته است. پیش‌بینی می‌شود که مجموع مصرف این کارت‌ها در سال جاری با مصرف برق یک کشور کوچک مانند لیتوانی یا گواتمالا برابری کند. این روند افزایشی در مصرف برق، تا سال ۲۰۲۷ ادامه خواهد داشت و انتظار می‌رود به حدی برسد که بتواند نیاز برق ۸۵ تا ۱۳۴ کشور مشابه را تامین کند.

رقبای GPT-4 در حال پیشرفت قابل توجهی هستند. نمونه بارز آن مدل Llama 3 شرکت متا با 70 میلیارد پارامتر است که در حال حاضر رتبه پنجم را در جدول رده‌بندی Arena به خود اختصاص داده است. نکته حائز اهمیت این است که Llama 3 در حال حاضر عملکرد بهتری نسبت به سایر مدل‌های زبانی بزرگ ارائه می‌دهد و این در حالی است که مدل بعدی آن‌ با 405 میلیارد پارامتر هنوز منتشر نشده است.