GPT-4 درحال حاضر بهعنوان قدرتمندترین مدل هوش مصنوعی مولد شناخته میشود، براین اساس انتظار میرود نسل جدید مدل زبانی GPT-4.5 در سال جدید رونمایی شود.
پیشرفت سریع رقبای قدرتمند GPT-4 همچون Claude و Llama، شرکت OpenAI را ملزمبه ارائه مدل جدیدی از سری GPT میکند. بسیاری از کاربران مشتاقانه منتظرند که OpenAI مدل جدید هوش مصنوعیاش را به نام GPT-5 را در سالجاری عرضه کند. اما بعضی از متخصصان میگویند که این اتفاق بعید است، چون ساخت این مدل خیلی سخت و پرهزینه است. با این تفاسیر احتمال انتشار نسل جدید مدل زبانی GPT-4.5 در سالجاری بهمراتب بیشتر است.
مدل جدید هوش مصنوعی GPT-5، خیلی قویتر از مدل قبلی آن یعنی GPT-4 است. ولی آموزش به کامپیوترهای خیلی قوی نیاز به تعداد 100 برابر کامپیوتر بیشتر از GPT-4 یا یک میلیون کامپیوتر خاص به نام H100 برای آموزش مدل GPT-5 است. با این تفاسیر انتشار این مدل در سالجاری امری بعید بهنظر میرسد.
به گفته دن هندریکس، مدیر مرکز ایمنی هوش مصنوعی، هر بار که مدل زبانی بزرگ GPT شرکت OpenAI ارتقا مییابد، به 10 برابر منابع محاسباتی بیشتری نیاز دارد. اگر این شرکت مستقیماً از نسخه 4.5 به نسخه 5 مدل GPT برود، به 100 برابر منابع محاسباتی بیشتر از GPT-4 نیاز خواهد داشت. این ارقام معادل استفاده از حدود 1 میلیون تراشه H100 به مدت سه ماه متوالی است.
محققان OpenAI میگویند که این شرکت امسال یک مدل هوش مصنوعی شگفتانگیز را منتشر خواهد کرد، اما هنوز نام آن مشخص نیست. این نظریه توسط داریو آمودی، مدیرعامل شرکت آنتروپیک، تأیید میشود. او بهتازگی اعلام کرده است که هزینه آموزش یک مدل زبانی بزرگ پیشرفته درحال حاضر حدود 1 میلیارد دلار است و پیشبینی میشود این هزینه تا سال 2025/26 به 5 تا 10 میلیارد دلار افزایش یابد. این موضوع با اظهارات پیشین این شرکت مبنی بر نیاز GPT-4.5 به 10 برابر منابع محاسباتی بیشتر از GPT-4 همراستا است.
مصرف برق کارتهای گرافیک شرکت انویدیا در سالجاری بهطور قابل توجهی افزایش یافته است. پیشبینی میشود که مجموع مصرف این کارتها در سال جاری با مصرف برق یک کشور کوچک مانند لیتوانی یا گواتمالا برابری کند. این روند افزایشی در مصرف برق، تا سال ۲۰۲۷ ادامه خواهد داشت و انتظار میرود به حدی برسد که بتواند نیاز برق ۸۵ تا ۱۳۴ کشور مشابه را تامین کند.
رقبای GPT-4 در حال پیشرفت قابل توجهی هستند. نمونه بارز آن مدل Llama 3 شرکت متا با 70 میلیارد پارامتر است که در حال حاضر رتبه پنجم را در جدول ردهبندی Arena به خود اختصاص داده است. نکته حائز اهمیت این است که Llama 3 در حال حاضر عملکرد بهتری نسبت به سایر مدلهای زبانی بزرگ ارائه میدهد و این در حالی است که مدل بعدی آن با 405 میلیارد پارامتر هنوز منتشر نشده است.