گزارش‌ها نشان می‌دهد کمپانی بزرگ انویدیا به توسعه شتاب‌دهنده‌های هوش مصنوعی ادامه می‌دهد و اکنون با معرفی کارت گرافیک Hopper H200 با حافظه فوق‌سریع HBM3e توانست مرزهای پشتیبانی از قابلیت‌‌های هوش مصنوعی را جابه‌جا کند.

براساس اعلام رسمی انویدیا، کارت گرافیک Hopper H200 با پشتیبانی از حافظه قدرت‌مند و سریع HBM3e معرفی شد که می‌تواند قابلیت‌های هوش مصنوعی را برای توسعه این فناوری در سرورها بهبود بخشد. ازسوی‌دیگر، این کمپانی آمریکایی از سوپرتراشه‌های Grace Hopper برای ابر کامپیوتر Jupiter رونمایی کرد که می‌تواند تحول عظیمی را ایجاد کند؛ در ادامه به‌جزئیات بیشتری از این خبر می‌پردازیم و به‌صورت کامل توضیحاتی را درباره ویژگی‌های هوش مصنوعی این پردازنده‌ها می‌دهیم.

حافظه کارت گرافیک NVIDIA Hopper H200

همان‌طورکه می‌دانید کارت گرافیک NVIDIA H100 یکی از محبوب‌ترین و پرفروش‌ترین کارت‌های موجود در صنعت هوش مصنوعی محسوب می‌شود که توسط تیم سبزپوشان برای توسعه صنایع مختلف برای مشتریان ارائه می‌شود. باوجوداین، امروز پلتفرم HGX H200 معرفی شد که می‌تواند قدرت رایانشی و پردازشی هوش مصنوعی را با استفاده از کارت گرافیک H200 و هسته‌های Tensor به‌صورت غیرقابل‌تصوری بهبود بخشد. به‌عبارتی دقیق‌تر، این کارت گرافیک جدیدترین محصول انویدیا محسوب می‌شود که با بهینه‌سازی‌های سخت‌افزاری و نرم‌افزاری به‌همراه سریع‌ترین حافظه جهان یعنی HBM3e عملکرد غیرقابل‌تصوری را برای توسعه‌دهندگان و مهندسان به‌ارمغان بیاورد.

هما‌ن‌طورکه پیش‌تر گفتیم، کارت گرافیک NVIDIA Hopper H200 به حافظه فوق‌سریع HBM3e با ۱۴۱ گیگابایت ظرفیت حافظه و حداکثر ۴.۸ ترابایت پهنای باند مجهز است. درمقام مقایسه، این ظرفیت و پهنای باند تقریبا ۲.۵ برابر NVIDIA H100 محسوب می‌شود که نشان می‌دهد قابلیت‌ها و ویژگی‌های پردازشی برای توسعه هوش مصنوعی فوق‌العاده افزایش‌یافته و کمپانی‌های نیازمند به کارت‌های گرافیکی قدرت‌مند می‌توانند از آن بهره‌مند شوند. همچنین، H200 از مدل هوش مصنوعی زبان بزرگ Llama 2 با ۷۰ میلیارد پارامتر برخوردار می‌شود؛ پیشرفت‌های اخیر مجموعه TensorRT-LLM نیز می‌تواند باعث افزایش عملکرد طیف وسیعی از برنامه‌های مبتنی‌بر هوش مصنوعی شود.

کارت گرافیک NVIDIA Hopper H200

علاوه‌براین، در زمان معرفی گفته شد که کارت گرافیک NVIDIA Hopper H200 در طیف گسترد‌ه‌ای از سرورهای HGX H200 با کلاستربندی گرافیکی ۴ و ۸ طرفه دردسترس خواهد بود و هریک از آن برای مصارف مختلف در صنعت هوش مصنوعی مورد استفاده قرار می‌گیرد. برای‌مثال، کلاستر ۸ طرفه کارت گرافیک H200 در یک سرور HGX می‌تواند حداکثر ۳۲ پتافلاپ عملکرد رایانشی FP8 و ۱.۱ ترابایت ظرفیت حافظه را ارائه کند که فوق‌العاده خیره‌کننده در دنیای فناوری محسوب می‌شود.

ازسوی‌دیگر، این کارت گرافیک با سرورهای HGX H100 سازگار خواهد بود و به‌روزرسانی پلتفرم‌ها بسیار ساده و آسان خواهد بود. طبق اعلام رسمی انویدیا، شرکای تجاری این کمپانی مانند ASUS، ASRock Rack، Dell، Eviden، GIGABYTE، Hewlett Packard Enterprise، Ingrasys، Lenovo، QCT، Wiwynn، Supermicro و Wistron می‌تواند سه‌ماهه دوم سال ۲۰۲۴ میلادی به این کارت‌های گرافیکی دسترسی داشته باشند تا برای توسعه برنامه‌هایشان در زمینه هوش مصنوعی استفاده کنند.

پردازنده BullSequana XH3000

درکنار کارت گرافیک Hopper H200، سوپرتراشه Grace Hopper 200 را معرفی کرد که به‌عنوان یک پیروزی بزرگ برای توسعه ابر کامپیوترها محسوب می‌شود. چندی پیش ابر کامپیوتر به‌نام Jupiter در تاسیسات Forschungszentrum Jülich کشور آلمان به‌عنوان بخشی از شرکت EuroHPC در اتحادیه اروپا محسوب می‌شود. گزارش‌ها نشان می‌دهد این ابر رایانه برای علوم مواد، تحقیقات آب و هوا، کشف دارو و موارد دیگر مورد استفاده قرار خواهد گرفت؛ همچنین باید یادآور شویم این دومین ابر کامپیوتری محسوب می‌شود که کمپانی NVIDIA معرفی کرد و نسخه‌ای بهبودیافته از Isambard-AI بود که تا 21 اگزافلاپ عملکرد هوش مصنوعی را ارائه می‌کرد

ازنظر کلاستربندی، ابر کامپیوتر Jupiter از پردازنده BullSequana XH3000 با سیستم خنک‌کننده مایع بهره می‌برد. درمجموع، این سیستم از ۲۴۰۰۰ سوپرتراشه NVIDIA Grace Hopper 200 استفاده می‌کند که با فناوری Quantum-2 Infiniband به‌ یک‌دیگر متصل شده‌اند. باتوجه‌به اینکه هر سوپرتراشه Grace Hopper از ۲۸۸ هسته پردازشی Neoverse برخوردار است، می‌توان گفت ما با یک سیستم به‌همراه ۷ میلیون هسته ARM مواجه هستیم که می‌تواند هزاران پردازش را در حوزه هوش مصنوعی انجام دهد.

کارت گرافیک NVIDIA Hopper H200

معیارهای عملکرد این ابرکامپیوتر شامل ۹۰ اگزافلاپ آموزش هوش مصنوعی و یک اگزافلاپ با قدرت پردازشی بالا را پوشش می‌دهد و انتظار می‌رود از اوایل سال ۲۰۲۴ میلادی شروع به‌کار کند. درحال‌حاضر، اخبار گسترده‌تری از مجموعه کارت‌های گرافیک و سوپرتراشه انویدیا دردست نیست، اما به‌محض انتشار اخبار تازه‌تر درخصوص فعالیت ابرکامپیوتر Jupiter حتما آن را با شما در سریع‌ترین زمان ممکن به اشتراک خواهیم گذاشت تا شما نیز با عملکرد واقعی آن آشنا شوید.

NVIDIA TESLA GRAPHICS CARDNVIDIA H200 (SXM5)NVIDIA H100 (SMX5)NVIDIA H100 (PCIE)NVIDIA A100 (SXM4)NVIDIA A100 (PCIE4)TESLA V100S (PCIE)TESLA V100 (SXM2)TESLA P100 (SXM2)TESLA P100
(PCI-EXPRESS)
TESLA M40
(PCI-EXPRESS)
TESLA K40
(PCI-EXPRESS)
GPUGH200 (Hopper)GH100 (Hopper)GH100 (Hopper)GA100 (Ampere)GA100 (Ampere)GV100 (Volta)GV100 (Volta)GP100 (Pascal)GP100 (Pascal)GM200 (Maxwell)GK110 (Kepler)
Process Node4nm4nm4nm7nm7nm12nm12nm16nm16nm28nm28nm
Transistors80 Billion80 Billion80 Billion54.2 Billion54.2 Billion21.1 Billion21.1 Billion15.3 Billion15.3 Billion8 Billion7.1 Billion
GPU Die Size814mm2814mm2814mm2826mm2826mm2815mm2815mm2610 mm2610 mm2601 mm2551 mm2
SMs132132114108108808056562415
TPCs6666575454404028282415
L2 Cache Size51200 KB51200 KB51200 KB40960 KB40960 KB6144 KB6144 KB4096 KB4096 KB3072 KB1536 KB
FP32 CUDA Cores Per SM128128128646464646464128192
FP64 CUDA Cores / SM128128128323232323232464
FP32 CUDA Cores16896168961459269126912512051203584358430722880
FP64 CUDA Cores16896168961459234563456256025601792179296960
Tensor Cores528528456432432640640N/AN/AN/AN/A
Texture Units528528456432432320320224224192240
Boost Clock~1850 MHz~1850 MHz~1650 MHz1410 MHz1410 MHz1601 MHz1530 MHz1480 MHz1329MHz1114 MHz875 MHz
TOPs (DNN/AI)3958 TOPs3958 TOPs3200 TOPs2496 TOPs2496 TOPs130 TOPs125 TOPsN/AN/AN/AN/A
FP16 Compute1979 TFLOPs1979 TFLOPs1600 TFLOPs624 TFLOPs624 TFLOPs32.8 TFLOPs30.4 TFLOPs21.2 TFLOPs18.7 TFLOPsN/AN/A
FP32 Compute67 TFLOPs67 TFLOPs800 TFLOPs156 TFLOPs
(19.5 TFLOPs standard)
156 TFLOPs
(19.5 TFLOPs standard)
16.4 TFLOPs15.7 TFLOPs10.6 TFLOPs10.0 TFLOPs6.8 TFLOPs5.04 TFLOPs
FP64 Compute34 TFLOPs34 TFLOPs48 TFLOPs19.5 TFLOPs
(9.7 TFLOPs standard)
19.5 TFLOPs
(9.7 TFLOPs standard)
8.2 TFLOPs7.80 TFLOPs5.30 TFLOPs4.7 TFLOPs0.2 TFLOPs1.68 TFLOPs
Memory Interface5120-bit HBM3e5120-bit HBM35120-bit HBM2e6144-bit HBM2e6144-bit HBM2e4096-bit HBM24096-bit HBM24096-bit HBM24096-bit HBM2384-bit GDDR5384-bit GDDR5

اخبار مرتبط: