ابررایانه EOS انویدیا، در لیست 10 ابر رایانه قدرتمند جهان!

تحریریه کامپیوتر و شبکه 28 بهمن 1402 بازدید: 21

ابر رایانه های انویدیا در آخرین لیست 500 ابررایانه برتر سال 2023 در جایگاه دهم قرار گرفت.

ابراراینه انویدیا

در حال حاضر براساس آخرین نتایج بنچمارک Linpack که نوامبر2023 منتشر گردید، ابر رایانه NVIDIA EOS در جایگاه نهم لیست 500 ابررایانه‌ برتر جهان قرار گرفت. امروز شرکت انویدیا اطلاعات بیشتری در مورد ابررایانه‌ی جدید خود که در لیست ۵۰۰ ابررایانه‌ی قدرتمند جهان حضور دارد، منتشر کرد. نکته‌ی جالب این است که این ابررایانه با نام EOS، بر خلاف نسل‌های قبلی خود فقط روی افزایش دقت محاسبات (Double Precision) برای کارهای مبتنی بر هوش مصنوعی تمرکز نکرده است. با این حال، EOS در تست بنچمارک مخصوص محاسبات دقت بالا (Linpack) توانسته به امتیاز 9 دست پیدا کند. این یک دستاورد بزرگ برای بزرگترین طراح تراشه های هوش مصنوعی جهان(NVIDIA)محسوب می‌شود. به علاوه، نشان دهنده قابلیت های ویژه ابررایانه EOS در زمینه این فناوری نوظهور است.

ابررایانه EOS در مجموع از 576 سرور NVIDIA DGX H100 و شبکه پرسرعت Quantum-2 400Gb تشکیل می شود. کل پردازنده های گرافیکی این سوپرکامپیوتر به 4608 عدد می رسد. مشتریان برای خرید این تعداد پردازنده باید مبلغی حدود 200 میلیون دلار پرداخت کنند.

ابررایانه انویدیا شتاب انتقال داده

این ابررایانه در تست بنچمارک Linpack با دقت مضاعف، به رکورد 121.4 پتافلاپس بر ثانیه دست یافته است. علاوه براین، EOS قادر به انجام 18.4 اگزافلاپس محاسبات هوش مصنوعی با دقت FP8 نیز می باشد. غول آمریکایی برای ساخت ابررایانه EOS از معماری SuperPOD استفاده کرده است. این معماری به آنها اجازه می‌دهد تا EOS را به صورت بلوک‌های مجزا بسازد و سپس این بلوک‌ها را به توپولوژی‌های بزرگ‌تر متصل کنند. NVIDIA می‌تواند ابررایانه‌های خود را تا 4608 شتاب‌دهنده (و حتی بیشتر) ارتقا دهد اما رقبای این شرکت، قادر به ارتقای ابررایانه‌های خود تا این تعداد شتاب‌دهنده نیستند. همانطور که در تصاویر می بینید این شرکت در هر رک از چهار سیستم با حداکثر 32 کیلووات برق استفاده کرده است.

انویدیا ابررایانه EOS گاری

در تصویر بالا، می‌توانید لوله‌های خنک‌کننده مایع را در قفسه‌ای که در پشت فردی که روی گاری KVM ایستاده قرار دارد، مشاهده می کنید. انجام محاسبات سنگین در ابررایانه EOS باعث تولید گرمای زیادی در آن می‌شود. لوله‌های خنک‌کننده مایع با انتقال این گرما از بخش های مختلف، از گرم شدن بیش از حد آنها و بروز نقص جلوگیری می‌کنند.

نحوه کار سیستم های خنک کننده

• مایع خنک‌کننده از طریق لوله‌ها به سمت پردازنده‌ها و سایر اجزای گرم هدایت می‌شود.
• مایع خنک کننده گرما را از این سخت افزارها جذب می‌کند.
• مایع گرم شده به رادیاتور منتقل می‌شود.
• در رادیاتور، گرما از مایع به هوای محیط منتقل می‌شود.
• مایع خنک شده دوباره به سمت پردازنده‌ها و سایر اجزا هدایت می‌شود.

ابرراینه انویدیا نمای سرورها

به همین علت سرورهای نسل بعدی هوش مصنوعی، به دلیل مزایای خنک‌کننده مایع نسبت به خنک‌کننده های هوا بیشتر به این فناوری مجهز خواهند شد. سه ویژگی مهم خنک کننده های مایع عبارتند از:

• بهره‌وری انرژی بیشتر: خنک کننده مایع می‌تواند گرمای بیشتری را نسبت به خنک کننده های هوا جذب و به روش بهتری آن را از اجزای سرور دور کند. این کار به کاهش مصرف انرژی و افزایش کارایی سرور کمک زیادی می‌کند.
• عملکرد بهتر: خنک‌کننده مایع می‌تواند اجزا را در دمای پایین‌تر نگه دارد. این ویژگی به افزایش سرعت پردازش و پایداری سرور کمک می‌کند.
• چگالی بیشتر: خنک‌کننده مایع به سرور اجازه می‌دهد تا در فضایی کوچکتر، تعداد پردازنده های بیشتری را در خود جای دهد.

مراکز داده اگر قصد دارند پیاده سازی سرورهای هوش مصنوعی را دارند، باید به خنک کننده های مایع هم فکر کنند. NVIDIA این خدمات را به همراه سوپرکامپیوتر EOS ارائه می دهد. در مجموع ابررایانه NVIDIA EOS یکی از گزینه هایی هستند که دیتاسنترها می تواند از آن برای اهداف توسعه داخلی خود استفاده کند. یکی دیگر از تفاوت های اصلی سوپرکامپیوترهای انویدیا نسبت به رقبای دیگر، استفاده از کلاستربندی یا خوشه بندی در مقیاس بزرگ است.