ابر رایانه های انویدیا در آخرین لیست 500 ابررایانه برتر سال 2023 در جایگاه دهم قرار گرفت.
در حال حاضر براساس آخرین نتایج بنچمارک Linpack که نوامبر2023 منتشر گردید، ابر رایانه NVIDIA EOS در جایگاه نهم لیست 500 ابررایانه برتر جهان قرار گرفت. امروز شرکت انویدیا اطلاعات بیشتری در مورد ابررایانهی جدید خود که در لیست ۵۰۰ ابررایانهی قدرتمند جهان حضور دارد، منتشر کرد. نکتهی جالب این است که این ابررایانه با نام EOS، بر خلاف نسلهای قبلی خود فقط روی افزایش دقت محاسبات (Double Precision) برای کارهای مبتنی بر هوش مصنوعی تمرکز نکرده است. با این حال، EOS در تست بنچمارک مخصوص محاسبات دقت بالا (Linpack) توانسته به امتیاز 9 دست پیدا کند. این یک دستاورد بزرگ برای بزرگترین طراح تراشه های هوش مصنوعی جهان(NVIDIA)محسوب میشود. به علاوه، نشان دهنده قابلیت های ویژه ابررایانه EOS در زمینه این فناوری نوظهور است.
ابررایانه EOS در مجموع از 576 سرور NVIDIA DGX H100 و شبکه پرسرعت Quantum-2 400Gb تشکیل می شود. کل پردازنده های گرافیکی این سوپرکامپیوتر به 4608 عدد می رسد. مشتریان برای خرید این تعداد پردازنده باید مبلغی حدود 200 میلیون دلار پرداخت کنند.
این ابررایانه در تست بنچمارک Linpack با دقت مضاعف، به رکورد 121.4 پتافلاپس بر ثانیه دست یافته است. علاوه براین، EOS قادر به انجام 18.4 اگزافلاپس محاسبات هوش مصنوعی با دقت FP8 نیز می باشد. غول آمریکایی برای ساخت ابررایانه EOS از معماری SuperPOD استفاده کرده است. این معماری به آنها اجازه میدهد تا EOS را به صورت بلوکهای مجزا بسازد و سپس این بلوکها را به توپولوژیهای بزرگتر متصل کنند. NVIDIA میتواند ابررایانههای خود را تا 4608 شتابدهنده (و حتی بیشتر) ارتقا دهد اما رقبای این شرکت، قادر به ارتقای ابررایانههای خود تا این تعداد شتابدهنده نیستند. همانطور که در تصاویر می بینید این شرکت در هر رک از چهار سیستم با حداکثر 32 کیلووات برق استفاده کرده است.
در تصویر بالا، میتوانید لولههای خنککننده مایع را در قفسهای که در پشت فردی که روی گاری KVM ایستاده قرار دارد، مشاهده می کنید. انجام محاسبات سنگین در ابررایانه EOS باعث تولید گرمای زیادی در آن میشود. لولههای خنککننده مایع با انتقال این گرما از بخش های مختلف، از گرم شدن بیش از حد آنها و بروز نقص جلوگیری میکنند.
نحوه کار سیستم های خنک کننده
• مایع خنککننده از طریق لولهها به سمت پردازندهها و سایر اجزای گرم هدایت میشود.
• مایع خنک کننده گرما را از این سخت افزارها جذب میکند.
• مایع گرم شده به رادیاتور منتقل میشود.
• در رادیاتور، گرما از مایع به هوای محیط منتقل میشود.
• مایع خنک شده دوباره به سمت پردازندهها و سایر اجزا هدایت میشود.
به همین علت سرورهای نسل بعدی هوش مصنوعی، به دلیل مزایای خنککننده مایع نسبت به خنککننده های هوا بیشتر به این فناوری مجهز خواهند شد. سه ویژگی مهم خنک کننده های مایع عبارتند از:
• بهرهوری انرژی بیشتر: خنک کننده مایع میتواند گرمای بیشتری را نسبت به خنک کننده های هوا جذب و به روش بهتری آن را از اجزای سرور دور کند. این کار به کاهش مصرف انرژی و افزایش کارایی سرور کمک زیادی میکند.
• عملکرد بهتر: خنککننده مایع میتواند اجزا را در دمای پایینتر نگه دارد. این ویژگی به افزایش سرعت پردازش و پایداری سرور کمک میکند.
• چگالی بیشتر: خنککننده مایع به سرور اجازه میدهد تا در فضایی کوچکتر، تعداد پردازنده های بیشتری را در خود جای دهد.
مراکز داده اگر قصد دارند پیاده سازی سرورهای هوش مصنوعی را دارند، باید به خنک کننده های مایع هم فکر کنند. NVIDIA این خدمات را به همراه سوپرکامپیوتر EOS ارائه می دهد. در مجموع ابررایانه NVIDIA EOS یکی از گزینه هایی هستند که دیتاسنترها می تواند از آن برای اهداف توسعه داخلی خود استفاده کند. یکی دیگر از تفاوت های اصلی سوپرکامپیوترهای انویدیا نسبت به رقبای دیگر، استفاده از کلاستربندی یا خوشه بندی در مقیاس بزرگ است.