تراشه D1 Dojo تسلا، برای آموزش هوش مصنوعی

تسلا تراشه D1 Dojo که بیش از ۵۰ میلیارد ترانزیستور در خود جا داده است را برای تعلیم هوش مصنوعی معرفی کرد.

یکی از جنبه های تکنولوژی روز دنیا هوش مصنوعی (AI) میباشد که طی دو سال گذشته استقبال گسترده ای داشته است. همانطور که بسیاری می دانند تسلا شرکتی است که بر روی وسایل نقلیه برقی و خودران کار می کند،و هوش مصنوعی برای همه جنبه های کار این شرکت ارزش زیادی دارد. به منظور افزایش بار کاری نرم‌افزارهای مرتبط با AI، تسلا از تراشه D1 Dojo برای تعلیم هوش مصنوعی رونمایی کرده است.
در حال حاضر شرکت های زیادی در حال استفاده از تراشه ASIC برای حجم کاری هوش مصنوعی AI هستند، از استارتاپ‌های کوچک گرفته تا شرکت‌های عظیمی همچون آمازون، بایدو، اینتل و انویدیا. اما شاید تعداد اندکی از این شرکت‌ها در نهایت موفق شوند روش مناسبی برای هر کاربرد پیاده‌سازی کنند. به همین دلیل است که تسلا تصمیم گرفت ASIC خود را برای اهداف آموزشی هوش مصنوعی AI توسعه دهد.
این تراشه که D1 نامیده می شود، شبیه بخشی از ابر رایانه Dojo است که برای آموزش مدل های هوش مصنوعی در دفتر مرکزی تسلا استفاده می شود و بعداً در برنامه های مختلف نیز استفاده می شود. تراشه D1 محصول تلاشهای تولید TSMC است که در یک گره نیمه هادی 7 نانومتری ساخته شده است. این تراشه با دارا بودن بیش از 50 میلیارد ترانزیستور، دارای اندازه بزرگ 645 میلی مترمربع می باشد.

teslachipset
این تراشه ادعاهای قابل توجهی در زمینه عملکرد دارد، جایی که تسلا اظهار می کند که می تواند تا362 ترافلاپس TeraFLOP با دقت FP16/CFP8 یا حدود 22.6ترافلاپس TeraFLOP با دقت FP32 تولید کند. واضح است که تسلا برای انواع داده FP16 بهینه سازی کرده است، چرا که اگر سطح عملکرد ادعاشده درست باشد، تسلا حتی قدرتمندترین بازیگر در زمینه قدرت پردازشی کامپیوتر یعنی انویدیا را با این تراشه پشت سر خواهد گذاشت. در حال حاضر پردازنده گرافیکی A100 Ampere انویدیا می‌تواند ۳۱۲ ترافلاپس TeraFLOP وظیفه با دقت FP16 را به انجام برساند.

teslachip

با رفتن به سطح سیلیکون، می بینیم که تسلا شبکه ای از واحدهای عملکردی (FU) را ایجاد کرده است که به هم متصل هستند و یک تراشه عظیم را تشکیل می دهند. هر FU شامل یک CPU 64 یا همان پردازنده ۶۴ بیتی با ISA سفارشی است و ۱٫۲۵ مگابایت حافظه محلی SRAM دارد، . که برای انتقال، جمع آور ، پخش و پیمایش پیوند طراحی شده است. طراحی پردازنده نیز در واقع به صورت پیاده‌سازی سوپراسکالر (superscalar) انجام شده است.
خود واحد عملکرد FU قادر به انجام یک ترافلاپس TeraFLOP از BF16 یا CFP8 ، 64 GigaFLOPs محاسبه FP32 است و دارای پهنای باند 512 گیگابایت بر ثانیه در هر جهت در مش است. مش به گونه ای طراحی شده است که واحدهای عملکردFU ها را تنها در یک چرخه کلاک واحد عبور می کند، به این معنی که تاخیرها کاهش می یابد و عملکرد افزایش می یابد.


با توجه به فعالیت‌های متنوع شرکت‌های مختلف و جاه‌طلبی شرکت‌هاییمانند تسلا، ظاهرا با آینده هیجان انگیزی در ارتباط با هوش مصنوعی روبرو خواهیم شده؟ نظر شما چیست؟دیدگاه خود را با های فن تک به اشتراک بگذاریدو


چاپ