جدول محتوا
کارشناس خنکسازی HPE جیسون زایلر، توضیح میدهد که چرا خنکسازی مایع بهطور ایدهآل برای خنک کردن شتابدهندههای نسل بعدی مناسب است و چگونه میتواند به بهبود کارایی، پایداری و تراکم در مراکز داده سرور هوش مصنوعی آینده کمک کند. در ادامه این خبر با ما همراه باشید.
هوش مصنوعی یکی از بارهای پردازشی سنگین عصر ماست و افزایش مصرف برق و هزینههای انرژی مربوط به سیستمهای هوش مصنوعی دور از انتظار نیست. اوایل امسال آژانس بینالمللی انرژی (IEA) گزارش داد که مراکز داده در سطح جهانی در سال 2022، 2% از کل برق مصرفی را به خود اختصاص دادهاند و پیشبینی میشود که این میزان تا سال 2026 بیش از دو برابر شود.
در حالی که کارایی شتابدهندههای نسل جدید بهبود یافته است، مصرف برق با پذیرش هوش مصنوعی افزایش خواهد یافت. مراکز داده نیاز خواهند داشت که بارهای پردازشی هوش مصنوعی را بهطور مؤثرتر اجرا کنند و تأسیسات فعلی برای پشتیبانی از نیازهای خنکسازی قدرت پردازشهای در حال رشد، مناسب نیستند. در اینجا خنکسازی مایع به کمک میآید.
سرد ماندن در عصر هوش مصنوعی
در مقایسه با خنکسازی هوای سنتی که از فنها استفاده میکند، در خنکسازی مایع – و بهویژه در خنکسازی مایع مستقیم – مایع خنککننده بهطور مستقیم به یک سرور پمپ میشود تا گرمای تولید شده توسط پردازندهها را جذب کند و به سیستم تبادل حرارت در خارج از مرکز داده منتقل کند.
شرکت HPE چندین دهه تجربه در نوآوری و ارائه سیستمهای خنکشده با مایع در سطح جهانی دارد تا بهطور مؤثر سیستمهای بزرگ مقیاس را که بارهای محاسباتی با عملکرد بالا (HPC) را اجرا میکنند، خنک کند.
زیرساختهای هوش مصنوعی آینده که از شتابدهندههای جدیدترین استفاده خواهند کرد، به همین نوآوری در خنکسازی مایع نیاز خواهند داشت تا مسائل مربوط به کارایی انرژی، پایداری و حتی تابآوری سیستم که برای ادامه کار بارهای پردازشی هوش مصنوعی ضروری است، را حل کنند.
بیایید به بررسی چهار دلیل اصلی بپردازیم که چرا خنکسازی مایع راهحل ایدهآل برای مراکز داده هوش مصنوعی است.
برخی از تراشهها نمیتوانند حرارت را تحمل کنند
کارشناسان صنعت با طراحی شتابدهندههای نسل بعدی کار فوقالعادهای انجام دادهاند تا عملکرد بسیار بالاتری برای هوش مصنوعی با کارایی بیشتر ارائه دهند. تراشههای جدید بهگونهای طراحی شدهاند که عملکرد بیشتری را در فضای کوچکی جا دهند؛ اما این به معنی دشواری در خنک کردن همه آن اجزای حیاتی درون تراشههاست.
اگر نتوانیم تراشهها را بهقدر کافی سریع خنک کنیم، مراکز داده ممکن است با مشکلات گرمایی مواجه شوند که میتواند به خرابی سیستم و در نهایت، وقفههای غیرمنتظره در اجرای کارهای هوش مصنوعی منجر شود.
خنکسازی مایع میتواند این تراشهها را سریعتر و مؤثرتر خنک کند زیرا آب دارای ظرفیت حرارتی سه برابر بیشتر از هوا است و به این ترتیب میتواند گرمای بیشتری که توسط شتابدهندهها و سایر اجزای مانند پردازندهها، حافظه، و سوئیچهای شبکه تولید میشود، جذب کند.
درک ارزش هوش مصنوعی با تأثیر زیستمحیطی کمتر
خنکسازی مؤثر شتابدهندههای نسل بعدی برای اطمینان از قابلیت اطمینان سیستم یک اولویت کلیدی است اما بههمان اندازه مهم است که باید این کار را بهطور پایدارتر انجام دهیم. خنکسازی مایع دارای مزایای قابل توجهی از نظر پایداری و هزینه برای شتابدهندههای نسل بعدی است.
بیایید بهعنوان مثال به یک مرکز داده HPC با 10,000 سرور نگاه کنیم.
اگر تمام 10,000 سرور با هوا خنک شوند، یک مرکز داده بیش از 8,700 تن CO2 منتشر میکند، در مقایسه با سرورهای خنکشده با مایع که حدود 1,200 تن CO2 در سال تولید میکنند. این به معنای کاهش انرژی 87% است و مانع از انتشار نزدیک به 17.8 میلیون پوند CO2 بهطور سالانه در جو میشود.
این کاهش عظیم قدرت بهطور غیرمنتظرهای با صرفهجویی قابل توجهی در هزینهها همراه است. هر مدیر مالی که هزینههای انرژی را نظارت میکند، این نکته را درک خواهد کرد.
برای یک مرکز داده با 10,000 سرور خنکشده با مایع، هزینه سالانه برای هر سروری مانند سرور HP تنها 45.99 دلار است، در مقایسه با هزینه سالانه 254.70 دلار برای هر سرور خنکشده با هوا. این صرفهجویی نزدیک به 2.1 میلیون دلار در سال در هزینههای عملیاتی به همراه دارد.
بازیابی انرژی از سیستمهای هوش مصنوعی
شگفتیها به همین جا ختم نمیشود. خنکسازی مایع هدیهای است که همیشه ادامه دارد. پس از جذب گرما، سیستمهای خنکشده با مایع، گرما را به سیستم تبادل حرارت در خارج از مرکز داده منتقل میکنند، جایی که آب گرمشده میتواند بهعنوان منبع انرژی برای تأمین برق سایر ساختمانها یا تأسیسات استفاده شود.
آزمایشگاه ملی انرژیهای تجدیدپذیر ایالات متحده (NREL) سالهاست که بهطور موفقیتآمیز از این روش استفاده میکند. این آزمایشگاه که یکی از مراکز پیشرو جهانی در زمینه انرژیهای تجدیدپذیر است، 90% از آب گرمشده جذب شده از سیستم Peregrine خود، یک ابرکامپیوتر خنکشده با مایع از HPE Cray، را بهعنوان منبع اصلی گرما برای دفاتر و فضای آزمایشگاهی خود در تأسیسات ادغام سیستمهای انرژی (ESIF) استفاده کرده است.
دوستان ما در QScale در کبک نیز در حال برنامهریزی برای انجام همین کار هستند اما با هدف کمک به رشد محصولات و رفع کمبود غذا. با استفاده از خنکسازی مایع، QScale امیدوار است که گلخانههای محلی به اندازه تقریبی 100 زمین فوتبال را برای تولید معادل 80,000 تن گوجهفرنگی در سال تأمین کند.
عملکرد بیشتر هوش مصنوعی، سیستمهای کوچکتر
همانطور که مراکز داده برنامهریزی و آمادهسازی برای پذیرش زیرساختهای هوش مصنوعی آینده را انجام میدهند، چگالی (Density) عامل کلیدی در ایجاد فضای لازم برای راهحلهای پیشرفته هوش مصنوعی خواهد بود.
از آنجا که فنها و تمام تجهیزات لازم برای پشتیبانی از آنها در راهحلهای خنکشده با هوا ضروری نیستند، مراکز داده میتوانند رکهای سرور کمتری با چگالی بیشتر قرار دهند تا فضای موجود را به حداکثر برسانند، یا در صورت نیاز، فضای خود را گسترش دهند.
با استفاده از مثال مرکز داده با 10,000 سرور، در صورت استفاده از سرورهای خنکشده با مایع، یک تأسیسات میتواند نیاز به فضای 77.5% کمتری را کاهش دهد.
علاوه بر این طی پنج سال راهحلهای خنکشده با مایع 14.9% انرژی کمتری برای شاسی استفاده میکنند و عملکردی 20.7% بالاتر به ازای هر کیلووات نسبت به راهحلهای خنکشده با هوا ارائه میدهند.
هوش مصنوعی به تجربه و اعتماد نیاز دارد
در مورد هوش مصنوعی اعتماد به کارشناسان اهمیت زیادی دارد. شرکت اچ پی بیش از 50 سال تجربه و بیش از 300 پتنت در زمینه خنکسازی مایع دارد. همچنان سیستمهای بزرگ خنکشده با مایع را برای مشتریان خود میسازد تا بدون هیچ مشکلی برای چندین سال متوالی عمل کنند. راهحلهای خنکشده با مایع این کمپانی همچنین ثابت شدهاند که به محاسبات پایدارتر کمک میکنند.
در دو سال گذشته HP چهار تا از ده سیستم سریعترین جهان را ارائه کرده است که همه آنها ابرکامپیوترهای خنکشده با مایع HPE Cray EX هستند.
از این میان Frontier، سریعترین ابرکامپیوتر جهان برای آزمایشگاه ملی Oak Ridge وزارت انرژی ایالات متحده، موفق شد مرز سرعت اگزاسکیل را بشکند و هزاران شتابدهنده را بدون شکست بهکار گیرد. حتی با مقیاس عملکرد بزرگش، Frontier هنوز عنوان سریعترین و کارآمدترین ابرکامپیوتر جهان از نظر مصرف انرژی را کسب کرده است.