آنچه خواهید خواند
نگاهی به نیروگاه xAI تأمین انرژی دیتاسنترهای هوش مصنوعی
در این مقاله نگاهی به نیروگاه xAI تأمین انرژی دیتاسنترهای هوش مصنوعی میکنیم. به گفته دیلن پاتل از SemiAnalysis، ایلان ماسک در حال خرید یک نیروگاه xAI در خارج از کشور است و قصد دارد آن را به ایالات متحده منتقل کند تا انرژی مورد نیاز مراکز داده هوش مصنوعی خود را تامین کند. این خبر پس از آن منتشر شد که ماسک این موضوع را در یک توییت تایید کرد.
ابررایانه هوش مصنوعی Colossus xAI در حال حاضر یکی از قدرتمندترین و پرمصرفترین ماشینهای روی کره زمین است که حدود 200000 پردازنده گرافیکی Nvidia Hopper را در خود جای داده و حدود 300 مگاوات برق مصرف میکند. xAI برای تامین انرژی کافی برای این سیستم با چالشهای جدی روبرو بوده است.
با پیشرفت این شرکت، چالشها شدیدتر میشوند. ماسک با یک چالش بزرگ در تامین انرژی مرکز داده هوش مصنوعی بعدی خود روبرو است. پیشبینی میشود که این مرکز داده یک میلیون پردازنده گرافیکی هوش مصنوعی را در خود جای دهد و به طور بالقوه همان مقدار انرژی را مصرف کند که 1.9 میلیون خانوار مصرف میکنند. در ادامه به بررسی چگونگی مصرف این مقدار انرژی توسط مرکز داده و برنامه ماسک برای تامین آن میپردازیم.
به گفته پاتل، xAI با گردآوری منابع محاسباتی گسترده و تیمی از محققان با استعداد، در حال پیشرفت در مدلهای هوش مصنوعی Grok است. با این حال، چالشهای بزرگتری در پیش است.
بر کسی پوشیده نیست که ایلان ماسک در حال حاضر با مشکل تامین انرژی مرکز داده xAI خود مواجه شده است. در حال حاضر، مرکز داده اصلی این شرکت، Colossus، که 200000 پردازنده گرافیکی Nvidia Hopper را در خود جای داده است، در نزدیکی ممفیس، تنسی واقع شده است. برای تامین انرژی این دستگاه، xAI تعداد 35 توربین گازی نصب کرده است که میتوانند 420 مگاوات برق تولید کنند، همچنین سیستمهای Tesla Megapack را برای هموارسازی مصرف برق مستقر کرده است. با این حال، اوضاع در آینده جدیتر خواهد شد.
فراتر از ساخت Colossus، xAI به سرعت در حال خرید و توسعه امکانات جدید است. این شرکت یک کارخانه در ممفیس خریداری کرده است که در حال تبدیل شدن به فضای مرکز داده اضافی است. این فضا برای تامین انرژی حدود 125000 سرور GPU هشت طرفه به همراه تمام سختافزارهای پشتیبانیکننده، از جمله شبکهسازی، ذخیرهسازی و خنکسازی، کافی است.
یک میلیون پردازنده گرافیکی Nvidia Blackwell بسته به مدلهای شتابدهنده مورد استفاده (B200، GB200، B300، GB300) و پیکربندی آنها، بین 1000 مگاوات (1 گیگاوات) و 1400 مگاوات (1.4 گیگاوات) مصرف خواهند کرد.
با این حال، پردازندههای گرافیکی تنها بار روی سیستم قدرت نیستند. شما همچنین باید مصرف برق پردازندههای مرکزی، حافظه DDR5، ذخیرهسازی، تجهیزات شبکهسازی، خنکسازی، تهویه مطبوع، ناکارآمدی منبع تغذیه و سایر عوامل مانند روشنایی را در نظر بگیرید. در خوشههای بزرگ هوش مصنوعی، یک تقریب مفید این است که سربار 30٪ تا 50٪ دیگر به مصرف برق GPU هوش مصنوعی اضافه میکند، رقمی که معمولاً به عنوان PUE (اثربخشی استفاده از انرژی) بیان میشود.
با این اوصاف، بسته به اینکه xAI قصد دارد از کدام شتابدهندههای Blackwell استفاده کند، یک مرکز داده با یک میلیون GPU بین 1400 مگاوات و 1960 مگاوات (با PUE 1.4) مصرف خواهد کرد. این سوال بزرگی است که چه چیزی میتواند یک مرکز داده با یک میلیون GPU با کارایی بالا را برای آموزش و استنتاج هوش مصنوعی تغذیه کند، زیرا این کار با تامین انرژی معادل بالقوه 1.9 میلیون خانه قابل مقایسه است.
یک نیروگاه خورشیدی در مقیاس بزرگ به تنهایی برای بار محاسباتی 24 ساعته در این مقیاس امکانپذیر نیست، زیرا به چندین گیگاوات پنل به اضافه ذخیرهسازی باتری عظیم نیاز است که از نظر هزینه و زمین بسیار سنگین است.
عملیترین و رایجترین گزینه، ساخت چندین نیروگاه توربین گازی سیکل ترکیبی (CCGT) با گاز طبیعی است که هر کدام قادر به تولید 0.5 مگاوات تا 1500 مگاوات هستند. این رویکرد نسبتاً سریع (چند سال)، مقیاسپذیر در مراحل و ادغام آسانتر با شبکههای برق موجود است. شاید این همان چیزی است که xAI قصد دارد به ایالات متحده وارد کند.
جایگزینهایی مانند راکتورهای هستهای میتوانند از نظر فنی این بار را با واحدهای کمتری (هر کدام میتوانند حدود 1000 مگاوات تولید کند) و بدون انتشار مستقیم کربن برآورده کنند، اما طراحی، صدور مجوز و ساخت نیروگاههای هستهای بسیار بیشتر طول میکشد (تا 10 سال). بعید است که ماسک موفق به خرید یک نیروگاه هستهای در خارج از کشور شده باشد و قصد داشته باشد آن را به ایالات متحده حمل کند.
در عمل، هر سازمانی که قصد استقرار 1.4 تا 1.96 گیگاواتی را داشته باشد مانند xAI به طور موثر به یک خریدار بزرگ انرژی صنعتی تبدیل خواهد شد. در حال حاضر، Colossus xAI در محل برق تولید میکند و برق را از شبکه خریداری میکند. بنابراین، به احتمال زیاد مرکز داده بعدی این شرکت نیز از این روند پیروی میکند و یک نیروگاه اختصاصی در محل را با اتصال به شبکه ترکیب میکند.
ظاهراً، از آنجایی که خرید یک نیروگاه در ایالات متحده ممکن است زمان زیادی طول بکشد، گزارش شده است که xAI در حال خرید یک نیروگاه در خارج از کشور و حمل آن است، چیزی که نشان میدهد توسعه هوش مصنوعی اکنون نه تنها به سختافزار و نرمافزار محاسباتی، بلکه به تامین سریع منابع انرژی عظیم نیز بستگی دارد.
بدون شک، یک مرکز داده که یک میلیون شتابدهنده هوش مصنوعی را در خود جای داده و یک نیروگاه اختصاصی دارد، یک اقدام شدید به نظر میرسد. با این حال، پاتل اشاره میکند که اکثر شرکتهای پیشرو هوش مصنوعی در نهایت به استراتژیهای مشابهی همگرا میشوند: تمرکز خوشههای محاسباتی عظیم، استخدام محققان درجه یک و آموزش مدلهای هوش مصنوعی بزرگتر از همیشه. برای این منظور، اگر xAI قصد دارد از رقابت جلوتر بماند، باید مراکز داده پیشرفتهتر و پرمصرفتری بسازد.

پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!