نیروگاه xAI تأمین انرژی دیتاسنترهای هوش مصنوعی

نگاهی به نیروگاه xAI تأمین انرژی دیتاسنترهای هوش مصنوعی

در این مقاله نگاهی به نیروگاه xAI تأمین انرژی دیتاسنترهای هوش مصنوعی میکنیم. به گفته دیلن پاتل از SemiAnalysis، ایلان ماسک در حال خرید یک نیروگاه xAI در خارج از کشور است و قصد دارد آن را به ایالات متحده منتقل کند تا انرژی مورد نیاز مراکز داده هوش مصنوعی خود را تامین کند. این خبر پس از آن منتشر شد که ماسک این موضوع را در یک توییت تایید کرد.

ابررایانه هوش مصنوعی Colossus xAI در حال حاضر یکی از قدرتمندترین و پرمصرف‌ترین ماشین‌های روی کره زمین است که حدود 200000 پردازنده گرافیکی Nvidia Hopper را در خود جای داده و حدود 300 مگاوات برق مصرف میکند. xAI برای تامین انرژی کافی برای این سیستم با چالش‌های جدی روبرو بوده است.

با پیشرفت این شرکت، چالش‌ها شدیدتر میشوند. ماسک با یک چالش بزرگ در تامین انرژی مرکز داده هوش مصنوعی بعدی خود روبرو است. پیش‌بینی میشود که این مرکز داده یک میلیون پردازنده گرافیکی هوش مصنوعی را در خود جای دهد و به طور بالقوه همان مقدار انرژی را مصرف کند که 1.9 میلیون خانوار مصرف میکنند. در ادامه به بررسی چگونگی مصرف این مقدار انرژی توسط مرکز داده و برنامه ماسک برای تامین آن میپردازیم.

به گفته پاتل، xAI با گردآوری منابع محاسباتی گسترده و تیمی از محققان با استعداد، در حال پیشرفت در مدل‌های هوش مصنوعی Grok است. با این حال، چالش‌های بزرگ‌تری در پیش است.

بر کسی پوشیده نیست که ایلان ماسک در حال حاضر با مشکل تامین انرژی مرکز داده xAI خود مواجه شده است. در حال حاضر، مرکز داده اصلی این شرکت، Colossus، که 200000 پردازنده گرافیکی Nvidia Hopper را در خود جای داده است، در نزدیکی ممفیس، تنسی واقع شده است. برای تامین انرژی این دستگاه، xAI تعداد 35 توربین گازی نصب کرده است که میتوانند 420 مگاوات برق تولید کنند، همچنین سیستم‌های Tesla Megapack را برای هموارسازی مصرف برق مستقر کرده است. با این حال، اوضاع در آینده جدی‌تر خواهد شد.

فراتر از ساخت Colossus، xAI به سرعت در حال خرید و توسعه امکانات جدید است. این شرکت یک کارخانه در ممفیس خریداری کرده است که در حال تبدیل شدن به فضای مرکز داده اضافی است. این فضا برای تامین انرژی حدود 125000 سرور GPU هشت طرفه به همراه تمام سخت‌افزارهای پشتیبانی‌کننده، از جمله شبکه‌سازی، ذخیره‌سازی و خنک‌سازی، کافی است.

یک میلیون پردازنده گرافیکی Nvidia Blackwell بسته به مدل‌های شتاب‌دهنده مورد استفاده (B200، GB200، B300، GB300) و پیکربندی آن‌ها، بین 1000 مگاوات (1 گیگاوات) و 1400 مگاوات (1.4 گیگاوات) مصرف خواهند کرد.

با این حال، پردازنده‌های گرافیکی تنها بار روی سیستم قدرت نیستند. شما همچنین باید مصرف برق پردازنده‌های مرکزی، حافظه DDR5، ذخیره‌سازی، تجهیزات شبکه‌سازی، خنک‌سازی، تهویه مطبوع، ناکارآمدی منبع تغذیه و سایر عوامل مانند روشنایی را در نظر بگیرید. در خوشه‌های بزرگ هوش مصنوعی، یک تقریب مفید این است که سربار 30٪ تا 50٪ دیگر به مصرف برق GPU هوش مصنوعی اضافه می‌کند، رقمی که معمولاً به عنوان PUE (اثربخشی استفاده از انرژی) بیان میشود.

با این اوصاف، بسته به اینکه xAI قصد دارد از کدام شتاب‌دهنده‌های Blackwell استفاده کند، یک مرکز داده با یک میلیون GPU بین 1400 مگاوات و 1960 مگاوات (با PUE 1.4) مصرف خواهد کرد. این سوال بزرگی است که چه چیزی میتواند یک مرکز داده با یک میلیون GPU با کارایی بالا را برای آموزش و استنتاج هوش مصنوعی تغذیه کند، زیرا این کار با تامین انرژی معادل بالقوه 1.9 میلیون خانه قابل مقایسه است.

یک نیروگاه خورشیدی در مقیاس بزرگ به تنهایی برای بار محاسباتی 24 ساعته در این مقیاس امکان‌پذیر نیست، زیرا به چندین گیگاوات پنل به اضافه ذخیره‌سازی باتری عظیم نیاز است که از نظر هزینه و زمین بسیار سنگین است.

عملی‌ترین و رایج‌ترین گزینه، ساخت چندین نیروگاه توربین گازی سیکل ترکیبی (CCGT) با گاز طبیعی است که هر کدام قادر به تولید 0.5 مگاوات تا 1500 مگاوات هستند. این رویکرد نسبتاً سریع (چند سال)، مقیاس‌پذیر در مراحل و ادغام آسان‌تر با شبکه‌های برق موجود است. شاید این همان چیزی است که xAI قصد دارد به ایالات متحده وارد کند.

جایگزین‌هایی مانند راکتورهای هسته‌ای میتوانند از نظر فنی این بار را با واحدهای کمتری (هر کدام میتوانند حدود 1000 مگاوات تولید کند) و بدون انتشار مستقیم کربن برآورده کنند، اما طراحی، صدور مجوز و ساخت نیروگاه‌های هسته‌ای بسیار بیشتر طول میکشد (تا 10 سال). بعید است که ماسک موفق به خرید یک نیروگاه هسته‌ای در خارج از کشور شده باشد و قصد داشته باشد آن را به ایالات متحده حمل کند.

در عمل، هر سازمانی که قصد استقرار 1.4 تا 1.96 گیگاواتی را داشته باشد مانند xAI به طور موثر به یک خریدار بزرگ انرژی صنعتی تبدیل خواهد شد. در حال حاضر، Colossus xAI در محل برق تولید میکند و برق را از شبکه خریداری میکند. بنابراین، به احتمال زیاد مرکز داده بعدی این شرکت نیز از این روند پیروی میکند و یک نیروگاه اختصاصی در محل را با اتصال به شبکه ترکیب میکند.

ظاهراً، از آنجایی که خرید یک نیروگاه در ایالات متحده ممکن است زمان زیادی طول بکشد، گزارش شده است که xAI در حال خرید یک نیروگاه در خارج از کشور و حمل آن است، چیزی که نشان میدهد توسعه هوش مصنوعی اکنون نه تنها به سخت‌افزار و نرم‌افزار محاسباتی، بلکه به تامین سریع منابع انرژی عظیم نیز بستگی دارد.

بدون شک، یک مرکز داده که یک میلیون شتاب‌دهنده هوش مصنوعی را در خود جای داده و یک نیروگاه اختصاصی دارد، یک اقدام شدید به نظر میرسد. با این حال، پاتل اشاره میکند که اکثر شرکت‌های پیشرو هوش مصنوعی در نهایت به استراتژی‌های مشابهی همگرا میشوند: تمرکز خوشه‌های محاسباتی عظیم، استخدام محققان درجه یک و آموزش مدل‌های هوش مصنوعی بزرگ‌تر از همیشه. برای این منظور، اگر xAI قصد دارد از رقابت جلوتر بماند، باید مراکز داده پیشرفته‌تر و پرمصرف‌تری بسازد.