هوش مصنوعی ارزان DeepSeek، آیا چین جای آمریکا را میگیرد؟

رقابت غول‌های صنعت هوش مصنوعی برای تولید هوش مصنوعی ارزان

شرکت‌های هوش مصنوعی در رقابتی گسترده برای ساخت مدل‌های هوش مصنوعی ارزان با تکنیکی به نام distillation به پیش میروند. غول‌های صنعت هوش مصنوعی مانند OpenAI، مایکروسافت و متا در تلاش هستند تا با این روش، هزینه استفاده از مدل‌های هوش مصنوعی را برای کسب‌وکارها و اشخاص کاهش دهند.

این تکنیک اخیراً زمانی توجه فراوانی به خود جلب کرد که شرکت دیپ سیک DeepSeek، یکی از شرکت‌های پیشرو در حوزه هوش مصنوعی چینی، از این روش برای تولید مدل‌های قدرتمند و کم‌هزینه‌ای بر پایه سیستم‌های منبع‌باز منتشرشده توسط رقبایی مانند متا و علی‌بابا استفاده کرد.

صنعت هوش مصنوعی چین و موفقیت شرکت چینی دیپ سیک باعث نگرانی‌هایی در سیلیکون ولی (Silicon Valley) شد و اعتماد سرمایه‌گذاران وال استریت را به رهبری آمریکا در حوزه هوش مصنوعی تحت تأثیر قرار داد، به گونه‌ای که ارزش سهام شرکت‌های بزرگ تکنولوژی آمریکایی میلیاردها دلار کاهش یافت.

هوش مصنوعی ارزان DeepSeek، آیا چین جای آمریکا را میگیرد؟

عملکرد روش تقطیر یا Distillation

روش تقطیر بدین صورت است که شرکت‌ها ابتدا یک مدل هوش مصنوعی بسیار بزرگ را که اصطلاحاً مدل معلم نام دارد آموزش میدهند. سپس از داده‌های تولیدشده توسط این مدل برای آموزش دادن یک مدل کوچکتر، که به مدل دانش‌آموز معروف است استفاده میشود. به این ترتیب دانش و قدرت پیش‌بینی مدل بزرگتر به سرعت به مدل کوچکتر منتقل میشود.

گرچه تقطیر برای سال‌ها وجود داشته، اما پیشرفت‌های اخیر باعث شده متخصصان این صنعت باور کنند که این روش برای استارتاپ‌هایی که به دنبال ساخت برنامه‌های کاربردی مقرون‌به‌صرفه هستند مزیت بزرگی خواهد داشت.

الیویه گودمنت، مدیر محصول پلتفرم OpenAI در این‌باره میگوید که تقطیر واقعاً جادویی است. این روش عملاً اجازه میدهد تا از مدل‌های عظیم و پیشرفته استفاده کرده و مدل‌های کوچکتری تولید کرد که در وظایف مشخص بسیار توانمند هستند و در عین حال بسیار ارزان‌تر و سریع‌تر اجرا میشوند.

مدل‌های زبان بزرگ مانند GPT-4 از شرکت OpenAI، جمنای گوگل و لاما از متا به منابع عظیمی از داده‌ها و قدرت محاسباتی نیاز دارند. هرچند این شرکت‌ها هزینه دقیق آموزش چنین مدل‌هایی را اعلام نکرده‌اند، اما برآوردها نشان میدهد این هزینه‌ها به صدها میلیون دلار میرسد.

با استفاده از تقطیر، کسب‌وکارها و توسعه‌دهندگان میتوانند قابلیت این مدل‌ها را با هزینه‌ای بسیار کمتر به‌ کار بگیرند و آن‌ها را به راحتی روی دستگاه‌هایی مانند لپ‌تاپ‌ها و گوشی‌ها اجرا کنند.

از چه پلتفرمی برای تقطیر میتوان استفاده کرد؟

توسعه‌دهندگان میتوانند از پلتفرم OpenAI برای تقطیر و یادگیری از مدل‌هایی که اساس محصولاتی مانند ChatGPT هستند، استفاده کنند. برای مثال مایکروسافت به عنوان سرمایه‌گذار اصلی OpenAI که تاکنون حدود 14 میلیارد دلار سرمایه‌گذاری کرده، از مدل GPT-4 برای تولید خانواده مدل‌های کوچک خود به نام Phi بهره برده است.

با این حال، استارتاپ OpenAI معتقد است که هوش مصنوعی چینی دیپ سیک (DeepSeek) بدون مجوز، مدل‌های این شرکت را تقطیر کرده و با آن مدل رقیب خود را آموزش داده که این عمل برخلاف شرایط استفاده آن‌ها است. شرکت دیپ سیک تاکنون این ادعا را رد یا تأیید نکرده است. کارشناسان همچنین اشاره میکنند که هرچند مدل‌های حاصل از تقطیر عملکرد بالایی دارند، اما در زمینه کاربردها، محدودتر هستند.

هوش مصنوعی ارزان DeepSeek، آیا چین جای آمریکا را میگیرد؟

چالش‌های پیش‌رو

این مسئله چالشی برای مدل کسب‌وکار شرکت‌های بزرگ هوش مصنوعی ایجاد میکند ،زیرا مدل‌های تقطیرشده هزینه بسیار کمتری دارند، درآمد کمتری تولید میکنند و نیاز به توان پردازشی کمتری دارند. این باعث میشود شرکت‌هایی مانند OpenAI هزینه کمتری بابت استفاده از این مدل‌ها دریافت کنند.

گودمنت از OpenAI معتقد است که همچنان مدل‌های بزرگ برای وظایف حساس و پیچیده که شرکت‌ها حاضرند بابت دقت و اطمینان بالا هزینه کنند، مورد نیاز خواهند بود. همچنین به گفته او، مدل‌های بزرگ برای کشف قابلیت‌های جدید مورد نیاز هستند که بعداً از طریق تقطیر به مدل‌های کوچک‌تر منتقل خواهند شد.

با این وجود، شرکت OpenAI تلاش میکند تا از تقطیر مدل‌هایش برای آموزش مدل رقبا جلوگیری کند. آن‌ها برای مقابله با این موضوع تیم‌هایی دارند که به صورت فعال استفاده از پلتفرم‌ها را نظارت میکنند و دسترسی کسانی را که مشکوک به انتقال حجم زیادی از داده‌ها هستند، قطع میکنند. این اتفاق ظاهراً در مورد کسانی که OpenAI آن‌ها را به شرکت دیپ سیک مرتبط میداند، رخ داده است. با این حال، کارشناسان اذعان میکنند که جلوگیری کامل از تقطیر بسیار دشوار است.

مزیت تقطیر برای Open Models

تکنیک distillation همچنین یک پیروزی برای طرفداران مدل‌های باز (open models) محسوب میشود. یعنی مدل‌هایی که فناوری آن‌ها به صورت رایگان در دسترس توسعه‌دهندگان قرار میگیرد تا بر پایه آن‌ها برنامه‌ها و ابزارهای جدیدی خلق کنند. شرکت دیپ سیک اخیراً مدل‌هایش را نیز به صورت باز در اختیار توسعه‌دهندگان قرار داده است.

تقطیر همچنین بدین معنی است که شرکت‌هایی که میلیاردها دلار برای پیشبرد توانایی‌های سیستم‌های هوش مصنوعی هزینه میکنند، ممکن است همچنان با رقبایی روبه‌رو شوند که به سرعت توانایی‌های آن‌ها را کپی و بازتولید میکنند، همانطور که اخیراً شرکت دیپ سیک نشان داده است. این مسئله موجب ایجاد پرسش‌هایی درباره مزیت اول بودن در ساخت مدل‌های بزرگ زبانی (LLMها) شده است، چرا که قابلیت‌های این مدل‌ها میتواند تنها در عرض چند ماه توسط رقبا تکرار شود.

هوش مصنوعی ارزان DeepSeek، آیا چین جای آمریکا را میگیرد؟

کلام آخر

تکنیک تقطیر (Distillation) تحولی اساسی در صنعت هوش مصنوعی ایجاد کرده و مسیری را باز کرده که حتی شرکت‌های کوچک و استارت‌آپ‌ها بتوانند با هزینه کمتر از قابلیت‌های پیشرفته مدل‌های بزرگ بهره ببرند. از طرفی، گسترش سریع این فناوری باعث شده تا مزیت رقابتی شرکت‌های پیشرو در این حوزه کاهش یابد و شرکت‌هایی مانند دیپ سیک بتوانند به‌سرعت به رقبای قدرتمندی برای غول‌هایی نظیر OpenAI و متا تبدیل شوند.

با این حال، تقطیر چالش‌هایی نیز به همراه دارد،؛ کاهش درآمد شرکت‌های بزرگ و دشواری حفظ مالکیت معنوی مدل‌های هوش مصنوعی از مهم‌ترین آن‌هاست. بنابراین، با وجود فرصت‌های بزرگی که فراهم شده، رقابت و نگرانی‌ها در این حوزه همچنان ادامه خواهد داشت و احتمالاً شاهد تغییرات چشمگیر بیشتری در آینده نزدیک خواهیم بود.