آنچه خواهید خواند
رقابت غولهای صنعت هوش مصنوعی برای تولید هوش مصنوعی ارزان
شرکتهای هوش مصنوعی در رقابتی گسترده برای ساخت مدلهای هوش مصنوعی ارزان با تکنیکی به نام distillation به پیش میروند. غولهای صنعت هوش مصنوعی مانند OpenAI، مایکروسافت و متا در تلاش هستند تا با این روش، هزینه استفاده از مدلهای هوش مصنوعی را برای کسبوکارها و اشخاص کاهش دهند.
این تکنیک اخیراً زمانی توجه فراوانی به خود جلب کرد که شرکت دیپ سیک DeepSeek، یکی از شرکتهای پیشرو در حوزه هوش مصنوعی چینی، از این روش برای تولید مدلهای قدرتمند و کمهزینهای بر پایه سیستمهای منبعباز منتشرشده توسط رقبایی مانند متا و علیبابا استفاده کرد.
صنعت هوش مصنوعی چین و موفقیت شرکت چینی دیپ سیک باعث نگرانیهایی در سیلیکون ولی (Silicon Valley) شد و اعتماد سرمایهگذاران وال استریت را به رهبری آمریکا در حوزه هوش مصنوعی تحت تأثیر قرار داد، به گونهای که ارزش سهام شرکتهای بزرگ تکنولوژی آمریکایی میلیاردها دلار کاهش یافت.
عملکرد روش تقطیر یا Distillation
روش تقطیر بدین صورت است که شرکتها ابتدا یک مدل هوش مصنوعی بسیار بزرگ را که اصطلاحاً مدل معلم نام دارد آموزش میدهند. سپس از دادههای تولیدشده توسط این مدل برای آموزش دادن یک مدل کوچکتر، که به مدل دانشآموز معروف است استفاده میشود. به این ترتیب دانش و قدرت پیشبینی مدل بزرگتر به سرعت به مدل کوچکتر منتقل میشود.
گرچه تقطیر برای سالها وجود داشته، اما پیشرفتهای اخیر باعث شده متخصصان این صنعت باور کنند که این روش برای استارتاپهایی که به دنبال ساخت برنامههای کاربردی مقرونبهصرفه هستند مزیت بزرگی خواهد داشت.
الیویه گودمنت، مدیر محصول پلتفرم OpenAI در اینباره میگوید که تقطیر واقعاً جادویی است. این روش عملاً اجازه میدهد تا از مدلهای عظیم و پیشرفته استفاده کرده و مدلهای کوچکتری تولید کرد که در وظایف مشخص بسیار توانمند هستند و در عین حال بسیار ارزانتر و سریعتر اجرا میشوند.
مدلهای زبان بزرگ مانند GPT-4 از شرکت OpenAI، جمنای گوگل و لاما از متا به منابع عظیمی از دادهها و قدرت محاسباتی نیاز دارند. هرچند این شرکتها هزینه دقیق آموزش چنین مدلهایی را اعلام نکردهاند، اما برآوردها نشان میدهد این هزینهها به صدها میلیون دلار میرسد.
با استفاده از تقطیر، کسبوکارها و توسعهدهندگان میتوانند قابلیت این مدلها را با هزینهای بسیار کمتر به کار بگیرند و آنها را به راحتی روی دستگاههایی مانند لپتاپها و گوشیها اجرا کنند.
از چه پلتفرمی برای تقطیر میتوان استفاده کرد؟
توسعهدهندگان میتوانند از پلتفرم OpenAI برای تقطیر و یادگیری از مدلهایی که اساس محصولاتی مانند ChatGPT هستند، استفاده کنند. برای مثال مایکروسافت به عنوان سرمایهگذار اصلی OpenAI که تاکنون حدود 14 میلیارد دلار سرمایهگذاری کرده، از مدل GPT-4 برای تولید خانواده مدلهای کوچک خود به نام Phi بهره برده است.
با این حال، استارتاپ OpenAI معتقد است که هوش مصنوعی چینی دیپ سیک (DeepSeek) بدون مجوز، مدلهای این شرکت را تقطیر کرده و با آن مدل رقیب خود را آموزش داده که این عمل برخلاف شرایط استفاده آنها است. شرکت دیپ سیک تاکنون این ادعا را رد یا تأیید نکرده است. کارشناسان همچنین اشاره میکنند که هرچند مدلهای حاصل از تقطیر عملکرد بالایی دارند، اما در زمینه کاربردها، محدودتر هستند.
چالشهای پیشرو
این مسئله چالشی برای مدل کسبوکار شرکتهای بزرگ هوش مصنوعی ایجاد میکند ،زیرا مدلهای تقطیرشده هزینه بسیار کمتری دارند، درآمد کمتری تولید میکنند و نیاز به توان پردازشی کمتری دارند. این باعث میشود شرکتهایی مانند OpenAI هزینه کمتری بابت استفاده از این مدلها دریافت کنند.
گودمنت از OpenAI معتقد است که همچنان مدلهای بزرگ برای وظایف حساس و پیچیده که شرکتها حاضرند بابت دقت و اطمینان بالا هزینه کنند، مورد نیاز خواهند بود. همچنین به گفته او، مدلهای بزرگ برای کشف قابلیتهای جدید مورد نیاز هستند که بعداً از طریق تقطیر به مدلهای کوچکتر منتقل خواهند شد.
با این وجود، شرکت OpenAI تلاش میکند تا از تقطیر مدلهایش برای آموزش مدل رقبا جلوگیری کند. آنها برای مقابله با این موضوع تیمهایی دارند که به صورت فعال استفاده از پلتفرمها را نظارت میکنند و دسترسی کسانی را که مشکوک به انتقال حجم زیادی از دادهها هستند، قطع میکنند. این اتفاق ظاهراً در مورد کسانی که OpenAI آنها را به شرکت دیپ سیک مرتبط میداند، رخ داده است. با این حال، کارشناسان اذعان میکنند که جلوگیری کامل از تقطیر بسیار دشوار است.
مزیت تقطیر برای Open Models
تکنیک distillation همچنین یک پیروزی برای طرفداران مدلهای باز (open models) محسوب میشود. یعنی مدلهایی که فناوری آنها به صورت رایگان در دسترس توسعهدهندگان قرار میگیرد تا بر پایه آنها برنامهها و ابزارهای جدیدی خلق کنند. شرکت دیپ سیک اخیراً مدلهایش را نیز به صورت باز در اختیار توسعهدهندگان قرار داده است.
تقطیر همچنین بدین معنی است که شرکتهایی که میلیاردها دلار برای پیشبرد تواناییهای سیستمهای هوش مصنوعی هزینه میکنند، ممکن است همچنان با رقبایی روبهرو شوند که به سرعت تواناییهای آنها را کپی و بازتولید میکنند، همانطور که اخیراً شرکت دیپ سیک نشان داده است. این مسئله موجب ایجاد پرسشهایی درباره مزیت اول بودن در ساخت مدلهای بزرگ زبانی (LLMها) شده است، چرا که قابلیتهای این مدلها میتواند تنها در عرض چند ماه توسط رقبا تکرار شود.
کلام آخر
تکنیک تقطیر (Distillation) تحولی اساسی در صنعت هوش مصنوعی ایجاد کرده و مسیری را باز کرده که حتی شرکتهای کوچک و استارتآپها بتوانند با هزینه کمتر از قابلیتهای پیشرفته مدلهای بزرگ بهره ببرند. از طرفی، گسترش سریع این فناوری باعث شده تا مزیت رقابتی شرکتهای پیشرو در این حوزه کاهش یابد و شرکتهایی مانند دیپ سیک بتوانند بهسرعت به رقبای قدرتمندی برای غولهایی نظیر OpenAI و متا تبدیل شوند.
با این حال، تقطیر چالشهایی نیز به همراه دارد،؛ کاهش درآمد شرکتهای بزرگ و دشواری حفظ مالکیت معنوی مدلهای هوش مصنوعی از مهمترین آنهاست. بنابراین، با وجود فرصتهای بزرگی که فراهم شده، رقابت و نگرانیها در این حوزه همچنان ادامه خواهد داشت و احتمالاً شاهد تغییرات چشمگیر بیشتری در آینده نزدیک خواهیم بود.





پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!