انتشار Llama 4 توسط متا

متا مدل‌های جدیدی از خانواده‌ Llama به نام Llama 4 را منتشر کرد

در مجموع چهار مدل جدید وجود دارد: Llama 4 Scout ،Llama 4 Maverick و Llama 4 Behemoth. طبق گفته‌ متا، تمامی این مدل‌ها بر روی مقادیر زیادی از داده‌های متنی، تصویری و ویدئویی بدون برچسب آموزش دیده‌اند تا فهم بصری گسترده‌ای به دست آورند.

موفقیت مدل‌های باز از آزمایشگاه هوش مصنوعی DeepSeek چین که عملکرد آن‌ها مشابه یا بهتر از مدل‌های پیشین Llama از متا است، گفته میشود که موجب شد توسعه Llama شتاب بیشتری بگیرد. گزارش‌ها حاکی از آن است که متا اتاق‌های جنگی ایجاد کرده است تا نحوه کاهش هزینه‌های اجرای مدل‌هایی مانند R1 و V3 توسط DeepSeek را رمزگشایی کند.

مدل‌های Scout و Maverick به طور عمومی در Llama.com و از طریق شرکای متا، از جمله پلتفرم توسعه‌دهندگان هوش مصنوعی Hugging Face، در دسترس هستند، در حالی که مدل Behemoth هنوز در حال آموزش است. متا اعلام کرده که Meta AI، دستیار هوش مصنوعی در اپلیکیشن‌هایی مانند واتس‌اپ،Messenger و اینستاگرام، به روز شده است تا از Llama 4 در 40 کشور استفاده کند. ویژگی‌های چندوجهی فعلاً فقط در ایالات متحده به زبان انگلیسی در دسترس است.

انتشار Llama 4 توسط متا

برخی از توسعه‌دهندگان ممکن است با مجوز Llama 4 مشکل داشته باشند

استفاده یا توزیع مدل‌ها برای افراد و شرکت‌های “مستقر” یا دارای “محل اصلی کسب‌وکار” در اتحادیه اروپا ممنوع است که احتمالاً نتیجه‌ الزامات حکمرانی تحمیل‌ شده توسط قوانین حریم خصوصی داده‌ها و هوش مصنوعی منطقه است.

در گذشته، متا این قوانین را به عنوان بار اضافه‌ای توصیف کرده است. علاوه بر این، همانند نسخه‌های قبلی Llama، شرکت‌هایی که بیش از 700 میلیون کاربر فعال ماهانه دارند باید از متا درخواست مجوز خاصی کنند که متا میتواند آن را به صلاحدید خود اعطا یا رد کند.

متا در یک پست وبلاگ نوشت این مدل‌های Llama 4 آغازگر یک دوران جدید برای اکوسیستم Llama هستند. این فقط شروع مجموعه‌ Llama 4 است. متا اعلام کرده است که Llama 4 اولین گروه از مدل‌های آن است که از معماری ترکیب متخصصان (MoE) استفاده میکند، که از نظر محاسباتی کارآمدتر برای آموزش و پاسخ‌دهی به سؤالات است. معماری‌های MoE به طور کلی وظایف پردازش داده‌ها را به زیروظایف تقسیم میکنند و سپس آن‌ها را به مدل‌های متخصص کوچکتر و تخصصی‌تر واگذار میکنند.

انتشار Llama 4 توسط متا

مدل Maverick

مدل Maverick دارای 400 میلیارد پارامتر کل است، اما تنها 17 میلیارد پارامتر فعال در 128 متخصص دارد. پارامترها به طور تقریبی به مهارت‌های حل مسأله‌ مدل‌ها مربوط میشوند. مدل Scout دارای 17 میلیارد پارامتر فعال، 16 متخصص و 109 میلیارد پارامتر کل است.

طبق آزمایش‌های داخلی متا، Maverick که شرکت میگوید برای استفاده‌های عمومی مانند دستیار عمومی و چت بهترین است، در برخی از معیارهای کدنویسی، استدلال، چندزبانه بودن، زمینه‌های طولانی و تصاویر، از مدل‌هایی مانند GPT-4o OpenAI و Gemini 2.0 گوگل بهتر عمل میکند. با این حال، Maverick به پای مدل‌های قدرتمندتری مانند Gemini 2.5 Pro گوگل، Claude 3.7 Sonnet Anthropic و GPT-4.5 OpenAI نمیرسد.

مدل Scout

نقاط قوت Scout در کارهایی مانند خلاصه‌سازی اسناد و استدلال بر روی پایگاه‌های کد بزرگ است. ویژگی منحصر به فرد آن این است که پنجره زمینه‌ای بسیار بزرگی دارد: 10 میلیون توکن. به زبان ساده، Scout میتواند تصاویر و تا میلیون‌ها کلمه را درک کند، که به آن این امکان را میدهد تا با اسناد بسیار طولانی کار کند. طبق محاسبات متا، Scout میتواند روی یک GPU Nvidia H100 اجرا شود، در حالی که Maverick به یک سیستم Nvidia H100 DGX یا معادل آن نیاز دارد.

مدل Behemoth

مدل Behemoth که هنوز منتشر نشده، به سخت‌افزار قدرتمندتری نیاز دارد. طبق گفته‌ شرکت، Behemoth دارای 288 میلیارد پارامتر فعال، 16 متخصص و نزدیک به دو تریلیون پارامتر کل است. ارزیابی‌های داخلی متا نشان داده‌اند که Behemoth در مقایسه با جی پی تی 4.5، Claude 3.7 Sonnet و Gemini 2.0 Pro (اما نه 2.5 Pro) در ارزیابی‌های متعدد مهارت‌های STEM مانند حل مسائل ریاضی عملکرد بهتری دارد.

قابل توجه است که هیچ‌یک از مدل‌های Llama 4 مدل استدلال به معنای مدل‌های OpenAI مانند o1 و o3-mini نیستند. مدل‌های استدلال به صحت پاسخ‌های خود بررسی میکنند و معمولاً به سوالات با دقت بیشتری پاسخ میدهند، اما به همین دلیل زمان بیشتری برای ارائه پاسخ نسبت به مدل‌های غیر استدلالی میبرند.

جالب است که متا میگوید تمامی مدل‌های Llama 4 خود را تنظیم کرده است تا به سوالات چالش‌برانگیز پاسخ ندهند. طبق گفته‌ شرکت، Llama 4 به موضوعات سیاسی و اجتماعی بحث‌برانگیز که مدل‌های قبلی Llama به آن‌ها پاسخ نمیدادند، پاسخ میدهد. علاوه بر این، شرکت میگوید که Llama 4 بسیار متعادل‌تر شده است در انتخاب موضوعاتی که به طور کلی از آن‌ها اجتناب میکند.

در واقعیت، تعصب در هوش مصنوعی یک مشکل فنی غیرقابل حل است. شرکت هوش مصنوعی ماسک، xAI، در تلاش بوده تا ربات چتی ایجاد کند که دیدگاه‌های سیاسی خاصی را نسبت به دیگران تایید نکند. این موضوع نتواسته مانع از آن شود که شرکت‌هایی مانند OpenAI مدل‌های هوش مصنوعی خود را برای پاسخگویی به سوالات بیشتری نسبت به گذشته، به ویژه سوالات مربوط به موضوعات بحث‌برانگیز، تنظیم کنند.

انتشار Llama 4 توسط متا

کلام آخر

مدل‌های جدید Llama 4 از متا به‌ ویژه در زمینه‌های مختلف هوش مصنوعی، از جمله پردازش داده‌های چندوجهی و استدلال، پیشرفت‌های چشمگیری را نشان میدهند. این مدل‌ها با استفاده از معماری ترکیب متخصصان (MoE) کارآمدتر به نظر میرسند و توانسته‌اند در برخی معیارهای عملکردی بهتر از مدل‌های مشابه مانند GPT-4o و Gemini 2.0 عمل کنند.

در حالی که مدل‌های Llama 4 به وضوح بر روی توانمندی‌های پردازش داده‌های حجیم و پاسخ‌دهی به سوالات پیچیده تمرکز دارند، همچنان با چالش‌هایی همچون تعصب در هوش مصنوعی مواجه هستند که باعث میشود برخی از دیدگاه‌های سیاسی و اجتماعی را نادیده بگیرند. این مدل‌ها به دلیل قابلیت‌های نوین خود در پردازش اطلاعات و پاسخ‌دهی به سوالات پیچیده، به‌ ویژه در مسائل STEM، برای صنایع و پژوهشگران حوزه هوش مصنوعی پتانسیل زیادی دارند.