آنچه خواهید خواند
متا مدلهای جدیدی از خانواده Llama به نام Llama 4 را منتشر کرد
در مجموع چهار مدل جدید وجود دارد: Llama 4 Scout ،Llama 4 Maverick و Llama 4 Behemoth. طبق گفته متا، تمامی این مدلها بر روی مقادیر زیادی از دادههای متنی، تصویری و ویدئویی بدون برچسب آموزش دیدهاند تا فهم بصری گستردهای به دست آورند.
موفقیت مدلهای باز از آزمایشگاه هوش مصنوعی DeepSeek چین که عملکرد آنها مشابه یا بهتر از مدلهای پیشین Llama از متا است، گفته میشود که موجب شد توسعه Llama شتاب بیشتری بگیرد. گزارشها حاکی از آن است که متا اتاقهای جنگی ایجاد کرده است تا نحوه کاهش هزینههای اجرای مدلهایی مانند R1 و V3 توسط DeepSeek را رمزگشایی کند.
مدلهای Scout و Maverick به طور عمومی در Llama.com و از طریق شرکای متا، از جمله پلتفرم توسعهدهندگان هوش مصنوعی Hugging Face، در دسترس هستند، در حالی که مدل Behemoth هنوز در حال آموزش است. متا اعلام کرده که Meta AI، دستیار هوش مصنوعی در اپلیکیشنهایی مانند واتساپ،Messenger و اینستاگرام، به روز شده است تا از Llama 4 در 40 کشور استفاده کند. ویژگیهای چندوجهی فعلاً فقط در ایالات متحده به زبان انگلیسی در دسترس است.
برخی از توسعهدهندگان ممکن است با مجوز Llama 4 مشکل داشته باشند
استفاده یا توزیع مدلها برای افراد و شرکتهای “مستقر” یا دارای “محل اصلی کسبوکار” در اتحادیه اروپا ممنوع است که احتمالاً نتیجه الزامات حکمرانی تحمیل شده توسط قوانین حریم خصوصی دادهها و هوش مصنوعی منطقه است.
در گذشته، متا این قوانین را به عنوان بار اضافهای توصیف کرده است. علاوه بر این، همانند نسخههای قبلی Llama، شرکتهایی که بیش از 700 میلیون کاربر فعال ماهانه دارند باید از متا درخواست مجوز خاصی کنند که متا میتواند آن را به صلاحدید خود اعطا یا رد کند.
متا در یک پست وبلاگ نوشت این مدلهای Llama 4 آغازگر یک دوران جدید برای اکوسیستم Llama هستند. این فقط شروع مجموعه Llama 4 است. متا اعلام کرده است که Llama 4 اولین گروه از مدلهای آن است که از معماری ترکیب متخصصان (MoE) استفاده میکند، که از نظر محاسباتی کارآمدتر برای آموزش و پاسخدهی به سؤالات است. معماریهای MoE به طور کلی وظایف پردازش دادهها را به زیروظایف تقسیم میکنند و سپس آنها را به مدلهای متخصص کوچکتر و تخصصیتر واگذار میکنند.
مدل Maverick
مدل Maverick دارای 400 میلیارد پارامتر کل است، اما تنها 17 میلیارد پارامتر فعال در 128 متخصص دارد. پارامترها به طور تقریبی به مهارتهای حل مسأله مدلها مربوط میشوند. مدل Scout دارای 17 میلیارد پارامتر فعال، 16 متخصص و 109 میلیارد پارامتر کل است.
طبق آزمایشهای داخلی متا، Maverick که شرکت میگوید برای استفادههای عمومی مانند دستیار عمومی و چت بهترین است، در برخی از معیارهای کدنویسی، استدلال، چندزبانه بودن، زمینههای طولانی و تصاویر، از مدلهایی مانند GPT-4o OpenAI و Gemini 2.0 گوگل بهتر عمل میکند. با این حال، Maverick به پای مدلهای قدرتمندتری مانند Gemini 2.5 Pro گوگل، Claude 3.7 Sonnet Anthropic و GPT-4.5 OpenAI نمیرسد.
مدل Scout
نقاط قوت Scout در کارهایی مانند خلاصهسازی اسناد و استدلال بر روی پایگاههای کد بزرگ است. ویژگی منحصر به فرد آن این است که پنجره زمینهای بسیار بزرگی دارد: 10 میلیون توکن. به زبان ساده، Scout میتواند تصاویر و تا میلیونها کلمه را درک کند، که به آن این امکان را میدهد تا با اسناد بسیار طولانی کار کند. طبق محاسبات متا، Scout میتواند روی یک GPU Nvidia H100 اجرا شود، در حالی که Maverick به یک سیستم Nvidia H100 DGX یا معادل آن نیاز دارد.
مدل Behemoth
مدل Behemoth که هنوز منتشر نشده، به سختافزار قدرتمندتری نیاز دارد. طبق گفته شرکت، Behemoth دارای 288 میلیارد پارامتر فعال، 16 متخصص و نزدیک به دو تریلیون پارامتر کل است. ارزیابیهای داخلی متا نشان دادهاند که Behemoth در مقایسه با جی پی تی 4.5، Claude 3.7 Sonnet و Gemini 2.0 Pro (اما نه 2.5 Pro) در ارزیابیهای متعدد مهارتهای STEM مانند حل مسائل ریاضی عملکرد بهتری دارد.
قابل توجه است که هیچیک از مدلهای Llama 4 مدل استدلال به معنای مدلهای OpenAI مانند o1 و o3-mini نیستند. مدلهای استدلال به صحت پاسخهای خود بررسی میکنند و معمولاً به سوالات با دقت بیشتری پاسخ میدهند، اما به همین دلیل زمان بیشتری برای ارائه پاسخ نسبت به مدلهای غیر استدلالی میبرند.
جالب است که متا میگوید تمامی مدلهای Llama 4 خود را تنظیم کرده است تا به سوالات چالشبرانگیز پاسخ ندهند. طبق گفته شرکت، Llama 4 به موضوعات سیاسی و اجتماعی بحثبرانگیز که مدلهای قبلی Llama به آنها پاسخ نمیدادند، پاسخ میدهد. علاوه بر این، شرکت میگوید که Llama 4 بسیار متعادلتر شده است در انتخاب موضوعاتی که به طور کلی از آنها اجتناب میکند.
در واقعیت، تعصب در هوش مصنوعی یک مشکل فنی غیرقابل حل است. شرکت هوش مصنوعی ماسک، xAI، در تلاش بوده تا ربات چتی ایجاد کند که دیدگاههای سیاسی خاصی را نسبت به دیگران تایید نکند. این موضوع نتواسته مانع از آن شود که شرکتهایی مانند OpenAI مدلهای هوش مصنوعی خود را برای پاسخگویی به سوالات بیشتری نسبت به گذشته، به ویژه سوالات مربوط به موضوعات بحثبرانگیز، تنظیم کنند.
کلام آخر
مدلهای جدید Llama 4 از متا به ویژه در زمینههای مختلف هوش مصنوعی، از جمله پردازش دادههای چندوجهی و استدلال، پیشرفتهای چشمگیری را نشان میدهند. این مدلها با استفاده از معماری ترکیب متخصصان (MoE) کارآمدتر به نظر میرسند و توانستهاند در برخی معیارهای عملکردی بهتر از مدلهای مشابه مانند GPT-4o و Gemini 2.0 عمل کنند.
در حالی که مدلهای Llama 4 به وضوح بر روی توانمندیهای پردازش دادههای حجیم و پاسخدهی به سوالات پیچیده تمرکز دارند، همچنان با چالشهایی همچون تعصب در هوش مصنوعی مواجه هستند که باعث میشود برخی از دیدگاههای سیاسی و اجتماعی را نادیده بگیرند. این مدلها به دلیل قابلیتهای نوین خود در پردازش اطلاعات و پاسخدهی به سوالات پیچیده، به ویژه در مسائل STEM، برای صنایع و پژوهشگران حوزه هوش مصنوعی پتانسیل زیادی دارند.





پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!