شرکت متا طی روزهای اخیر بزرگترین نسخه از مدلهای هوش مصنوعی خود، با نام «Llama ۳» را که عمدتاً رایگان هستند، منتشر کرد. این مدلها با مهارتهای چندزبانه و معیارهای عملکرد عمومی خود، با مدلهای پولی شرکتهایی مانند «OpenAI» رقابت میکنند.
متا، شرکت مادر فیسبوک اعلام که مدل جدید «Llama ۳» میتواند به هشت زبان مکالمه کند، کدهای کامپیوتری با کیفیتی بالاتر بنویسد و مسائل ریاضی پیچیدهتری را نسبت به نسخههای پیشین حل کند.
این مدل با ۴۰۵ میلیارد پارامتر که الگوریتم برای تولید پاسخ به پرسشهای کاربر در نظر میگیرد، از نسخه قبلی که سال گذشته منتشر شد بسیار بزرگتر است؛ اگرچه همچنان از مدلهای پیشرو ارائه شده توسط رقبا کوچکتر است. برای مثال، مدل «GPT ۴» متعلق به شرکت «OpenAI» بیش از ۱،۵ تریلیون پارامتر دارد و آمازون در حال آمادهسازی مدلی با ۲ تریلیون پارامتر است.
این فناوری، همراه با لاما ۳.۱ قبلی، تحت سیاست استفاده قابل قبول به صورت رایگان در دسترس قرار خواهد گرفت؛ امری که احتمالاً به شرکتهای دیگر اجازه میدهد از آن برای توسعه هوش مصنوعی خود استفاده کنند.
مارک زاکربرگ، مدیرعامل متا اعلام کرد که انتظار دارد مدلهای لامای بعدی تا سال آینده از رقبای اختصاصی پیشی بگیرند. چتبات هوش مصنوعی متا که توسط این مدلها تقویت میشود، در مسیر تبدیل شدن به محبوبترین دستیار هوش مصنوعی تا پایان سال ۲۰۲۴ است و هماکنون صدها میلیون نفر از آن استفاده میکنند.
بر اساس گزارشهای منتشر شده، متا فقط بر روی مدل قدرتمند «Llama ۳» با ۴۰۵ میلیارد پارامتر تمرکز نکرده است. این شرکت همچنین نسخههای بهروزشده مدلهای سبکتر با ۸ و ۷۰ میلیارد پارامتر را که اوایل امسال معرفی شده بودند نیز منتشر خواهد کرد.
هر سه مدل جدید دارای قابلیتهای چندزبانه هستند و میتوانند درخواستهای پیچیدهتر کاربران را به لطف پنجره زمینه (context window) گسترش یافته، مدیریت کنند. به گفته احمد الدحله، مدیر بخش هوش مصنوعی مولد متا، این حافظه گسترش یافته به مدلها اجازه میدهد، درخواستهای چند مرحلهای را موثرتر پردازش کنند. بازخورد کاربران، به ویژه در زمینه تولید کد، تأثیر زیادی بر این بهبود داشته است.
الدحله همچنین فاش کرد که تیم او دادههای تولید شده توسط هوش مصنوعی را در فرآیند آموزش گنجانده است. این رویکرد به طور خاص عملکرد مدل «Llama ۳» را در وظایفی مانند حل مسائل ریاضی بهبود بخشیده است.
در حالی که سنجش پیشرفت هوش مصنوعی همچنان چالشبرانگیز است، نتایج آزمونهای ارائه شده توسط متا نشان میدهد که مدل پرچمدار آنها عملکردی رقابتی دارد و حتی در برخی موارد از «Claude ۳،۵ Sonnet» شرکت آنتروپیک و «GPT-۴ o» شرکت OpenAI پیشی میگیرد. این دو مدل به عنوان قدرتمندترین مدلهای زبانی بزرگ جهان شناخته میشوند.
منبع: زاویه