باشگاه خبرنگاران جوان علمی پزشکی فناوری

انتشار نسخه‌های اولیه مدل هوش مصنوعی Llama ۳ از سوی متا

نظر دادن

دانلود PDF

۱۱:۴۷ - ۰۴ مرداد ۱۴۰۳

۸۷۸۵۲۰۹

۱۱:۴۷ - ۰۴ مرداد ۱۴۰۳

۸۷۸۵۲۰۹

نظر دادن

دانلود PDF

باشگاه خبرنگاران جوان علمی پزشکی فناوری

انتشار نسخه‌های اولیه مدل هوش مصنوعی Llama ۳ از سوی متا

نظر دادن

دانلود PDF

شرکت متا بزرگ‌ترین نسخه از مدل‌های هوش مصنوعی خود، با نام «Llama ۳» را منتشر کرد.

شرکت متا طی روز‌های اخیر بزرگ‌ترین نسخه از مدل‌های هوش مصنوعی خود، با نام «Llama ۳» را که عمدتاً رایگان هستند، منتشر کرد. این مدل‌ها با مهارت‌های چندزبانه و معیار‌های عملکرد عمومی خود، با مدل‌های پولی شرکت‌هایی مانند «OpenAI» رقابت می‌کنند.

متا، شرکت مادر فیسبوک اعلام که مدل جدید «Llama ۳» می‌تواند به هشت زبان مکالمه کند، کد‌های کامپیوتری با کیفیتی بالاتر بنویسد و مسائل ریاضی پیچیده‌تری را نسبت به نسخه‌های پیشین حل کند.

این مدل با ۴۰۵ میلیارد پارامتر که الگوریتم برای تولید پاسخ به پرسش‌های کاربر در نظر می‌گیرد، از نسخه قبلی که سال گذشته منتشر شد بسیار بزرگ‌تر است؛ اگرچه همچنان از مدل‌های پیشرو ارائه شده توسط رقبا کوچک‌تر است. برای مثال، مدل «GPT ۴» متعلق به شرکت «OpenAI» بیش از ۱،۵ تریلیون پارامتر دارد و آمازون در حال آماده‌سازی مدلی با ۲ تریلیون پارامتر است.

این فناوری، همراه با لاما ۳.۱ قبلی، تحت سیاست استفاده قابل قبول به صورت رایگان در دسترس قرار خواهد گرفت؛ امری که احتمالاً به شرکت‌های دیگر اجازه می‌دهد از آن برای توسعه هوش مصنوعی خود استفاده کنند.

مارک زاکربرگ، مدیرعامل متا اعلام کرد که انتظار دارد مدل‌های لامای بعدی تا سال آینده از رقبای اختصاصی پیشی بگیرند. چت‌بات هوش مصنوعی متا که توسط این مدل‌ها تقویت می‌شود، در مسیر تبدیل شدن به محبوب‌ترین دستیار هوش مصنوعی تا پایان سال ۲۰۲۴ است و هم‌اکنون صد‌ها میلیون نفر از آن استفاده می‌کنند.

بر اساس گزارش‌های منتشر شده، متا فقط بر روی مدل قدرتمند «Llama ۳» با ۴۰۵ میلیارد پارامتر تمرکز نکرده است. این شرکت همچنین نسخه‌های به‌روزشده مدل‌های سبک‌تر با ۸ و ۷۰ میلیارد پارامتر را که اوایل امسال معرفی شده بودند نیز منتشر خواهد کرد.

هر سه مدل جدید دارای قابلیت‌های چندزبانه هستند و می‌توانند درخواست‌های پیچیده‌تر کاربران را به لطف پنجره زمینه (context window) گسترش یافته، مدیریت کنند. به گفته احمد الدحله، مدیر بخش هوش مصنوعی مولد متا، این حافظه گسترش یافته به مدل‌ها اجازه می‌دهد، درخواست‌های چند مرحله‌ای را موثرتر پردازش کنند. بازخورد کاربران، به ویژه در زمینه تولید کد، تأثیر زیادی بر این بهبود داشته است.

الدحله همچنین فاش کرد که تیم او داده‌های تولید شده توسط هوش مصنوعی را در فرآیند آموزش گنجانده است. این رویکرد به طور خاص عملکرد مدل «Llama ۳» را در وظایفی مانند حل مسائل ریاضی بهبود بخشیده است.

در حالی که سنجش پیشرفت هوش مصنوعی همچنان چالش‌برانگیز است، نتایج آزمون‌های ارائه شده توسط متا نشان می‌دهد که مدل پرچمدار آنها عملکردی رقابتی دارد و حتی در برخی موارد از «Claude ۳،۵ Sonnet» شرکت آنتروپیک و «GPT-۴ o» شرکت OpenAI پیشی می‌گیرد. این دو مدل به عنوان قدرتمندترین مدل‌های زبانی بزرگ جهان شناخته می‌شوند.

منبع: زاویه