شرکت متا اولین پیشنهادات خود در زمینه هوش مصنوعی را از زمان رشد صنعت تولید هوش مصنوعی در اواخر سال ۲۰۲۲ ارائه کرد. انتظار میرود برنامه تبدیل متن به صدای این برند، به نام Voicebox، معادل صوتی ربات ChatGPT باشد که پیامهای متنی را پردازش میکند.
Voicebox به نوبه خود قادر به دریافت پیامهای متنی و تولیدکلیپهای صوتی خواهد بود.
این برنامه با بیش از ۵۰ هزار ساعت صوت بدون فیلتر، از جمله گفتار و متون حوزه عمومی به زبانهای انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی آموزش داده شده است.
Voicebox مایل به ایجاد نتایج در گفتار مکالمه در انواع زبانهای موجود است. متا همچنین ادعا میکند که مدل آن نسبت به مدلهای دیگر، دارای نرخ خطای یک درصدی است.
به گفته محققان متا، این مدل با پیشبینی بلوکهای گفتار در متن به جای ایجاد یک مجموعه کاری از ابتدا، آموزش داده شده است.
این ابزار همچنین توانایی ویرایش کلیپهای صوتی دارای اعوجاج ناخواسته یا کلمات اشتباه به روشی مشابه با نرم افزارهای ویرایش تصویر ثابت، مانند Adobe Photoshop دارد.
متا اعلام کرد که در حال حاضر قصد ندارد برنامه Voicebox یا کد منبع آن را به دلیل "خطرات احتمالی سوء استفاده" برای عموم منتشر کند.
این در حالی است که اپل به تازگی اولین هدست ویژن پرو خود را معرفی کرده و در حال سرمایه گذاری روی واقعیت مجازی است، اما اپل علاقه خاصی به هوش مصنوعی نشان نداده است.
منبع: الیومالسابع