خدمات سایت


متن کامل خبر

هوش مصنوعی Voicebox متا معرفی شد؛ تبدیل متن به صدا و امکان صحبت به زبان‌های خارجی

آرشیو
هوش مصنوعی جدید متا همان توانمندی‌هایی را درزمینه تبدیل متن به صدا ارائه می‌کند که DALL-E درزمینه تولید تصویر دارد.
1402/03/27 11:51:00 ق.ظ

متا حالا از ابزار هوش مصنوعی مولد جدیدی به‌ نام Voicebox رونمایی کرده است که می‌تواند کارهای مختلفی نظیر تبدیل متن به صدا، کاهش نویز و ویرایش صدا را انجام دهد. یکی از ویژگی‌های مهم این مدل دریافت نمونه صوتی از یک زبان و تبدیل آن به زبان‌های خارجی است. این ابزار می‌تواند درزمینه تبدیل متن به صدا همان کاری را انجام دهد که ChatGPT و DALL-E درزمینه تولید متن و تصویر انجام می‌دهند.



هوش مصنوعی Voicebox یک مبدل متن به صداست که متا از آن به‌عنوان «یک مدل هماهنگ‌ساز جریان به‌صورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» یاد می‌کند. این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته و متا به‌طور خاص از صدای کتاب‌های صوتی به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی استفاده کرده است.

ازجمله قابلیت‌های مهم این هوش مصنوعی انتقال سبک گفتاری از یک زبان به زبان‌های خارجی دیگر است. برای استفاده از این قابلیت کافیست نمونه‌ای 2 ثانیه‌ای از صدای خود را به‌همراه یک متن به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی به Voicebox دهید و از هوش مصنوعی بخواهید تا متن را با این زبان‌ها بخواند. این شرکت می‌گوید مدل آن‌ها عملاً می‌تواند هر متنی را از یک زبان به یک زبان دیگر ترجمه کند و شکل گفتاری زبان مقصد را حفظ کند.


مدل هوش مصنوعی متا Voicebox چه قابلیت‌هایی دیگری دارد؟

دامنه وسیع داده‌های ورودی به این سیستم کمک می‌کند تا صداهایی بسازد که از نظر مکالمه‌ای طبیعی‌ترند. متا می‌گوید: «نتایج ما نشان می‌دهد مدل‌های تشخیص گفتاری که روی صداهای ساخته‌شده با Voicebox آموزش داده می‌شوند، تقریباً به‌خوبی مدل‌هایی عمل می‌کنند که با صداهای واقعی تعلیم داده شده باشند.» به‌علاوه، صداهایی که توسط کامپیوتر تولید شدند، فقط با 1 درصد خطای تنزل روبه‌رو بودند، درحالی‌که این نرخ برای سایر مدل‌های تبدیل متن به صدا (TTS) بین 45 تا 70 درصد است.

مدل هوش مصنوعی Voicebox می‌تواند صداها را ویرایش، نویز را از مکالمات حذف و حتی کلماتی را که اشتباه ادا شده باشند، تصحیح کند. محققان متا می‌گویند برای مثال کاربر می‌تواند تشخیص دهد که کدام بخش از فایل صوتی نویز دارد و بعد از هوش مصنوعی بخواهد تا آن بخش را دوباره تولید کند.

مدل Voicebox به‌لطف روش جدید تعلیم متا موسوم به «هماهنگ‌ساز جریان» (Flow Matching) نیازی به حجم بالایی از داده‌های ورودی ندارد. نتایج بنچمارک‌ها نشان می‌دهد که این هوش مصنوعی از نظر بروز خطا بسیار بهتر از بهترین سیستم‌های تبدیل متن به صدا عمل می‌کند (1.9 درصد در مقایسه با 5.9 درصد) و سرعت آن هم تا 20 برابر سریع‌تر است.

بااین‌حال، مدل «ویس‌باکس» یا کد منبع آن در اختیار عموم قرار نمی‌گیرد. متا اذعان کرده است که با توجه به ریسک‌های احتمالی فعلاً قصدی برای عرضه عمومی این مدل ندارد. آن‌ها درحال‌حاضر صرفاً مقاله تحقیقاتی مقدماتی این مدل را منتشر کرده‌اند، اما امیدوارند که در آینده بتوانند از این فناوری برای کمک به افرادی که تارهای صوتی‌شان دچار مشکل شده است، NPCهای درون بازی‌ها و دستیارهای صوتی استفاده کنند.

منبع : دیجیاتو
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • Voicebox,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




مدیران سابق شیائومی برند جدید Lumio را معرفی کردند image مدیران سابق شیائومی برند جدید Lumio را معرفی کردند 1403/12/10

Lumio با حمایت مدیران پیشین شیائومی و فلیپکارت وارد هند شد.

امتیاز:
تعداد بازدید: 207

عینک هوشمند تکنو با پشتیبانی از AI رونمایی شد image عینک هوشمند تکنو با پشتیبانی از AI رونمایی شد 1403/12/10

عینک‌های هوشمند جدید تکنو در دو نسخه‌ی استاندارد و پرو با ویژگی‌های هوش مصنوعی پیشرفته از راه رسیدند.

امتیاز:
تعداد بازدید: 239

مارک گرمن: مدل‌های جدید مک‌بوک ایر با تراشه M4 تا فروردین معرفی می‌شوند image مارک گرمن: مدل‌های جدید مک‌بوک ایر با تراشه M4 تا فروردین معرفی می‌شوند 1403/11/29

مدل‌های جدید مک‌بوک ایر با چیپ M4 مارس 2025 معرفی می‌شوند و قرار است ویژگی‌های تازه‌ای ارائه دهند.

امتیاز:
تعداد بازدید: 294

بنیان‌گذار Alibaba در جلسه‌ای با رئیس جمهور چین حاضر شد؛ نشانه‌ای برای تغییر سیاست‌ها؟ image بنیان‌گذار Alibaba در جلسه‌ای با رئیس جمهور چین حاضر شد؛ نشانه‌ای برای تغییر سیاست‌ها؟ 1403/11/29

«جک ما»، بنیان‌گذار علی‌بابا که در گذشته با برخورد تند دولت چین مواجه شده بود، ظاهراً دوباره برای فعالیت چراغ سبز دریافت کرده است.

امتیاز:
تعداد بازدید: 294

مایکروسافت پشتیبانی از پردازنده‌های نسل ۱۰ اینتل را در ویندوز Windows 11 24H2 کنار گذاشت؛ پایانی بر عصر کامت‌لیک image مایکروسافت پشتیبانی از پردازنده‌های نسل ۱۰ اینتل را در ویندوز Windows 11 24H2 کنار گذاشت؛ پایانی بر عصر کامت‌لیک 1403/11/28

مایکروسافت به‌منظور تمرکز بر مسائل امنیتی و پایداری، پشتیبانی از پردازنده‌های نسل‌های ۸، ۹ و ۱۰ اینتل را در جدیدترین نسخه ویندوز ۱۱ متوقف کرد.

امتیاز:
تعداد بازدید: 293

پلیس فتا: انتشار آگهی وام در دیوار و شیپور ممنوع است image پلیس فتا: انتشار آگهی وام در دیوار و شیپور ممنوع است 1403/11/28

بر اساس قوانین و مقررات بانکی، تبلیغات و فعالیت‌های مرتبط با خرید و فروش تسهیلات بانکی ممنوع است.

امتیاز:
تعداد بازدید: 305

فرانسه درباره دستکاری الگوریتم محتوا در شبکه اجتماعی ایکس تحقیق می‌کند image فرانسه درباره دستکاری الگوریتم محتوا در شبکه اجتماعی ایکس تحقیق می‌کند 1403/11/20

فرانسه تحقیقاتی درباره دستکاری الگوریتم‌های ایکس آغاز کرده است تا احتمال سوگیری در ترویج محتوا را بررسی کند.

امتیاز:
تعداد بازدید: 356

اپل برای تراکنش‌های اپ استور در چند کشور نرخ‌های مالیاتی جدیدی اعلام کرد image اپل برای تراکنش‌های اپ استور در چند کشور نرخ‌های مالیاتی جدیدی اعلام کرد 1403/11/19

همزمان با اعلام تعرفه‌های دولت ترامپ، اپل نیز نرخ‌های مالیاتی اپ استور را در چند کشور افزایش داده است.

امتیاز:
تعداد بازدید: 341

شکایت والدین بریتانیایی از تیک‌تاک به‌خاطر چالشی که منجر به مرگ فرزندان آنها شده است image شکایت والدین بریتانیایی از تیک‌تاک به‌خاطر چالشی که منجر به مرگ فرزندان آنها شده است 1403/11/19

در این شکایت گفته شده که این چهار نوجوان هنگام تلاش برای انجام چالش به اصطلاح «بیهوشی» (blackout) جان خود را از دست داده‌اند.

امتیاز:
تعداد بازدید: 344

نرم‌افزار Invites اپل اولین آپدیتش را دریافت کرد image نرم‌افزار Invites اپل اولین آپدیتش را دریافت کرد 1403/11/18

اپلیکیشن جدید Invites اپل، مدت کوتاهی پس از انتشار، آپدیت جدیدی دریافت کرد.

امتیاز:
تعداد بازدید: 108