خدمات سایت


متن کامل خبر

دقت تشخیص گفتار مایکروسافت به اندازه انسان است

آرشیو
پس از 25 سال تلاش، اینک سیستم تشخیص گفتار مایکروسافت (Microsoft Speech Recognition) به اندازه یک انسان واقعی دقیق شده است. به گفته محققان، هدف بعدی به جای تشخیص، درک مکالمه توسط این سیستم است
1396/06/01 10:09:55 ق.ظ

محققان مایکروسافت 25 سال مشغول ساخت یک تکنولوژی فوق‌العاده مهم برای بشریت بوده‌اند. سیستم تشخیص گفتار مایکروسافت ظاهرا پس از مدت‌ها آزمون و خطا موفق شده نرخ خطای بسیار اندک 5.1 درصدی را از خود به جای بگذارد. این برای نخستین باری است که سیستم مذکور موفق شده به دقت و صراحت مترجمان حرفه‌ای انسانی عمل کند.

یک سال قبل، تیم تحقیقاتی گفتگو و دیالوگ مایکروسافت اعلام کرد که نرخ خطای سیستم تشخیص گفتار این شرکت به 5.9 درصد رسیده است. این نرخ تقریبا همسان با نرخ اشتباهات انسان‌های عادی بود، اما تداوم کار آن‌ها باعث به دست آمدن نرخ 5.1 درصدی شده است که دیگر نزدیک به گفتگوی گویندگان حرفه‌ای انسانی است.

سوییچ‌برد (Switchboard) بخشی از مکالمه‌های تلفنی ضبط شده است که تیم تحقیقاتی مایکروسافت بیش از 20 سال است که از آن برای آزمون سیستم‌های تشخیص گفتار مورد استفاده قرار می‌دهد. از جمله وظایف این برد می‌توان به بازنویسی مکالمه‌های بین افراد غریبه تحت موضوعات مختلفی نظیر ورزش و سیاست اشاره کرد.

به منظور کاهش میزان خطای سیستم در حدود 12 درصد نسبت به معیارهای سال گذشته، این گروه تحقیقاتی مجموعه‌ای از پیشرفت‌ها را در آکوستیک مبتنی بر شبکه و مدل‌های صوتی گنجانده‌اند. در پس ارتقا کلی تمامی اجزای سیستم نیز افزایش تعداد واژگان مدل از 30.000 کلمه به 165.000 کلمه قرار دارد. مهم‌تر از همه محققان چیزی را ثبت کرده‌اند که «حافظه بلند مدت و کوتاه مدت مبتنی بر هر دوره محاوره» نامیده می‌شود. به عبارت ساده‌تر، این بدان معناست که مدل جدید زبان آن‌ها اجازه می دهد سیستم برای مشخص کردن عباراتی خاص، از کل کمالمه‌های ثبت شده در پیشین استفاده کند. این به سیستم اجازه می‌دهد تا به طور مثال اگر بحثی در زمینه ورزش شکل گرفته بود آن شناسایی کند و ترجمه و شناسایی عبارات تخصصی برای آن عملا بدون مشکل باشد.

این تیم عنوان می‌کند همچنان باید بر روی حوزه تشخیص گفتار کار کرد، چرا که این دستاورد جدید هنوز نمی‌تواند کارهای پیچیده‌تری را نظیر تشخیص گفتار در محیط‌های شلوغ و یا سخنرانی با سرعت بسیار زیاد را انجام دهد. “Xuedong Huang” متخصص فنی مایکروسافت اینگونه توضیح می‌دهد:

علاوه بر این‌ها، ما نه تنها مشغول یاد دادن به کامپیوترها برای بازگویی کلمات هستیم، بلکه سعی داریم به آن‌ها فهمیدن معنی و نیت کلمات را نیز آموزش دهیم. حرکت از تشخیص به سمت فهمیدن گفتمان هدف بزرگ بعدی در این تکنولوژی است.

هدف بعدی سیستم تشخیص گفتار مایکروسافت

سیستم تشخیص گفتار مایکروسافت در حال حاضر در سرویس‌هایی همچون کورتانا و مترجک گفتار (Speech Translator) مورد استفاده قرار می‌گیرد

منبع : گجت نیوز
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • مایکروسافت,
  • MICROSOFT,
  • Microsoft,
  • سیستم تشخیص گفتار,
  • صدا,
  • تشخیص صدا,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




باگ عجیب یوتیوب موزیک صدای کاربران آیفون را درآورد image باگ عجیب یوتیوب موزیک صدای کاربران آیفون را درآورد 1403/02/05

برخی کاربران نسخه‌ی iOS یوتیوب موزیک با باگ آزاردهنده‌ای در این برنامه مواجه شده‌اند.

امتیاز:
تعداد بازدید: 11

مجلس سنای آمریکا سرانجام لایحه «ممنوعیت یا فروش تیک تاک» را تصویب کرد image مجلس سنای آمریکا سرانجام لایحه «ممنوعیت یا فروش تیک تاک» را تصویب کرد 1403/02/05

اکنون «جو بایدن»، رئیس جمهور آمریکا برای قانونی‌شدن لایحه، باید آن را امضا کند و ByteDance یک سال فرصت دارد تا تیک‌تاک را بفروشد.

امتیاز:
تعداد بازدید: 16

در آستانه رونمایی آیپد ایر ۲۰۲۴، موجودی مدل فعلی کاهش یافت image در آستانه رونمایی آیپد ایر ۲۰۲۴، موجودی مدل فعلی کاهش یافت 1403/02/04

موجودی مدل‌های فعلی آیپد در فروشگاه‌های اپل کاهش یافته است تا جای خود را به مدل‌های جدید بدهد.

امتیاز:
تعداد بازدید: 20

مدل آزمایشی بسیار کمیاب GTX 2070 به تصویر کشیده شد image مدل آزمایشی بسیار کمیاب GTX 2070 به تصویر کشیده شد 1403/02/03

یکی از نمونه‌های آزمایشی کارت گرافیک GTX 2070 پس از ۶ سال به نمایش درآمد.

امتیاز:
تعداد بازدید: 36

اسپیکر عرضه‌نشده اپل در دست بسکتبالیست معروف‌ دیده شد image اسپیکر عرضه‌نشده اپل در دست بسکتبالیست معروف‌ دیده شد 1403/02/02

ظاهراً اپل در حال احیای یکی از اسپیکرهای نمادین و معروف برند بیتس است.

امتیاز:
تعداد بازدید: 32

نرم‌افزار گوگل چت احتمالاً به اسلک و مایکروسافت تیمز متصل می‌شود image نرم‌افزار گوگل چت احتمالاً به اسلک و مایکروسافت تیمز متصل می‌شود 1403/02/02

گوگل چت قرار است با نرم‌افزارهای مایکروسافت تیمز و اسلک ارتباط برقرار کند.

امتیاز:
تعداد بازدید: 27

OMODA & JAECOO از اولین ربات بیونیک و Gait-walking جهان رونمایی می‌کند image OMODA & JAECOO از اولین ربات بیونیک و Gait-walking جهان رونمایی می‌کند 1403/02/01

در ۲۵ آوریل و همزمان با نمایشگاه بین المللی خودرو پکن، از سبک جدیدی از هارمونی نوآوری در خانواده سریNew Energy رونمایی خواهد شد، محصولی که می تواند نُت جدیدی در سمفونی "محصول جدید + فن آوری نو+ اکوسیستم پویا" باشد.

امتیاز:
تعداد بازدید: 32

کوتاه‌تر شدن مراحل درخواست خودرو در تپسی image کوتاه‌تر شدن مراحل درخواست خودرو در تپسی 1403/02/01

شرکت تپسی در اولین اقدام خود در سال ۱۴۰۳ از قابلیت جدیدی در مرحله‌ی درخواست خودرو رونمایی کرد.

امتیاز:
تعداد بازدید: 31

پلتفرم جایگزین توییتر، Post News برای همیشه تعطیل خواهد شد image پلتفرم جایگزین توییتر، Post News برای همیشه تعطیل خواهد شد 1403/02/01

«پست‎ نیوز» شبکه‌ای اجتماعی است که بدون نمایش هیچ تبلیغاتی، محتوای پولی نشریه‌هایی ازجمله Business Insider و Wired را در دسترس کاربران قرار می‌دهد.

امتیاز:
تعداد بازدید: 25

پاول دورف: تلگرام احتمالاً تا یک سال دیگر مرز 1 میلیارد کاربر فعال را پشت‌سر می‌گذارد image پاول دورف: تلگرام احتمالاً تا یک سال دیگر مرز 1 میلیارد کاربر فعال را پشت‌سر می‌گذارد 1403/01/29

مدیرعامل تلگرام در مصاحبه‌ای اعلام کرد که تعداد کاربران فعال ماهانه این پیام‌رسان احتمالاً تا یک سال دیگر از مرز 1 میلیارد می‌گذرد.

امتیاز:
تعداد بازدید: 44