خدمات سایت


متن کامل خبر

دقت تشخیص گفتار مایکروسافت به اندازه انسان است

آرشیو
پس از 25 سال تلاش، اینک سیستم تشخیص گفتار مایکروسافت (Microsoft Speech Recognition) به اندازه یک انسان واقعی دقیق شده است. به گفته محققان، هدف بعدی به جای تشخیص، درک مکالمه توسط این سیستم است
1396/06/01 10:09:55 ق.ظ

محققان مایکروسافت 25 سال مشغول ساخت یک تکنولوژی فوق‌العاده مهم برای بشریت بوده‌اند. سیستم تشخیص گفتار مایکروسافت ظاهرا پس از مدت‌ها آزمون و خطا موفق شده نرخ خطای بسیار اندک 5.1 درصدی را از خود به جای بگذارد. این برای نخستین باری است که سیستم مذکور موفق شده به دقت و صراحت مترجمان حرفه‌ای انسانی عمل کند.

یک سال قبل، تیم تحقیقاتی گفتگو و دیالوگ مایکروسافت اعلام کرد که نرخ خطای سیستم تشخیص گفتار این شرکت به 5.9 درصد رسیده است. این نرخ تقریبا همسان با نرخ اشتباهات انسان‌های عادی بود، اما تداوم کار آن‌ها باعث به دست آمدن نرخ 5.1 درصدی شده است که دیگر نزدیک به گفتگوی گویندگان حرفه‌ای انسانی است.

سوییچ‌برد (Switchboard) بخشی از مکالمه‌های تلفنی ضبط شده است که تیم تحقیقاتی مایکروسافت بیش از 20 سال است که از آن برای آزمون سیستم‌های تشخیص گفتار مورد استفاده قرار می‌دهد. از جمله وظایف این برد می‌توان به بازنویسی مکالمه‌های بین افراد غریبه تحت موضوعات مختلفی نظیر ورزش و سیاست اشاره کرد.

به منظور کاهش میزان خطای سیستم در حدود 12 درصد نسبت به معیارهای سال گذشته، این گروه تحقیقاتی مجموعه‌ای از پیشرفت‌ها را در آکوستیک مبتنی بر شبکه و مدل‌های صوتی گنجانده‌اند. در پس ارتقا کلی تمامی اجزای سیستم نیز افزایش تعداد واژگان مدل از 30.000 کلمه به 165.000 کلمه قرار دارد. مهم‌تر از همه محققان چیزی را ثبت کرده‌اند که «حافظه بلند مدت و کوتاه مدت مبتنی بر هر دوره محاوره» نامیده می‌شود. به عبارت ساده‌تر، این بدان معناست که مدل جدید زبان آن‌ها اجازه می دهد سیستم برای مشخص کردن عباراتی خاص، از کل کمالمه‌های ثبت شده در پیشین استفاده کند. این به سیستم اجازه می‌دهد تا به طور مثال اگر بحثی در زمینه ورزش شکل گرفته بود آن شناسایی کند و ترجمه و شناسایی عبارات تخصصی برای آن عملا بدون مشکل باشد.

این تیم عنوان می‌کند همچنان باید بر روی حوزه تشخیص گفتار کار کرد، چرا که این دستاورد جدید هنوز نمی‌تواند کارهای پیچیده‌تری را نظیر تشخیص گفتار در محیط‌های شلوغ و یا سخنرانی با سرعت بسیار زیاد را انجام دهد. “Xuedong Huang” متخصص فنی مایکروسافت اینگونه توضیح می‌دهد:

علاوه بر این‌ها، ما نه تنها مشغول یاد دادن به کامپیوترها برای بازگویی کلمات هستیم، بلکه سعی داریم به آن‌ها فهمیدن معنی و نیت کلمات را نیز آموزش دهیم. حرکت از تشخیص به سمت فهمیدن گفتمان هدف بزرگ بعدی در این تکنولوژی است.

هدف بعدی سیستم تشخیص گفتار مایکروسافت

سیستم تشخیص گفتار مایکروسافت در حال حاضر در سرویس‌هایی همچون کورتانا و مترجک گفتار (Speech Translator) مورد استفاده قرار می‌گیرد

منبع : گجت نیوز
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • مایکروسافت,
  • MICROSOFT,
  • Microsoft,
  • سیستم تشخیص گفتار,
  • صدا,
  • تشخیص صدا,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




نمایشگاه ایران اکسپو ۲۰۲۴ با حضور ایرانسل آغاز به کار کرد image نمایشگاه ایران اکسپو ۲۰۲۴ با حضور ایرانسل آغاز به کار کرد 1403/02/09

ششمین نمایشگاه توانمندی‌های صادراتی ایران، موسوم به ایران اکسپو ۲۰۲۴ توسط رئیس جمهور افتتاح شد. ایرانسل نیز در این رویداد حضوری پررنگ و جدی دارد.

امتیاز:
تعداد بازدید: 57

عفونت کووید مردی هلندی آن‌قدر طولانی بود که ویروس درون او به گونه‌ای جدید تکامل یافت image عفونت کووید مردی هلندی آن‌قدر طولانی بود که ویروس درون او به گونه‌ای جدید تکامل یافت 1403/02/09

نقص سیستم ایمنی در نهایت باعث شد تا مرد هلندی پس از ماه‌ها مبارزه با کووید-۱۹ و بارها بستری‌شدن در بیمارستان، جان خود را از دست بدهد.

امتیاز:
تعداد بازدید: 58

گوگل خواستار رد شکایت وزارت دادگستری آمریکا علیه کسب‌وکار تبلیغات خود شد image گوگل خواستار رد شکایت وزارت دادگستری آمریکا علیه کسب‌وکار تبلیغات خود شد 1403/02/09

گوگل اعتقاد دارد که وزارت دادگستری شواهدی مبنی بر عملکرد ضدرقابتی کسب‌وکار آن‌ها ارائه نکرده است.

امتیاز:
تعداد بازدید: 60

اپل آیدی شما بی‌دلیل قفل شده است؟ تنها نیستید image اپل آیدی شما بی‌دلیل قفل شده است؟ تنها نیستید 1403/02/08

برخی از کاربران در شبکه‌های اجتماعی می‌گویند که اپل آیدی آن‌ها به‌طور ناگهانی قفل شده است.

امتیاز:
تعداد بازدید: 70

باگ عجیب یوتیوب موزیک صدای کاربران آیفون را درآورد image باگ عجیب یوتیوب موزیک صدای کاربران آیفون را درآورد 1403/02/05

برخی کاربران نسخه‌ی iOS یوتیوب موزیک با باگ آزاردهنده‌ای در این برنامه مواجه شده‌اند.

امتیاز:
تعداد بازدید: 87

مجلس سنای آمریکا سرانجام لایحه «ممنوعیت یا فروش تیک تاک» را تصویب کرد image مجلس سنای آمریکا سرانجام لایحه «ممنوعیت یا فروش تیک تاک» را تصویب کرد 1403/02/05

اکنون «جو بایدن»، رئیس جمهور آمریکا برای قانونی‌شدن لایحه، باید آن را امضا کند و ByteDance یک سال فرصت دارد تا تیک‌تاک را بفروشد.

امتیاز:
تعداد بازدید: 48

در آستانه رونمایی آیپد ایر ۲۰۲۴، موجودی مدل فعلی کاهش یافت image در آستانه رونمایی آیپد ایر ۲۰۲۴، موجودی مدل فعلی کاهش یافت 1403/02/04

موجودی مدل‌های فعلی آیپد در فروشگاه‌های اپل کاهش یافته است تا جای خود را به مدل‌های جدید بدهد.

امتیاز:
تعداد بازدید: 50

مدل آزمایشی بسیار کمیاب GTX 2070 به تصویر کشیده شد image مدل آزمایشی بسیار کمیاب GTX 2070 به تصویر کشیده شد 1403/02/03

یکی از نمونه‌های آزمایشی کارت گرافیک GTX 2070 پس از ۶ سال به نمایش درآمد.

امتیاز:
تعداد بازدید: 55

اسپیکر عرضه‌نشده اپل در دست بسکتبالیست معروف‌ دیده شد image اسپیکر عرضه‌نشده اپل در دست بسکتبالیست معروف‌ دیده شد 1403/02/02

ظاهراً اپل در حال احیای یکی از اسپیکرهای نمادین و معروف برند بیتس است.

امتیاز:
تعداد بازدید: 41

نرم‌افزار گوگل چت احتمالاً به اسلک و مایکروسافت تیمز متصل می‌شود image نرم‌افزار گوگل چت احتمالاً به اسلک و مایکروسافت تیمز متصل می‌شود 1403/02/02

گوگل چت قرار است با نرم‌افزارهای مایکروسافت تیمز و اسلک ارتباط برقرار کند.

امتیاز:
تعداد بازدید: 31