خدمات سایت


متن کامل خبر

دقت تشخیص گفتار مایکروسافت به اندازه انسان است

آرشیو
پس از 25 سال تلاش، اینک سیستم تشخیص گفتار مایکروسافت (Microsoft Speech Recognition) به اندازه یک انسان واقعی دقیق شده است. به گفته محققان، هدف بعدی به جای تشخیص، درک مکالمه توسط این سیستم است
1396/06/01 10:09:55 ق.ظ

محققان مایکروسافت 25 سال مشغول ساخت یک تکنولوژی فوق‌العاده مهم برای بشریت بوده‌اند. سیستم تشخیص گفتار مایکروسافت ظاهرا پس از مدت‌ها آزمون و خطا موفق شده نرخ خطای بسیار اندک 5.1 درصدی را از خود به جای بگذارد. این برای نخستین باری است که سیستم مذکور موفق شده به دقت و صراحت مترجمان حرفه‌ای انسانی عمل کند.

یک سال قبل، تیم تحقیقاتی گفتگو و دیالوگ مایکروسافت اعلام کرد که نرخ خطای سیستم تشخیص گفتار این شرکت به 5.9 درصد رسیده است. این نرخ تقریبا همسان با نرخ اشتباهات انسان‌های عادی بود، اما تداوم کار آن‌ها باعث به دست آمدن نرخ 5.1 درصدی شده است که دیگر نزدیک به گفتگوی گویندگان حرفه‌ای انسانی است.

سوییچ‌برد (Switchboard) بخشی از مکالمه‌های تلفنی ضبط شده است که تیم تحقیقاتی مایکروسافت بیش از 20 سال است که از آن برای آزمون سیستم‌های تشخیص گفتار مورد استفاده قرار می‌دهد. از جمله وظایف این برد می‌توان به بازنویسی مکالمه‌های بین افراد غریبه تحت موضوعات مختلفی نظیر ورزش و سیاست اشاره کرد.

به منظور کاهش میزان خطای سیستم در حدود 12 درصد نسبت به معیارهای سال گذشته، این گروه تحقیقاتی مجموعه‌ای از پیشرفت‌ها را در آکوستیک مبتنی بر شبکه و مدل‌های صوتی گنجانده‌اند. در پس ارتقا کلی تمامی اجزای سیستم نیز افزایش تعداد واژگان مدل از 30.000 کلمه به 165.000 کلمه قرار دارد. مهم‌تر از همه محققان چیزی را ثبت کرده‌اند که «حافظه بلند مدت و کوتاه مدت مبتنی بر هر دوره محاوره» نامیده می‌شود. به عبارت ساده‌تر، این بدان معناست که مدل جدید زبان آن‌ها اجازه می دهد سیستم برای مشخص کردن عباراتی خاص، از کل کمالمه‌های ثبت شده در پیشین استفاده کند. این به سیستم اجازه می‌دهد تا به طور مثال اگر بحثی در زمینه ورزش شکل گرفته بود آن شناسایی کند و ترجمه و شناسایی عبارات تخصصی برای آن عملا بدون مشکل باشد.

این تیم عنوان می‌کند همچنان باید بر روی حوزه تشخیص گفتار کار کرد، چرا که این دستاورد جدید هنوز نمی‌تواند کارهای پیچیده‌تری را نظیر تشخیص گفتار در محیط‌های شلوغ و یا سخنرانی با سرعت بسیار زیاد را انجام دهد. “Xuedong Huang” متخصص فنی مایکروسافت اینگونه توضیح می‌دهد:

علاوه بر این‌ها، ما نه تنها مشغول یاد دادن به کامپیوترها برای بازگویی کلمات هستیم، بلکه سعی داریم به آن‌ها فهمیدن معنی و نیت کلمات را نیز آموزش دهیم. حرکت از تشخیص به سمت فهمیدن گفتمان هدف بزرگ بعدی در این تکنولوژی است.

هدف بعدی سیستم تشخیص گفتار مایکروسافت

سیستم تشخیص گفتار مایکروسافت در حال حاضر در سرویس‌هایی همچون کورتانا و مترجک گفتار (Speech Translator) مورد استفاده قرار می‌گیرد

منبع : گجت نیوز
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • مایکروسافت,
  • MICROSOFT,
  • Microsoft,
  • سیستم تشخیص گفتار,
  • صدا,
  • تشخیص صدا,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




OMODA & JAECOO از اولین ربات بیونیک و Gait-walking جهان رونمایی می‌کند image OMODA & JAECOO از اولین ربات بیونیک و Gait-walking جهان رونمایی می‌کند 1403/02/01

در ۲۵ آوریل و همزمان با نمایشگاه بین المللی خودرو پکن، از سبک جدیدی از هارمونی نوآوری در خانواده سریNew Energy رونمایی خواهد شد، محصولی که می تواند نُت جدیدی در سمفونی "محصول جدید + فن آوری نو+ اکوسیستم پویا" باشد.

امتیاز:
تعداد بازدید: 3

کوتاه‌تر شدن مراحل درخواست خودرو در تپسی image کوتاه‌تر شدن مراحل درخواست خودرو در تپسی 1403/02/01

شرکت تپسی در اولین اقدام خود در سال ۱۴۰۳ از قابلیت جدیدی در مرحله‌ی درخواست خودرو رونمایی کرد.

امتیاز:
تعداد بازدید: 5

پلتفرم جایگزین توییتر، Post News برای همیشه تعطیل خواهد شد image پلتفرم جایگزین توییتر، Post News برای همیشه تعطیل خواهد شد 1403/02/01

«پست‎ نیوز» شبکه‌ای اجتماعی است که بدون نمایش هیچ تبلیغاتی، محتوای پولی نشریه‌هایی ازجمله Business Insider و Wired را در دسترس کاربران قرار می‌دهد.

امتیاز:
تعداد بازدید: 4

پاول دورف: تلگرام احتمالاً تا یک سال دیگر مرز 1 میلیارد کاربر فعال را پشت‌سر می‌گذارد image پاول دورف: تلگرام احتمالاً تا یک سال دیگر مرز 1 میلیارد کاربر فعال را پشت‌سر می‌گذارد 1403/01/29

مدیرعامل تلگرام در مصاحبه‌ای اعلام کرد که تعداد کاربران فعال ماهانه این پیام‌رسان احتمالاً تا یک سال دیگر از مرز 1 میلیارد می‌گذرد.

امتیاز:
تعداد بازدید: 30

واتساپ با قابلیتی کاربردی برای مدیریت بهتر چت‌ها آپدیت شد image واتساپ با قابلیتی کاربردی برای مدیریت بهتر چت‌ها آپدیت شد 1403/01/28

واتساپ میزبان قابلیت جدیدی شده است تا بتوانید به‌راحتی هر‌کدام از چت‌ها را پیدا کنید.

امتیاز:
تعداد بازدید: 41

وسترن دیجیتال از حافظه قابل‌حمل 368 ترابایتی رونمایی کرد image وسترن دیجیتال از حافظه قابل‌حمل 368 ترابایتی رونمایی کرد 1403/01/26

این حافظه 368 ترابایتی که داخل جعبه عرضه می‌شود، به یک پردازنده 12 هسته‌ای مجهز شده است و تقریباً 13 کیلوگرم وزن دارد.

امتیاز:
تعداد بازدید: 60

کارمندان تسلا نگران آغاز تعدیل نیرو هستند image کارمندان تسلا نگران آغاز تعدیل نیرو هستند 1403/01/26

شایعات مربوط به اخراج نیروی‌ کار در تسلا، موجی از نگرانی را در میان کارمندان این خودروساز به‌راه انداخته است.

امتیاز:
تعداد بازدید: 54

هیولای رام‌نشدنی انویدیا؛ کارت گرافیک RTX 4090 به ذوب‌ شدن ادامه می‌دهد image هیولای رام‌نشدنی انویدیا؛ کارت گرافیک RTX 4090 به ذوب‌ شدن ادامه می‌دهد 1403/01/26

برخی از مدل‌های کارت‌ گرافیک RTX 4090 انویدیا همچنان از فاجعه‌ی ذوب‌شدن کانکتور پاور رنج می‌برند.

امتیاز:
تعداد بازدید: 40

چرا تانک تی ۹۰ روسیه در باتلاق اوکراین گیر کرده است؟ image چرا تانک تی ۹۰ روسیه در باتلاق اوکراین گیر کرده است؟ 1403/01/25

بسیاری انتظار داشتند که بهترین تانک روسیه یعنی T-14 آرماتا در اوکراین خودنمایی کند. هرچند اینگونه نشد و تانک تی 90 این کشور نیز حسابی در اوکراین با مشکل مواجه شده است.

امتیاز:
تعداد بازدید: 39

تصاویر جدید هندزفری‌های مورد انتظار ناتینگ لو رفت image تصاویر جدید هندزفری‌های مورد انتظار ناتینگ لو رفت 1403/01/25

تصاویر جدید هندزفری‌های آينده‌ی ناتینگ، رنگ‌های مختلف آن‌ها را به‌نمایش می‌گذارند.

امتیاز:
تعداد بازدید: 39