خدمات سایت


متن کامل خبر

MuZero؛ هوش مصنوعی گوگل با توانایی یادگیری شطرنج و پک من

آرشیو
هوش مصنوعی گوگل به نام MuZero می‌تواند بازی‌های دارای پایان باز و قانون محور را انجام بدهد. این اولین‌بار است که یک هوش مصنوعی توانایی اجرای دو نوع بازی‌ متفاوت دارد.
1399/10/20 11:45:00 ق.ظ

هوش مصنوعی برای اولین‌بار در بازی شطرنج بر انسان غلبه کرد. این بازی دارای بی‌شمار ترکیب احتمالی اما کاملا رام‌شدنی است؛ زیرا با مجموعه‌ای از قوانین محدود می‌شود. الگویتم شطرنج می‌تواند به دانش کاملی از وضعیت بازی برسد و تمام حرکت‌های احتمالی رقیب را حدس بزند. وضعیت بازی را هم می‌توان با نگاه کردن به صفحه ارزیابی کرد.

اما بسیاری از بازی‌‌های دیگر به‌سادگی شطرنج نیستند. اگر تجربه‌ی بازی پک من داشته باشید، متوجه می‌شوید محاسبه‌ی حرکت ایده‌آل با توجه به شکل هزارتو، موقعیت ارواح، موقعیت نواحی مورد نظر برای پاکسازی، دسترسی به جان‌ها و در نهایت دستیابی به بهترین نقشه در صورت اجرای حرکتی غیر منتظره، می‌تواند نتایج فاجعه‌باری به‌دنبال داشته باشد. تاکنون چندین هوش مصنوعی‌ برای اجرای این بازی ساخته شده‌؛ اما روش آن‌ها با پیروزی در بازی شطرنج یا Go کاملا متفاوت است. حالا بخش دیپ‌مایند گوگل در مقاله‌ای به توصیف ساختار نوعی هوش مصنوعی می‌پردازد که قادر است هر دو بازی شطرنج و پک من را اجرا کند و به نتایج خوبی برسد.



اعمال درخت‌ها


الگوریتم‌های شطرنج و Go از روش درختی استفاده می‌کنند؛ الگوریتم در این روش به بررسی تمام شاخه‌های برآمده از عملیات مختلف می‌پردازد. این روش از نظر محاسباتی پرهزینه است و الگوریتم‌ باید قوانین بازی را بداند تا بتواند وضعیت‌های فعلی بازی را با وضعیت‌های آینده‌ی آن تطبیق بدهد.

بازی‌های دیگر نیاز به الگوریتمی دارند که اهمیتی به وضعیت بازی نمی‌دهد. در این بازی‌ها الگوریتم صرفا آنچه می‌بیند (برای مثال موقعیت‌ پیکسل‌های صفحه‌ی نمایش) ارزیابی و سپس بر اساس مشاهدات عمل می‌کند. هیچ مدل داخلی از وضعیت بازی وجود ندارد و فرایند یادگیری شامل محاسبه‌ی واکنش مناسب بر اساس اطلاعات معین است.

بخشی از سیستم جدید دیپ‌مایند به نام MuZero تا اندازه‌ای مشابه هوش مصنوعی آلفازیرو است که خود را در بازی‌های قانون‌محوری مثل شطرنج و Go آموزش می‌دهد؛ با این تفاوت که موزیرو انعطاف بیشتری از آلفازیرو دارد و از قابلیت یادگیری تقویتی مبتنی بر مدل برخوردار است. در چنین سیستمی نرم‌افزار از آنچه در بازی می‌بیند برای ساخت مدل داخلی وضعیت بازی استفاده می‌کند. به این ترتیب هیچ درک پیش‌ساخته‌ای وجود ندارد بلکه هوش مصنوعی در کاربرد اطلاعات از انعطاف بالایی برخوردار است. در یادگیری تقویتی، هوش مصنوعی تشخیص می‌دهد چه زمانی از اطلاعات مدل برای تصمیم‌گیری استفاده کند.



پیش‌بینی‌ها


هدف مدل به‌کاررفته در موزیرو، پیش‌بینی حرکات، از جمله بهترین حرکت ممکن بر اساس وضعیت موجود و وضعیت بازی در نتیجه‌ی حرکت است. پیش‌بینی معمولا بر اساس مدل داخلی وضعیت‌های بازی اجرا می‌شود نه بر اساس نمایش بصری واقعی از بازی مثل موقعیت مهره‌های شطرنج.

به‌طور کلی موزیرو به این صورت عمل می‌کند: سه ارزیابی را به‌صورت موازی اجرا می‌کند: یکی از آن‌ها حرکت بعدی را بر اساس مدل فعلی از وضعیت بازی انتخاب می‌کند؛ ارزیابی دوم به پیش‌بینی وضعیت فعلی نتایج و پاداش فوری حاصل از تفاوت آن‌ها می‌پردازد؛ سومین ارزیابی تجربه‌ی قبلی را برای تصمیم‌گیری در نظر می‌گیرد. هر کدام از این ارزیابی‌ها نتیجه‌ی آموزش است و بر حداقل‌سازی خطای پیش‌بینی‌ها و اتفاق‌های واقعی بازی تمرکز دارد.

موزیرو علاوه بر مهارت در شطرنج و Go، در بازی‌های آتاری هم به برتری رسیده است؛ هدفی که تا قبل از موزیرو به روش متفاوت هوش مصنوعی نیاز داشت. موزیرو در مقایسه با الگوریتم قبلی که از مدل داخلی استفاده نمی‌کند، از میان ۵۷ بازی‌ تست‌شده در ۴۲ بازی امتیاز بالاتر از متوسط کسب کرد. در نتیجه با وجود برخی مشکلات، هم در بازی‌های رقابتی موفق است هم در بازی‌های قانون‌محوری مثل شطرنج و Go. به‌طور کلی موزیرو نشان‌دهنده‌ی پیچیدگی فزاینده‌ی هوش مصنوعی است. سال‌های گذشته هوش مصنوعی صرفا برای یک وظیفه مثل تشخیص گربه‌ای در عکس آموزش داده می‌شد؛ اما امروزه می‌توان ابعاد مختلف هوش مصنوعی را به‌صورت هم‌زمان آموزش داد. در اینجا موزیرو قادر به ایجاد مدلی است که توانایی انتخاب، حرکت و پیش‌بینی پاداش‌های آینده را دارد.

منبع : زومیت
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • هوش مصنوعی,
  • شطرنج,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




مدیران سابق شیائومی برند جدید Lumio را معرفی کردند image مدیران سابق شیائومی برند جدید Lumio را معرفی کردند 1403/12/10

Lumio با حمایت مدیران پیشین شیائومی و فلیپکارت وارد هند شد.

امتیاز:
تعداد بازدید: 205

مایکروسافت پشتیبانی از پردازنده‌های نسل ۱۰ اینتل را در ویندوز Windows 11 24H2 کنار گذاشت؛ پایانی بر عصر کامت‌لیک image مایکروسافت پشتیبانی از پردازنده‌های نسل ۱۰ اینتل را در ویندوز Windows 11 24H2 کنار گذاشت؛ پایانی بر عصر کامت‌لیک 1403/11/28

مایکروسافت به‌منظور تمرکز بر مسائل امنیتی و پایداری، پشتیبانی از پردازنده‌های نسل‌های ۸، ۹ و ۱۰ اینتل را در جدیدترین نسخه ویندوز ۱۱ متوقف کرد.

امتیاز:
تعداد بازدید: 289

نرم‌افزار Invites اپل اولین آپدیتش را دریافت کرد image نرم‌افزار Invites اپل اولین آپدیتش را دریافت کرد 1403/11/18

اپلیکیشن جدید Invites اپل، مدت کوتاهی پس از انتشار، آپدیت جدیدی دریافت کرد.

امتیاز:
تعداد بازدید: 108

ایربادهای ورزشی پاوربیتس پرو ۲ اپل یک هفته دیگر با این قابلیت‌ها رونمایی می‌شوند image ایربادهای ورزشی پاوربیتس پرو ۲ اپل یک هفته دیگر با این قابلیت‌ها رونمایی می‌شوند 1403/11/14

فاصله‌ی کمی تا رونمایی هندزفری‌ پاوربیتس پرو ۲ باقی مانده است. این دستگاه همان نسخه‌ی ورزشی ایرپاد پرو اپل به شمار می‌رود.

امتیاز:
تعداد بازدید: 118

مایکروسافت راهنمای دورزدن پیش‌نیازهای نصب ویندوز 11 را از سایت خود حذف کرد image مایکروسافت راهنمای دورزدن پیش‌نیازهای نصب ویندوز 11 را از سایت خود حذف کرد 1403/11/14

به‌ نظر می‌رسد مایکروسافت دیگر نمی‌خواهد کاربران پیش‌نیازهای نصب ویندوز 11 را دور بزنند.

امتیاز:
تعداد بازدید: 122

اعتراض جامعه گیمینگ: فیلتر توییچ برداشته شود image اعتراض جامعه گیمینگ: فیلتر توییچ برداشته شود 1403/11/06

پلتفرم «توییچ» بزرگ‌ترین پلتفرم استریم در جهان شناخته می‌شود ولی بیش از ۲ سال است این پلتفرم در ایران فیلتر شده است.

امتیاز:
تعداد بازدید: 113

تراشه دیمنسیتی ۹۴۰۰ پلاس مدیاتک احتمالاً از هسته اورکلاک‌شده و قدرتمند Cortex-X925 استفاده می‌کند image تراشه دیمنسیتی ۹۴۰۰ پلاس مدیاتک احتمالاً از هسته اورکلاک‌شده و قدرتمند Cortex-X925 استفاده می‌کند 1403/11/01

شرکت مدیاتک احتمالاً در اسفند و فروردین پیش رو تراشه‌ی قدرتمند دیمنسیتی ۹۴۰۰ پلاس را رونمایی می‌کند.

امتیاز:
تعداد بازدید: 275

حمله اپل به متا به دلیل ارائه درخواست‌های غیرمنطقی برای تغییر عملکرد iOS در اتحادیه اروپا image حمله اپل به متا به دلیل ارائه درخواست‌های غیرمنطقی برای تغییر عملکرد iOS در اتحادیه اروپا 1403/09/29

همچنین کمیسیون اروپا بخشی از تحقیقات ضدانحصار خود علیه اپل را منتشر کرده است.

امتیاز:
تعداد بازدید: 419

ارزش سهام سامسونگ به کمترین حد در ۴ سال اخیر رسید image ارزش سهام سامسونگ به کمترین حد در ۴ سال اخیر رسید 1403/08/23

ارزش سهام سامسونگ در پی افزایش نگرانی‌ مبنی‌بر تعرفه‌های احتمالی دولت جدید آمریکا، افت کم‌سابقه‌ای تجربه کرد.

امتیاز:
تعداد بازدید: 240

اپل می‌خواهد ظرفیت سرویس ماهواره‌ای آیفون را گسترش دهد image اپل می‌خواهد ظرفیت سرویس ماهواره‌ای آیفون را گسترش دهد 1403/08/11

اپل قصد دارد با سرمایه‌گذاری قابل‌توجه ۱٫۵ میلیارد دلاری، ظرفیت خدمات ماهواره‌ای خود را افزایش دهد.

امتیاز:
تعداد بازدید: 134