خدمات سایت


متن کامل خبر

MuZero؛ هوش مصنوعی گوگل با توانایی یادگیری شطرنج و پک من

آرشیو
هوش مصنوعی گوگل به نام MuZero می‌تواند بازی‌های دارای پایان باز و قانون محور را انجام بدهد. این اولین‌بار است که یک هوش مصنوعی توانایی اجرای دو نوع بازی‌ متفاوت دارد.
1399/10/20 11:45:00 ق.ظ

هوش مصنوعی برای اولین‌بار در بازی شطرنج بر انسان غلبه کرد. این بازی دارای بی‌شمار ترکیب احتمالی اما کاملا رام‌شدنی است؛ زیرا با مجموعه‌ای از قوانین محدود می‌شود. الگویتم شطرنج می‌تواند به دانش کاملی از وضعیت بازی برسد و تمام حرکت‌های احتمالی رقیب را حدس بزند. وضعیت بازی را هم می‌توان با نگاه کردن به صفحه ارزیابی کرد.

اما بسیاری از بازی‌‌های دیگر به‌سادگی شطرنج نیستند. اگر تجربه‌ی بازی پک من داشته باشید، متوجه می‌شوید محاسبه‌ی حرکت ایده‌آل با توجه به شکل هزارتو، موقعیت ارواح، موقعیت نواحی مورد نظر برای پاکسازی، دسترسی به جان‌ها و در نهایت دستیابی به بهترین نقشه در صورت اجرای حرکتی غیر منتظره، می‌تواند نتایج فاجعه‌باری به‌دنبال داشته باشد. تاکنون چندین هوش مصنوعی‌ برای اجرای این بازی ساخته شده‌؛ اما روش آن‌ها با پیروزی در بازی شطرنج یا Go کاملا متفاوت است. حالا بخش دیپ‌مایند گوگل در مقاله‌ای به توصیف ساختار نوعی هوش مصنوعی می‌پردازد که قادر است هر دو بازی شطرنج و پک من را اجرا کند و به نتایج خوبی برسد.



اعمال درخت‌ها


الگوریتم‌های شطرنج و Go از روش درختی استفاده می‌کنند؛ الگوریتم در این روش به بررسی تمام شاخه‌های برآمده از عملیات مختلف می‌پردازد. این روش از نظر محاسباتی پرهزینه است و الگوریتم‌ باید قوانین بازی را بداند تا بتواند وضعیت‌های فعلی بازی را با وضعیت‌های آینده‌ی آن تطبیق بدهد.

بازی‌های دیگر نیاز به الگوریتمی دارند که اهمیتی به وضعیت بازی نمی‌دهد. در این بازی‌ها الگوریتم صرفا آنچه می‌بیند (برای مثال موقعیت‌ پیکسل‌های صفحه‌ی نمایش) ارزیابی و سپس بر اساس مشاهدات عمل می‌کند. هیچ مدل داخلی از وضعیت بازی وجود ندارد و فرایند یادگیری شامل محاسبه‌ی واکنش مناسب بر اساس اطلاعات معین است.

بخشی از سیستم جدید دیپ‌مایند به نام MuZero تا اندازه‌ای مشابه هوش مصنوعی آلفازیرو است که خود را در بازی‌های قانون‌محوری مثل شطرنج و Go آموزش می‌دهد؛ با این تفاوت که موزیرو انعطاف بیشتری از آلفازیرو دارد و از قابلیت یادگیری تقویتی مبتنی بر مدل برخوردار است. در چنین سیستمی نرم‌افزار از آنچه در بازی می‌بیند برای ساخت مدل داخلی وضعیت بازی استفاده می‌کند. به این ترتیب هیچ درک پیش‌ساخته‌ای وجود ندارد بلکه هوش مصنوعی در کاربرد اطلاعات از انعطاف بالایی برخوردار است. در یادگیری تقویتی، هوش مصنوعی تشخیص می‌دهد چه زمانی از اطلاعات مدل برای تصمیم‌گیری استفاده کند.



پیش‌بینی‌ها


هدف مدل به‌کاررفته در موزیرو، پیش‌بینی حرکات، از جمله بهترین حرکت ممکن بر اساس وضعیت موجود و وضعیت بازی در نتیجه‌ی حرکت است. پیش‌بینی معمولا بر اساس مدل داخلی وضعیت‌های بازی اجرا می‌شود نه بر اساس نمایش بصری واقعی از بازی مثل موقعیت مهره‌های شطرنج.

به‌طور کلی موزیرو به این صورت عمل می‌کند: سه ارزیابی را به‌صورت موازی اجرا می‌کند: یکی از آن‌ها حرکت بعدی را بر اساس مدل فعلی از وضعیت بازی انتخاب می‌کند؛ ارزیابی دوم به پیش‌بینی وضعیت فعلی نتایج و پاداش فوری حاصل از تفاوت آن‌ها می‌پردازد؛ سومین ارزیابی تجربه‌ی قبلی را برای تصمیم‌گیری در نظر می‌گیرد. هر کدام از این ارزیابی‌ها نتیجه‌ی آموزش است و بر حداقل‌سازی خطای پیش‌بینی‌ها و اتفاق‌های واقعی بازی تمرکز دارد.

موزیرو علاوه بر مهارت در شطرنج و Go، در بازی‌های آتاری هم به برتری رسیده است؛ هدفی که تا قبل از موزیرو به روش متفاوت هوش مصنوعی نیاز داشت. موزیرو در مقایسه با الگوریتم قبلی که از مدل داخلی استفاده نمی‌کند، از میان ۵۷ بازی‌ تست‌شده در ۴۲ بازی امتیاز بالاتر از متوسط کسب کرد. در نتیجه با وجود برخی مشکلات، هم در بازی‌های رقابتی موفق است هم در بازی‌های قانون‌محوری مثل شطرنج و Go. به‌طور کلی موزیرو نشان‌دهنده‌ی پیچیدگی فزاینده‌ی هوش مصنوعی است. سال‌های گذشته هوش مصنوعی صرفا برای یک وظیفه مثل تشخیص گربه‌ای در عکس آموزش داده می‌شد؛ اما امروزه می‌توان ابعاد مختلف هوش مصنوعی را به‌صورت هم‌زمان آموزش داد. در اینجا موزیرو قادر به ایجاد مدلی است که توانایی انتخاب، حرکت و پیش‌بینی پاداش‌های آینده را دارد.

منبع : زومیت
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • هوش مصنوعی,
  • شطرنج,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




ارزش سهام سامسونگ به کمترین حد در ۴ سال اخیر رسید image ارزش سهام سامسونگ به کمترین حد در ۴ سال اخیر رسید 1403/08/23

ارزش سهام سامسونگ در پی افزایش نگرانی‌ مبنی‌بر تعرفه‌های احتمالی دولت جدید آمریکا، افت کم‌سابقه‌ای تجربه کرد.

امتیاز:
تعداد بازدید: 47

اپل می‌خواهد ظرفیت سرویس ماهواره‌ای آیفون را گسترش دهد image اپل می‌خواهد ظرفیت سرویس ماهواره‌ای آیفون را گسترش دهد 1403/08/11

اپل قصد دارد با سرمایه‌گذاری قابل‌توجه ۱٫۵ میلیارد دلاری، ظرفیت خدمات ماهواره‌ای خود را افزایش دهد.

امتیاز:
تعداد بازدید: 57

تاریخچه قهوه عربیکا image تاریخچه قهوه عربیکا 1403/08/10

یکی از محبوب ترین نوشیدنی های جهان قهوه است که بدون شک قهوه ی عربیکا در کل جهان بیشترین مصرف را دارد. قهوه عربیکا یکی از نژاد های اصلی قهوه در دنیا محسوب می شود، و تعداد زیادی از کسانی که از قهوه عربیکا استفاده می کنند ...

امتیاز:
تعداد بازدید: 63

ورود پیجر و واکی‌تاکی به هواپیما ممنوع شد image ورود پیجر و واکی‌تاکی به هواپیما ممنوع شد 1403/07/21

پس از انفجار پیجرها و هشدارهایی درباره واردات این ابزار، ورود وسایل ارتباطی به‌غیر از تلفن همراه به هواپیماهای کشور ممنوع شد.

امتیاز:
تعداد بازدید: 58

فرماندار کالیفرنیا لایحه مهم ایمنی هوش مصنوعی را وتو کرد؛ سنگینی قوانین بر دوش شرکت‌های بزرگ AI image فرماندار کالیفرنیا لایحه مهم ایمنی هوش مصنوعی را وتو کرد؛ سنگینی قوانین بر دوش شرکت‌های بزرگ AI 1403/07/09

فرماندار کالیفرنیا لایحه‌ی مهمی را در حوزه‌ی هوش مصنوعی وتو کرد؛ آیا این تصمیم می‌تواند آینده‌ی هوش مصنوعی را تحت‌تأثیر قرار دهد؟

امتیاز:
تعداد بازدید: 102

۸۹۰۰ دلار؛ جریمه روزانه دسترسی به شبکه اجتماعی ایکس با VPN پس از مسدود شدن در برزیل image ۸۹۰۰ دلار؛ جریمه روزانه دسترسی به شبکه اجتماعی ایکس با VPN پس از مسدود شدن در برزیل 1403/06/10

شبکه‌ی اجتماعی ایکس در برزیل مسدود شد و هرکسی که با VPN به آن دسترسی پیدا کند، روزانه جریمه خواهد شد.

امتیاز:
تعداد بازدید: 98

هکرها می‌توانند با نفوذ به چراغ‌های راهنما، ترافیک مصنوعی ایجاد کنند image هکرها می‌توانند با نفوذ به چراغ‌های راهنما، ترافیک مصنوعی ایجاد کنند 1403/04/31

آسیب‌پذیری که به‌تازگی کشف شده، امکان دستکاری کنترلر چراغ‌های راهنمایی از اینترنت را بدون ورود به سیستم فراهم می‌کند.

امتیاز:
تعداد بازدید: 225

قطعی گسترده سرویس‌های سراسر جهان به‌علت اختلال در خدمات مایکروسافت image قطعی گسترده سرویس‌های سراسر جهان به‌علت اختلال در خدمات مایکروسافت 1403/04/30

هزاران دستگاه ویندوزی در سراسر جهان، امروز هنگام راه‌اندازی با مشکل صفحه آبی مرگ (BSOD) ویندوز مواجه شده‌اند.

امتیاز:
تعداد بازدید: 138

شبکه اجتماعی ایکس از همین هفته لایک‌ها را مخفی می‌کند image شبکه اجتماعی ایکس از همین هفته لایک‌ها را مخفی می‌کند 1403/03/23

با تغییر جدید در ایکس (توییتر سابق)، پست‌هایی که هر کاربر لایک می‌کند از دید سایر کاربران مخفی خواهد ماند.

امتیاز:
تعداد بازدید: 122

دولت ترکیه گوگل را ۱۵ میلیون دلار جریمه کرد image دولت ترکیه گوگل را ۱۵ میلیون دلار جریمه کرد 1403/03/22

شورای رقابت ترکیه از جریمه‌ی گوگل به دلیل پیروی نکردن این شرکت از قوانین مربوط به جست‌وجوی هتل‌ها خبر داد.

امتیاز:
تعداد بازدید: 92