خدمات سایت


متن کامل خبر

MuZero؛ هوش مصنوعی گوگل با توانایی یادگیری شطرنج و پک من

هوش مصنوعی گوگل به نام MuZero می‌تواند بازی‌های دارای پایان باز و قانون محور را انجام بدهد. این اولین‌بار است که یک هوش مصنوعی توانایی اجرای دو نوع بازی‌ متفاوت دارد.
1399/10/20 11:45:00 ق.ظ

هوش مصنوعی برای اولین‌بار در بازی شطرنج بر انسان غلبه کرد. این بازی دارای بی‌شمار ترکیب احتمالی اما کاملا رام‌شدنی است؛ زیرا با مجموعه‌ای از قوانین محدود می‌شود. الگویتم شطرنج می‌تواند به دانش کاملی از وضعیت بازی برسد و تمام حرکت‌های احتمالی رقیب را حدس بزند. وضعیت بازی را هم می‌توان با نگاه کردن به صفحه ارزیابی کرد.

اما بسیاری از بازی‌‌های دیگر به‌سادگی شطرنج نیستند. اگر تجربه‌ی بازی پک من داشته باشید، متوجه می‌شوید محاسبه‌ی حرکت ایده‌آل با توجه به شکل هزارتو، موقعیت ارواح، موقعیت نواحی مورد نظر برای پاکسازی، دسترسی به جان‌ها و در نهایت دستیابی به بهترین نقشه در صورت اجرای حرکتی غیر منتظره، می‌تواند نتایج فاجعه‌باری به‌دنبال داشته باشد. تاکنون چندین هوش مصنوعی‌ برای اجرای این بازی ساخته شده‌؛ اما روش آن‌ها با پیروزی در بازی شطرنج یا Go کاملا متفاوت است. حالا بخش دیپ‌مایند گوگل در مقاله‌ای به توصیف ساختار نوعی هوش مصنوعی می‌پردازد که قادر است هر دو بازی شطرنج و پک من را اجرا کند و به نتایج خوبی برسد.



اعمال درخت‌ها


الگوریتم‌های شطرنج و Go از روش درختی استفاده می‌کنند؛ الگوریتم در این روش به بررسی تمام شاخه‌های برآمده از عملیات مختلف می‌پردازد. این روش از نظر محاسباتی پرهزینه است و الگوریتم‌ باید قوانین بازی را بداند تا بتواند وضعیت‌های فعلی بازی را با وضعیت‌های آینده‌ی آن تطبیق بدهد.

بازی‌های دیگر نیاز به الگوریتمی دارند که اهمیتی به وضعیت بازی نمی‌دهد. در این بازی‌ها الگوریتم صرفا آنچه می‌بیند (برای مثال موقعیت‌ پیکسل‌های صفحه‌ی نمایش) ارزیابی و سپس بر اساس مشاهدات عمل می‌کند. هیچ مدل داخلی از وضعیت بازی وجود ندارد و فرایند یادگیری شامل محاسبه‌ی واکنش مناسب بر اساس اطلاعات معین است.

بخشی از سیستم جدید دیپ‌مایند به نام MuZero تا اندازه‌ای مشابه هوش مصنوعی آلفازیرو است که خود را در بازی‌های قانون‌محوری مثل شطرنج و Go آموزش می‌دهد؛ با این تفاوت که موزیرو انعطاف بیشتری از آلفازیرو دارد و از قابلیت یادگیری تقویتی مبتنی بر مدل برخوردار است. در چنین سیستمی نرم‌افزار از آنچه در بازی می‌بیند برای ساخت مدل داخلی وضعیت بازی استفاده می‌کند. به این ترتیب هیچ درک پیش‌ساخته‌ای وجود ندارد بلکه هوش مصنوعی در کاربرد اطلاعات از انعطاف بالایی برخوردار است. در یادگیری تقویتی، هوش مصنوعی تشخیص می‌دهد چه زمانی از اطلاعات مدل برای تصمیم‌گیری استفاده کند.



پیش‌بینی‌ها


هدف مدل به‌کاررفته در موزیرو، پیش‌بینی حرکات، از جمله بهترین حرکت ممکن بر اساس وضعیت موجود و وضعیت بازی در نتیجه‌ی حرکت است. پیش‌بینی معمولا بر اساس مدل داخلی وضعیت‌های بازی اجرا می‌شود نه بر اساس نمایش بصری واقعی از بازی مثل موقعیت مهره‌های شطرنج.

به‌طور کلی موزیرو به این صورت عمل می‌کند: سه ارزیابی را به‌صورت موازی اجرا می‌کند: یکی از آن‌ها حرکت بعدی را بر اساس مدل فعلی از وضعیت بازی انتخاب می‌کند؛ ارزیابی دوم به پیش‌بینی وضعیت فعلی نتایج و پاداش فوری حاصل از تفاوت آن‌ها می‌پردازد؛ سومین ارزیابی تجربه‌ی قبلی را برای تصمیم‌گیری در نظر می‌گیرد. هر کدام از این ارزیابی‌ها نتیجه‌ی آموزش است و بر حداقل‌سازی خطای پیش‌بینی‌ها و اتفاق‌های واقعی بازی تمرکز دارد.

موزیرو علاوه بر مهارت در شطرنج و Go، در بازی‌های آتاری هم به برتری رسیده است؛ هدفی که تا قبل از موزیرو به روش متفاوت هوش مصنوعی نیاز داشت. موزیرو در مقایسه با الگوریتم قبلی که از مدل داخلی استفاده نمی‌کند، از میان ۵۷ بازی‌ تست‌شده در ۴۲ بازی امتیاز بالاتر از متوسط کسب کرد. در نتیجه با وجود برخی مشکلات، هم در بازی‌های رقابتی موفق است هم در بازی‌های قانون‌محوری مثل شطرنج و Go. به‌طور کلی موزیرو نشان‌دهنده‌ی پیچیدگی فزاینده‌ی هوش مصنوعی است. سال‌های گذشته هوش مصنوعی صرفا برای یک وظیفه مثل تشخیص گربه‌ای در عکس آموزش داده می‌شد؛ اما امروزه می‌توان ابعاد مختلف هوش مصنوعی را به‌صورت هم‌زمان آموزش داد. در اینجا موزیرو قادر به ایجاد مدلی است که توانایی انتخاب، حرکت و پیش‌بینی پاداش‌های آینده را دارد.

منبع : زومیت
به این خبر امتیاز بدهید :
کلمات کلیدی :
  • هوش مصنوعی,
  • شطرنج,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




رییس مرکز ملی فضای مجازی: مدیریت VPN قانونی به زودی در کشور اجرایی می‌شود image رییس مرکز ملی فضای مجازی: مدیریت VPN قانونی به زودی در کشور اجرایی می‌شود 1399/12/17

دبیر شورای عالی فضای مجازی خبر از اجرای طرح مدیریت VPN با هدف طبقه بندی دسترسی کاربران به اینترنت داده و گفته با اجرای این طرح ارائه سرویس با شرایط بهتر اجرایی می‌شود.

امتیاز:
تعداد بازدید: 24

سرخ کن هوشمند شیائومی روانه بازار می شود image سرخ کن هوشمند شیائومی روانه بازار می شود 1399/12/16

سرخ کن هوشمند شیائومی سری MIJIA روانه بازار لوازم خانگی می شود و با 3.5 لیتر ظرفیت در دسترس کاربران و مصرف کنندگان قرار می گیرد. این محصول شیائومی دارای برچسب قیمت 399 یوان (61 دلار) است.

امتیاز:
تعداد بازدید: 37

مشخصات اسنپدراگون ۷۷۵ کوالکام با لیتوگرافی ۵ نانومتری فاش شد image مشخصات اسنپدراگون ۷۷۵ کوالکام با لیتوگرافی ۵ نانومتری فاش شد 1399/12/16

کوالکام چیپست پرچمدار سال ۲۰۲۱ خود را چند ماه پیش معرفی کرد ولی هنوز جانشینی را برای تراشه‌های سری ۷ خود به بازار نفرستاده و اسنپدراگون ۷۶۵ کم‌کم دارد قدیمی می‌شود.

امتیاز:
تعداد بازدید: 38

ارائه سرعت ۱۷۵ مگابیتی اینترنت ماهواره‌ای استارلینک در روستاهای انگلیس image ارائه سرعت ۱۷۵ مگابیتی اینترنت ماهواره‌ای استارلینک در روستاهای انگلیس 1399/12/16

کاربران در مناطق روستایی بسیاری از کشورها به اینترنت پرسرعت دسترسی ندارند که برای مثال می‌توان به بریتانیا اشاره کرد، کشوری که اخیرا بخشی از کاربرانش به اینترنت ماهواره‌ای استارلینک دسترسی پیدا کرده‌اند.

امتیاز:
تعداد بازدید: 26

مانیتور جدید ردمی با پنل ۲۷ اینچی IPS و نرخ نوسازی ۷۵ هرتزی معرفی شد image مانیتور جدید ردمی با پنل ۲۷ اینچی IPS و نرخ نوسازی ۷۵ هرتزی معرفی شد 1399/12/12

ردمی پس از گذشت ماه‌ها از معرفی اولین مانیتور خود با نام ردمی 1A حالا از مانیتور جدیدی با اندازه ۲۷ اینچی رونمایی کرده که پنلی از نوع IPS دارد و از رزولوشن 1080p و نرخ نوسازی ۷۵ هرتزی پشتیبانی می‌کند.

امتیاز:
تعداد بازدید: 95

فیسبوک به دلیل زیر پا گذاشتن حریم شخصی، به پرداخت ۶۵۰ میلیون دلار محکوم شد image فیسبوک به دلیل زیر پا گذاشتن حریم شخصی، به پرداخت ۶۵۰ میلیون دلار محکوم شد 1399/12/11

فیسبوک به دلیل رعایت نکردن حریم شخصی کاربران ایالت ایلینوی آمریکا، به پرداخت ۶۵۰ میلیون دلار جریمه محکوم شد.

امتیاز:
تعداد بازدید: 105

 اینترنت شاد در سال 1400 رایگان خواهد ماند image اینترنت شاد در سال 1400 رایگان خواهد ماند 1399/12/10

نمایندگان مجلس، تعرفه اینترنت پیام‌رسان‌های داخلی مانند شاد، دانشگاه‌ها، مراکز دولتی و ... را در سال آینده رایگان تعیین کردند.

امتیاز:
تعداد بازدید: 58

FDA امکان نگهداری واکسن کرونا فایزر در محیط‌های گرم‌تر را تایید کرد image FDA امکان نگهداری واکسن کرونا فایزر در محیط‌های گرم‌تر را تایید کرد 1399/12/09

واکسن‌های زیادی برای مقابله با کرونا توسعه پیدا کرده‌اند که علاوه بر اثربخشی متفاوت، شرایط نگهداری مختلفی هم دارند.

امتیاز:
تعداد بازدید: 128

جهرمی: فیلتر تلگرام رشد پیام‌رسان‌های داخلی را دچار وقفه کرد image جهرمی: فیلتر تلگرام رشد پیام‌رسان‌های داخلی را دچار وقفه کرد 1399/12/09

وزیر ارتباطات اعلام کرد مانند برخی مدیران پیام‌رسان‌های بومی، معتقد است فیلترینگ تلگرام رشد پیام‌رسان‌های داخلی را با وقفه روبه‌رو کرده است.

امتیاز:
تعداد بازدید: 64