خدمات سایت


متن کامل خبر

MuZero؛ هوش مصنوعی گوگل با توانایی یادگیری شطرنج و پک من

آرشیو
هوش مصنوعی گوگل به نام MuZero می‌تواند بازی‌های دارای پایان باز و قانون محور را انجام بدهد. این اولین‌بار است که یک هوش مصنوعی توانایی اجرای دو نوع بازی‌ متفاوت دارد.
1399/10/20 11:45:00 ق.ظ

هوش مصنوعی برای اولین‌بار در بازی شطرنج بر انسان غلبه کرد. این بازی دارای بی‌شمار ترکیب احتمالی اما کاملا رام‌شدنی است؛ زیرا با مجموعه‌ای از قوانین محدود می‌شود. الگویتم شطرنج می‌تواند به دانش کاملی از وضعیت بازی برسد و تمام حرکت‌های احتمالی رقیب را حدس بزند. وضعیت بازی را هم می‌توان با نگاه کردن به صفحه ارزیابی کرد.

اما بسیاری از بازی‌‌های دیگر به‌سادگی شطرنج نیستند. اگر تجربه‌ی بازی پک من داشته باشید، متوجه می‌شوید محاسبه‌ی حرکت ایده‌آل با توجه به شکل هزارتو، موقعیت ارواح، موقعیت نواحی مورد نظر برای پاکسازی، دسترسی به جان‌ها و در نهایت دستیابی به بهترین نقشه در صورت اجرای حرکتی غیر منتظره، می‌تواند نتایج فاجعه‌باری به‌دنبال داشته باشد. تاکنون چندین هوش مصنوعی‌ برای اجرای این بازی ساخته شده‌؛ اما روش آن‌ها با پیروزی در بازی شطرنج یا Go کاملا متفاوت است. حالا بخش دیپ‌مایند گوگل در مقاله‌ای به توصیف ساختار نوعی هوش مصنوعی می‌پردازد که قادر است هر دو بازی شطرنج و پک من را اجرا کند و به نتایج خوبی برسد.



اعمال درخت‌ها


الگوریتم‌های شطرنج و Go از روش درختی استفاده می‌کنند؛ الگوریتم در این روش به بررسی تمام شاخه‌های برآمده از عملیات مختلف می‌پردازد. این روش از نظر محاسباتی پرهزینه است و الگوریتم‌ باید قوانین بازی را بداند تا بتواند وضعیت‌های فعلی بازی را با وضعیت‌های آینده‌ی آن تطبیق بدهد.

بازی‌های دیگر نیاز به الگوریتمی دارند که اهمیتی به وضعیت بازی نمی‌دهد. در این بازی‌ها الگوریتم صرفا آنچه می‌بیند (برای مثال موقعیت‌ پیکسل‌های صفحه‌ی نمایش) ارزیابی و سپس بر اساس مشاهدات عمل می‌کند. هیچ مدل داخلی از وضعیت بازی وجود ندارد و فرایند یادگیری شامل محاسبه‌ی واکنش مناسب بر اساس اطلاعات معین است.

بخشی از سیستم جدید دیپ‌مایند به نام MuZero تا اندازه‌ای مشابه هوش مصنوعی آلفازیرو است که خود را در بازی‌های قانون‌محوری مثل شطرنج و Go آموزش می‌دهد؛ با این تفاوت که موزیرو انعطاف بیشتری از آلفازیرو دارد و از قابلیت یادگیری تقویتی مبتنی بر مدل برخوردار است. در چنین سیستمی نرم‌افزار از آنچه در بازی می‌بیند برای ساخت مدل داخلی وضعیت بازی استفاده می‌کند. به این ترتیب هیچ درک پیش‌ساخته‌ای وجود ندارد بلکه هوش مصنوعی در کاربرد اطلاعات از انعطاف بالایی برخوردار است. در یادگیری تقویتی، هوش مصنوعی تشخیص می‌دهد چه زمانی از اطلاعات مدل برای تصمیم‌گیری استفاده کند.



پیش‌بینی‌ها


هدف مدل به‌کاررفته در موزیرو، پیش‌بینی حرکات، از جمله بهترین حرکت ممکن بر اساس وضعیت موجود و وضعیت بازی در نتیجه‌ی حرکت است. پیش‌بینی معمولا بر اساس مدل داخلی وضعیت‌های بازی اجرا می‌شود نه بر اساس نمایش بصری واقعی از بازی مثل موقعیت مهره‌های شطرنج.

به‌طور کلی موزیرو به این صورت عمل می‌کند: سه ارزیابی را به‌صورت موازی اجرا می‌کند: یکی از آن‌ها حرکت بعدی را بر اساس مدل فعلی از وضعیت بازی انتخاب می‌کند؛ ارزیابی دوم به پیش‌بینی وضعیت فعلی نتایج و پاداش فوری حاصل از تفاوت آن‌ها می‌پردازد؛ سومین ارزیابی تجربه‌ی قبلی را برای تصمیم‌گیری در نظر می‌گیرد. هر کدام از این ارزیابی‌ها نتیجه‌ی آموزش است و بر حداقل‌سازی خطای پیش‌بینی‌ها و اتفاق‌های واقعی بازی تمرکز دارد.

موزیرو علاوه بر مهارت در شطرنج و Go، در بازی‌های آتاری هم به برتری رسیده است؛ هدفی که تا قبل از موزیرو به روش متفاوت هوش مصنوعی نیاز داشت. موزیرو در مقایسه با الگوریتم قبلی که از مدل داخلی استفاده نمی‌کند، از میان ۵۷ بازی‌ تست‌شده در ۴۲ بازی امتیاز بالاتر از متوسط کسب کرد. در نتیجه با وجود برخی مشکلات، هم در بازی‌های رقابتی موفق است هم در بازی‌های قانون‌محوری مثل شطرنج و Go. به‌طور کلی موزیرو نشان‌دهنده‌ی پیچیدگی فزاینده‌ی هوش مصنوعی است. سال‌های گذشته هوش مصنوعی صرفا برای یک وظیفه مثل تشخیص گربه‌ای در عکس آموزش داده می‌شد؛ اما امروزه می‌توان ابعاد مختلف هوش مصنوعی را به‌صورت هم‌زمان آموزش داد. در اینجا موزیرو قادر به ایجاد مدلی است که توانایی انتخاب، حرکت و پیش‌بینی پاداش‌های آینده را دارد.

منبع : زومیت
به این خبر امتیاز بدهید :
برچسب های خبر:
کلمات کلیدی :
  • هوش مصنوعی,
  • شطرنج,
هیچ نظری برای این خبر ثبت نشده است! اولین نفری باشید که نظری را ارسال می کند!
Captcha




کلاهبرداری اینترنتی با پوشش قالیشویی در اینستاگرام! image کلاهبرداری اینترنتی با پوشش قالیشویی در اینستاگرام! 1402/12/23

رییس پلیس فتا پایتخت از شناسایی و دستگیری یک کلاهبردار اینستاگرامی که تحت عنوان قالیشویی اقدام به کلاهبرداری از شهروندان می‌کرد، خبر داد.

امتیاز:
تعداد بازدید: 105

مرکز پخش عمده ابزار ساختمانی در کرج image مرکز پخش عمده ابزار ساختمانی در کرج 1402/12/15

یکی از مراکز معتبر پخش ابزار ساختمانی در کرج فروشگاه فتاحیان می‌باشد؛ این فروشگاه به عنوان یکی از بزرگترین مراکز پخش لوازم ساختمانی در کرج و اطراف آن شناخته شده و نمایندگی برندهای معتبری همچون ورتکس، الکترود میکا، آروا و... می‌باشد.

امتیاز:
تعداد بازدید: 55

پیچیده‌ترین ساعت در گران‌ترین خودروی جهان image پیچیده‌ترین ساعت در گران‌ترین خودروی جهان 1402/12/12

در مجموع، بیش از ۸۰۰۰ ساعت زمان برای کار توسعه جزئیات چوبی صرف شده است. در حالی که این کار در حال انجام بود، تیم دیگری پنج ماه را صرف مونتاژ پیچیده‌ترین صفحه ساعتی که تا به حال روی یک رولزرویس نصب شده، کرد!

امتیاز:
تعداد بازدید: 47

اولین کامپیوتر شخصی تاریخ هنگام تمیز کردن یک خانه کشف شد image اولین کامپیوتر شخصی تاریخ هنگام تمیز کردن یک خانه کشف شد 1402/12/01

دو کامپیوتر شخصی رومیزی بسیار کمیاب با پردازنده‌ی ۸۰۰۸ اینتل هنگام تمیز کردن یک خانه کشف شدند.

امتیاز:
تعداد بازدید: 56

تویوتا کرولا هیبرید توسط سایپا به کشور وارد شد image تویوتا کرولا هیبرید توسط سایپا به کشور وارد شد 1402/11/23

سایپا که قصد عرضه نسخه هیبرید تویوتا کرولا در بازار تا انتهای امسال را دارد، نمونه‌های اولیه این سدان وارداتی ژاپنی را به ایران آورده است.

امتیاز:
تعداد بازدید: 69

بازگشت اینتل به جایگاه اول؛ سامسونگ دیگر بزرگ‌ترین تراشه‌ساز جهان نیست image بازگشت اینتل به جایگاه اول؛ سامسونگ دیگر بزرگ‌ترین تراشه‌ساز جهان نیست 1402/11/09

درآمد سامسونگ در بخش تراشه‌های خود از 70.2 میلیارد دلار در سال 2022 به 43.4 میلیارد دلار در سال 2023 کاهش یافته است.

امتیاز:
تعداد بازدید: 163

دستورالعمل مقابله با کلاهبرداری از طریق شماره تلفن همراه ابلاغ شد image دستورالعمل مقابله با کلاهبرداری از طریق شماره تلفن همراه ابلاغ شد 1402/11/09

مرکز ملی فضای مجازی دستورالعمل مقابله با کلاهبرداری از طریق شماره تلفن همراه را ابلاغ کرد

امتیاز:
تعداد بازدید: 79

شاتل موبایل به مناسبت روز پدر تا ۷۰ درصد تخفیف برای خرید سیم‌کارت هوشمند و بسته‌های اینترنت ارائه می‌کند image شاتل موبایل به مناسبت روز پدر تا ۷۰ درصد تخفیف برای خرید سیم‌کارت هوشمند و بسته‌های اینترنت ارائه می‌کند 1402/11/04

شاتل موبایل به مناسبت فرارسیدن روز گرامیداشت مقام مرد و پدر، برای خرید سیم‌کارت هوشمند و بسته‌های اینترنت تا ۷۰ درصد تخفیف ارائه می‌کند.

امتیاز:
تعداد بازدید: 89

سم آلتمن به‌دنبال جذب میلیاردها دلار سرمایه برای ساخت تراشه‌های هوش مصنوعی است image سم آلتمن به‌دنبال جذب میلیاردها دلار سرمایه برای ساخت تراشه‌های هوش مصنوعی است 1402/10/30

سم آلتمن می‌خواهد با جذب میلیاردها دلار سرمایه و ساخت تراشه‌های هوش مصنوعی وابستگی خود به انویدیا را کاهش دهد.

امتیاز:
تعداد بازدید: 112

ماشین ظرفشویی ال‌جی به کمک بخار ظروف را تمیز و ضدعفونی می‌کند image ماشین ظرفشویی ال‌جی به کمک بخار ظروف را تمیز و ضدعفونی می‌کند 1402/10/23

ماشین ظرف‌شویی XD3 با قابلیت TrueSteam، بازوی اسپری‌کننده آب چهارگانه و موتوری با قطعات متحرک کمتر، می‌تواند همراه خوبی برای شست‌وشوی ظروف باشد.

امتیاز:
تعداد بازدید: 210