هوش مصنوعی در یک زمین بازی که یک محیط وسیع مملو از بازیهای مختلف به نام "ایکسلند"(XLand) است، آموزش میبیند تا قادر به انجام چندین کار مختلف و بازیهای مختلف به صورت همزمان باشد.
هوش مصنوعی(AI) در حال حاضر بهترین بازیکنان جهان در بازیهای مختلفی نظیر شطرنج را شکست داده است. اکنون شرکت “دیپمایند”(DeepMind) در حال آموزش سیستمهایی است که بتوانند بازیهای مختلف را بدون نیاز به دادههای تجربی حاصل از بازی و تعامل با انسان انجام دهند.
در وبسایت این شرکت آمده است: ما یک محیط بازی وسیع ایجاد کردیم که آن را “XLand” مینامیم و شامل بسیاری از بازیهای چند نفره در جهانهای سه بعدی سازگار و قابل ارتباط با انسان است. این محیط امکان تدوین الگوریتمهای یادگیری جدیدی را فراهم میکند که به طور پویا نحوه تمرین یک عامل و بازیهایی را که در آن تمرین میکند، کنترل میکند.
در ادامه آمده است: قابلیتهای هوش مصنوعی به طور مکرر به عنوان واکنشی در مقابل چالشهایی که در آموزش ایجاد میشود، بهبود مییابد و فرآیند یادگیری به طور مداوم وظایف آموزشی را بهبود میبخشد. بنابراین یادگیری متوقف نمیشود. در نتیجه یک هوش مصنوعی با توانایی موفقیت در طیف گستردهای از وظایف حاصل میشود که از پس مشکلات ساده گرفته تا بازیهای پیچیده به خوبی برمیآید.
اما این کار برای هوش مصنوعی چه معنایی دارد؟ این بدان معناست که میتوان عوامل جدیدی را ایجاد کرد که رفتارهایی را نشان دهند که به طور گسترده در بسیاری از وظایف کاربرد دارند و تنها به یک وظیفه محدود نیستند، به این معنی که آنها میتوانند به سرعت با محیطهای دائماً در حال تغییر سازگار شوند.
با این سیستم باید با مساله کمبود دادههای آموزشی خداحافظی کرد و به سیستمهایی که خودشان به تنهایی میآموزند و یادگیری تقویتی را دوباره تعریف میکنند، سلام کرد.
اما “دیپمایند” چگونه به این مهم دست یافت؟ این شرکت وظایف پویایی را ایجاد کرد که نه خیلی سخت بود و نه خیلی آسان و فقط برای آموزش مناسب بود. سپس از آموزش مبتنی بر جمعیت(PBT) برای تنظیم پارامترهای ایجاد وظیفه پویا بر اساس آمادگی که هدف آن بهبود توانایی هوش مصنوعی است، استفاده کردیم. در نهایت نیز چندین تمرین آموزشی را با هم به صورت زنجیرهای درمیآورد تا هر نسل از هوش مصنوعی بتواند در آن بیاموزد.
منبع: خبرگزاری دانشجویان ایران