StarCraft 2 od spoločnosti Blizzard je jeden z titulov, ktoré sa hrávajú na profesionálnej úrovni a po svete sa pravidelne konajú veľké majstrovstvá s výhrami vo výške stoviek tisíc dolárov. Napríklad v Južnej Kórei je populárny asi tak ako futbal v Brazílii.
Ide o stratégiu v reálnom čase, takže hráč sa musí rýchlo rozhodovať, plánovať a reagovať na akcie protivníka. Profesionálni hráči dokážu urobiť až 800 kliknutí za minútu a riadiť desiatky jednotiek s úplne odlišnými atribútmi súčasne. Zjednodušene povedané ako šach na steroidoch – s omnoho viac figúrkami na väčšej šachovnici a bez nároku na čas na rozmyslenie.
Zápas meczi AlphaStar a TLO Zdroj: DeepMind
Je preto až neuveriteľné, že umelá inteligencia dokázala nie iba zmysluplne hrať tento titul. Ale v laboratóriách spoločnosti DeepMind, divízie Googlu zameranej na vývoj AI, v nej porazila dvoch svetových top hráčov. Najprv Daria „TLO“ Wünscha a to rovno 5:0 a o pár dní neskôr ešte skúsenejšieho Grzegorza „MaNa“ Komincza. Jeho skóre bolo rovnaké s tým rozdielom, že v poslednej hre sa mu podarilo získať aspoň jedno víťazstvo. Sú to hráči, ktorí sa tejto hre venujú celé roky, majú za sebou tisíce hodín tréningu a tucty svetových turnajov.
Priebeh decembrových zápasov DeepMind zverejnil práve teraz. Podľa profesionálnych komentátorov mal AlphaStar (takto svoju hernú AI DeepMind nazval) ukážkovo presné a efektívne ťahy, ktoré sa len tak ľahko nevidia. Hoci sú profesionálni hráči rýchli, systém napojený priamo na hru by ju hypoteticky mohol ovládať nekonečne rýchlejšie.
Preto bola na účely testu rýchlosť pokynov AlphaStar nastavená tak, aby ich nebolo viac ako ľudských pokynov či klikov. Stroj mal dokonca o polovicu menej APM (akcie za minútu) než protihráči, boli totiž o toľko efektívnejšie a presnejšie. Vďaka tomu sa AlphaStaru podarilo vyhrať.
Akýsi druh výhody ale AlphaStar aj tak mal. Videl totiž celú (už objavenú a teda odkrytú) hernú plochu, štandardne hráč vidí len jej časť. V zápase sa tým vyrovnala výhoda AI, ktorá nevidí hru tak, ako ľudia. Pracuje so surovými dátami o počte a charaktere jednotiek a s meniacimi sa pixelmi každého jedného záberu.
Ako členovia tímu DeepMind vysvetľujú, ich AI sa učila najprv z pozorovania zápasov profesionálnych hráčov. Aj MaNa a TLO. Potom nechali medzi sebou bojovať dve AI medzi sebou v zjednodušenej verzii mapy, ktorú postupne približovali tej skutočnej. V pavúkovom systéme ako pri športových podujatiach sa tak postupne vyraďovala tá AI, ktorá zápas prehrala. Celkový víťaz tak vzišiel z v prepočte 200 ľudských rokov hrania StarCraftu. Hral ale v zrýchlenom režime, takže mu to trvalo omnoho kratšie.
Počet akcií za minútu mala AI menší, ale o to boli efektívnejšie Zdroj: DeepMind
Nakoniec sa naučil chápať význam hry, rozdeľovanie zdrojov, útočenie, bránenie a zmeny stratégie. Testovací profihráči sa priznali, že ich AlphaStar vyviedol z miery napríklad použitím neštandardného počtu výroby špecifickej jednotky v hre a podobne. Nepomohlo im ani to, že do zápasu prišli s príliš vysokým sebavedomím. Obaja tvrdia, že takého súpera nečakali.
Možno aj preto, lebo doposiaľ sa takáto úroveň komplexného učenia a rozhodovania v oblasti AI ešte nevyskytla. Pred troma rokmi síce projekt DeepMind AlphaGo porazil profesionálov v hraní stolnej hry Go, vlani však nedokázala AI s názvom OpenAI Five prekonať súperov z mäsa a kostí v počítačovej hre Dota 2. Podľa mnohých je od nej StarCraft 2 ešte komplexnejší. AlphaStar sa tak zapíše do dejín ako ďalší veľký krok v oblasti vývoja umelej inteligencie.
Systém učenia sa a vyraďovania Zdroj: DeepMind
Hranie videohier, samozrejme, nie je cieľom projektu AlphaStar. Znalosti z jeho vývoja sú aplikovateľné na mnoho iných oblastí. „Základný problém robenia komplexných predpovedí na veľmi dlhej sekvencii dát je výzvou vo viacerých praktických oblastiach ako napríklad predpoveď počasia, modelovanie klímy, porozumenie jazyka a ďalších. Sme nadšení, že vývoj projektu AlphaStar má potenciál výrazne posunúť vývoj aj v spomínaných oblastiach,“ dodáva Vanesssa Volz z tímu DeepMind.