Android

Hvad styrker openai bot, der slår dendi

How Machines Learn

How Machines Learn

Indholdsfortegnelse:

Anonim

Sidste uge blev historien oprettet i rigerne Dota 2 og AI. På The International blev Dendi, en af ​​spillets bedste spillere, slået nådeløst i en 1v1 af en bot to gange i træk. Den pågældende bot blev foretaget af OpenAI, en opstart af Elon Musk.

Nu har du måske nogle spørgsmål. Hvad er Dota? Hvad er OpenAI? Og hvorfor er dette endda vigtigt? Til at begynde med er Dota et gratis-til-spil MOBA-spil, hvor du kontrollerer helte, og dit mål er at ødelægge modstanderne Ancient. Mange Dota-fans går måske over for den sidste sætning, da der er så meget for Dota, så har jeg opsummeret.

Spillet er meget komplekst med en meget stejl indlæringskurve. Jeg var begyndt på en mission for at lære Dota for et stykke tid siden, og det tog mig en uge bare at gennemgå en grundlæggende How To- video, hvor de forklarer spillets strategi, hvad våben, trylleformularer, helte gør, og hvordan man kan miner. Og dette gør hele AI vs Dendi- kampen vigtig, fordi den illustrerer, hvor avanceret AI og ML er blevet. Så lad os se, hvad der driver denne bot og har vi brug for at blive bange for AI-opstand.

Rise Of The Planet Of The AI

AI bliver Skynet er et diskutabelt problem. Elon Musk mener, at hvis det ikke holdes i skak, vil et Skynet- lignende scenario sandsynligvis ske. På den anden side siger Mark Zuckerberg, at AI er ufarlig og ikke vil forårsage Doomsday Scenario. Elon Musk startede OpenAI med dette mål.

For at forhindre misbrug af AI og forskning i AI, som ikke vil vende sig mod os. Og jeg er på hans side.

Men det er ikke det, vi er her for at diskutere. Hovedemnet er at vide, hvad der styrer den bot, der er lavet af OpenAI. For at få en forståelse af det, læste jeg nogle forskningsartikler og blogs om emnet og kontaktede også min ven Anmol Sharma, der er en AI & ML-forsker.

Forstærkningslæring

Dette er navnet på teknologien bag OpenAIs Dota bot. Men inden vi går i dybden, er vi nødt til at forstå, hvordan generel AI, eller specifikt AI i videospil fungerer. AI er en meget bestyrelsesbetegnelse og indeholder mange emner såsom maskinlæring, dyb læring og neurale netværk for at nævne nogle få. For groft at definere AI, kan vi sige, at det er en computers evne til at lære af information og tage beslutninger baseret på dets læring. Jo mere det lærer, desto mere stiger dets rigtighed af beslutning.

Hvordan adskiller det sig fra normale bot?

Bots i almindelige videospil kan se ud som om de er intelligente, men det er ikke en sand form for AI. Næsten alle disse bots i spil er programmeret baseret på indstillet If..Dette..Derpå.. Disse udsagn. De følger bare udsagnene og griber ind på baggrund af betingelserne, der er skrevet i erklæringen.

Ovenfor har jeg vist et meget simpelt eksempel. Udsagn i rigtige spil er meget mere kompliceret med forhold inden for betingelser. Jo mere veldefinerede og detaljerede disse udsagn er, jo mere vil bot synes at være intelligent.

Belønning og straf

I AI-lingo er det, vi kalder bot, kendt som en agent. Målet er at få agenten til at lære, hvad vi vil have den til at lære. Agenten lærer på samme måde som din hund lærer gennem belønninger og straffe. Hver gang agenten begår en fejl, straffes den, og når den foretager den rigtige gæt eller giver korrekt svar, belønnes den. Gennem dette system lærer agenten at knytte de handlinger, som den ikke skal gøre for at undgå straf og udføre handlingen (eller lignende handlinger), som giver belønning.

Hvis du tænker nøje på det, er det ligesom at tage en beslutning baseret på visse betingelser, ligesom algoritmer gør det. Som jeg har vist ovenfor, vil en spilbot, der kommer på en eksplosiv tønde, tage handlinger i henhold til algoritmen. Algoritmer i AI er naturligvis enormt komplekse end dette, hvilket gør hele systemet intelligent.

Når vi kommer til vores OpenAI-bot, lærte det ifølge udviklerne hele spillet i tiden på 2 uger. I løbet af hele 2 uger var det online 24 × 7 og spillede mod en kopi af sig selv. Det er en bemærkelsesværdig milepæl i betragtning af spillets kompleksitet og det faktum, at det kunne slå Dendi.

Hvorfor er der stadig ingen bil uden fører?

Dette var et af det første spørgsmål, der dukkede op i mit sind, da jeg hørte om hele denne begivenhed. Hvis en bot kan lære et sådant spil og træne sig selv til et punkt med at slå topspillere, hvorfor bemandet vi stadig rattet. Og det var det samme spørgsmål, som jeg skød på min ven, Mr. Anmol Sharma, som også har forsket på drivløse biler. Dette var hvad han havde at sige.

I et spil, der er udviklet af et menneske, er antallet af variabler mindre. Plus, hvis agenten (bot) laver en fejl, er den værste straf et rundetab. I den virkelige verden er en fejltagelse døden.

Selvom Dota er et komplekst spil, er de mulige kombinationer af træk, trylleformularer og taktik, selvom de stadig er absurd store, stadig begrænsede. Og fejl er tilladt uden nogen reel straf. Men i tilfælde af en bil uden agent, kan fejl føre til farlige ulykker og endda død.

I den virkelige verden er antallet af variabler, som agenten har til at overvåge, uendelig, og situationer, der opstår på grund af disse variabler, ligesom en anden bil, der pludselig skifter bane, fodgængermusker foran bilen, er også uendelige. Som Jeremy Clarkson udtrykte det, bliver de nødt til at tage moralske og etiske beslutninger, når de er på randen af ​​en øjeblikkelig ulykke (selvom hans teori ikke er gyldig).

Fremtiden

Vi kender allerede menneskelig kontrolleret robot, der udfører iboende operationer. Det næste spring er AI-kontrollerede robotter, der udfører det. Og dette er bare inden for medicinsk område. AI vil helt sikkert være den dominerende nye teknologi i det næste årti på mange områder. Men AI kan også misbruges til ubehagelige formål såsom DDoS-angreb, Ransomware Bots og hacking af andre pc'er eller systemer i virksomheder.

Med hensyn til Dota og andre spil, kan vi forvente at se sådanne intelligente bots også for andre spil, mod hvilke spillere kan træne for at klare sig endnu bedre. Og nævnte jeg, at OpenAI laver en 5v5 på næste års International? Så jeg er i gang med at børste op mine Dota-færdigheder for i det mindste besejre de indbyggede dumme bots. Divine Rapier her kommer jeg!