Hvad styrker openai bot, der slår dendi

How Machines Learn

Indholdsfortegnelse:

Rise Of The Planet Of The AI
Forstærkningslæring
Hvordan adskiller det sig fra normale bot?
Belønning og straf
Hvorfor er der stadig ingen bil uden fører?
Fremtiden

Sidste uge blev historien oprettet i rigerne Dota 2 og AI. På The International blev Dendi, en af spillets bedste spillere, slået nådeløst i en 1v1 af en bot to gange i træk. Den pågældende bot blev foretaget af OpenAI, en opstart af Elon Musk.

Nu har du måske nogle spørgsmål. Hvad er Dota? Hvad er OpenAI? Og hvorfor er dette endda vigtigt? Til at begynde med er Dota et gratis-til-spil MOBA-spil, hvor du kontrollerer helte, og dit mål er at ødelægge modstanderne Ancient. Mange Dota-fans går måske over for den sidste sætning, da der er så meget for Dota, så har jeg opsummeret.

Spillet er meget komplekst med en meget stejl indlæringskurve. Jeg var begyndt på en mission for at lære Dota for et stykke tid siden, og det tog mig en uge bare at gennemgå en grundlæggende How To- video, hvor de forklarer spillets strategi, hvad våben, trylleformularer, helte gør, og hvordan man kan miner. Og dette gør hele AI vs Dendi- kampen vigtig, fordi den illustrerer, hvor avanceret AI og ML er blevet. Så lad os se, hvad der driver denne bot og har vi brug for at blive bange for AI-opstand.

Rise Of The Planet Of The AI

AI bliver Skynet er et diskutabelt problem. Elon Musk mener, at hvis det ikke holdes i skak, vil et Skynet- lignende scenario sandsynligvis ske. På den anden side siger Mark Zuckerberg, at AI er ufarlig og ikke vil forårsage Doomsday Scenario. Elon Musk startede OpenAI med dette mål.

For at forhindre misbrug af AI og forskning i AI, som ikke vil vende sig mod os. Og jeg er på hans side.

Men det er ikke det, vi er her for at diskutere. Hovedemnet er at vide, hvad der styrer den bot, der er lavet af OpenAI. For at få en forståelse af det, læste jeg nogle forskningsartikler og blogs om emnet og kontaktede også min ven Anmol Sharma, der er en AI & ML-forsker.

Forstærkningslæring

Dette er navnet på teknologien bag OpenAIs Dota bot. Men inden vi går i dybden, er vi nødt til at forstå, hvordan generel AI, eller specifikt AI i videospil fungerer. AI er en meget bestyrelsesbetegnelse og indeholder mange emner såsom maskinlæring, dyb læring og neurale netværk for at nævne nogle få. For groft at definere AI, kan vi sige, at det er en computers evne til at lære af information og tage beslutninger baseret på dets læring. Jo mere det lærer, desto mere stiger dets rigtighed af beslutning.

Hvordan adskiller det sig fra normale bot?

Bots i almindelige videospil kan se ud som om de er intelligente, men det er ikke en sand form for AI. Næsten alle disse bots i spil er programmeret baseret på indstillet If..Dette..Derpå.. Disse udsagn. De følger bare udsagnene og griber ind på baggrund af betingelserne, der er skrevet i erklæringen.

Ovenfor har jeg vist et meget simpelt eksempel. Udsagn i rigtige spil er meget mere kompliceret med forhold inden for betingelser. Jo mere veldefinerede og detaljerede disse udsagn er, jo mere vil bot synes at være intelligent.

Belønning og straf

I AI-lingo er det, vi kalder bot, kendt som en agent. Målet er at få agenten til at lære, hvad vi vil have den til at lære. Agenten lærer på samme måde som din hund lærer gennem belønninger og straffe. Hver gang agenten begår en fejl, straffes den, og når den foretager den rigtige gæt eller giver korrekt svar, belønnes den. Gennem dette system lærer agenten at knytte de handlinger, som den ikke skal gøre for at undgå straf og udføre handlingen (eller lignende handlinger), som giver belønning.

Hvis du tænker nøje på det, er det ligesom at tage en beslutning baseret på visse betingelser, ligesom algoritmer gør det. Som jeg har vist ovenfor, vil en spilbot, der kommer på en eksplosiv tønde, tage handlinger i henhold til algoritmen. Algoritmer i AI er naturligvis enormt komplekse end dette, hvilket gør hele systemet intelligent.

Når vi kommer til vores OpenAI-bot, lærte det ifølge udviklerne hele spillet i tiden på 2 uger. I løbet af hele 2 uger var det online 24 × 7 og spillede mod en kopi af sig selv. Det er en bemærkelsesværdig milepæl i betragtning af spillets kompleksitet og det faktum, at det kunne slå Dendi.

Hvorfor er der stadig ingen bil uden fører?

Dette var et af det første spørgsmål, der dukkede op i mit sind, da jeg hørte om hele denne begivenhed. Hvis en bot kan lære et sådant spil og træne sig selv til et punkt med at slå topspillere, hvorfor bemandet vi stadig rattet. Og det var det samme spørgsmål, som jeg skød på min ven, Mr. Anmol Sharma, som også har forsket på drivløse biler. Dette var hvad han havde at sige.

I et spil, der er udviklet af et menneske, er antallet af variabler mindre. Plus, hvis agenten (bot) laver en fejl, er den værste straf et rundetab. I den virkelige verden er en fejltagelse døden.

Selvom Dota er et komplekst spil, er de mulige kombinationer af træk, trylleformularer og taktik, selvom de stadig er absurd store, stadig begrænsede. Og fejl er tilladt uden nogen reel straf. Men i tilfælde af en bil uden agent, kan fejl føre til farlige ulykker og endda død.

I den virkelige verden er antallet af variabler, som agenten har til at overvåge, uendelig, og situationer, der opstår på grund af disse variabler, ligesom en anden bil, der pludselig skifter bane, fodgængermusker foran bilen, er også uendelige. Som Jeremy Clarkson udtrykte det, bliver de nødt til at tage moralske og etiske beslutninger, når de er på randen af en øjeblikkelig ulykke (selvom hans teori ikke er gyldig).

Fremtiden

Vi kender allerede menneskelig kontrolleret robot, der udfører iboende operationer. Det næste spring er AI-kontrollerede robotter, der udfører det. Og dette er bare inden for medicinsk område. AI vil helt sikkert være den dominerende nye teknologi i det næste årti på mange områder. Men AI kan også misbruges til ubehagelige formål såsom DDoS-angreb, Ransomware Bots og hacking af andre pc'er eller systemer i virksomheder.

Med hensyn til Dota og andre spil, kan vi forvente at se sådanne intelligente bots også for andre spil, mod hvilke spillere kan træne for at klare sig endnu bedre. Og nævnte jeg, at OpenAI laver en 5v5 på næste års International? Så jeg er i gang med at børste op mine Dota-færdigheder for i det mindste besejre de indbyggede dumme bots. Divine Rapier her kommer jeg!

Vi går næsten ikke ud af en anden sørglig uge for så vidt angår de økonomiske nyheder, hvad med AT & T og Adobe Systems, der deltager i den stadigt voksende liste over virksomheder, der slår job og Research In Motion og avancerede mikroenheder, der gør opmærksom på, at kvartalsomsætning enten ikke når frem til prognoser eller vil falde. Ny malware-målretning til Firefox-brugere var også i nyhederne. En positiv bemærkning var, at tidlige online ferie-sæson shopping var robust. Men der var også en

1. AT & T skal skære 12.000 medarbejdere igennem 2009 og Wall Street Beat: Hardware tager brat af recession: Lad os få de dårligste af de dårlige nyheder ud af vejen først - AT & T vil øge 12.000 medarbejdere fra lønnen gennem næste år, som den reorganiserer. Ordene med afskedigelserne kom samme dag, at Adobe Systems sagde, at det skære 600 job og Advanced Micro Devices advarede om, at dens omsætning i tredje kvartal sandsynligvis vil falde 25 procent i forhold til et år siden. Dagen efter, at R

I sidste uge offentliggjorde en britisk mand han havde fundet den mistede by Atlantis ved hjælp af Google Ocean - den seneste tilføjelse til Google Earth, der indeholder 3D-badeværdier, som lader dig udforske havbunden. Det antydede 'Atlantis' billede er omkring 620 miles ud for den nordvestlige kyst af Afrika og syd for Portugal. Det viser et rektangulært gitter med hvad der ligner vejbaner, der fører væk fra det ved koordinaterne 31 15'15.53N 24 15'30.53W. Ifølge The Telegraph, den avis, der f

Fredagens fund udledte intenst interesse online på trods af den farfetched krav. Mange ridsede deres hoveder undrende, hvad hvis? Efter alt syntes denne undersøiske opdagelse at passe til den placering, Plato havde beskrevet i sine skrifter. Platon sagde, at Atlantis var en massiv ø, der var "større end Libyen og Asien sammen" og ligger i et fjernt punkt i Atlanterhavet ... foran mundingen af søjlerne i Hercules "(Gibraltarstrædet).

Der er en bred vifte af tabletoptioner til at dase og forbløffe shoppere denne feriesæson. Microsoft har en solid konkurrent med sin nuværende Surface-tablet, men den kører det mere begrænsede Windows RT-operativsystem, der blev designet til brug sammen med ARM-baserede processorer. Jeg har allerede undersøgt, hvordan overfladen RT slår iPad, og hvordan iPad slår Surface RT, men hvordan med tabletter, der kører det mere kraftfulde Windows 8 Pro OS?

Samsung Series 7 Slate har en Intel Core i5 processor.

Hvad styrker openai bot, der slår dendi

How Machines Learn

Indholdsfortegnelse:

Rise Of The Planet Of The AI

Forstærkningslæring

Hvordan adskiller det sig fra normale bot?

Belønning og straf

Hvorfor er der stadig ingen bil uden fører?

Fremtiden

Interessante artikler

Bedste programmeringsværktøjer til at undervise børn

3 Bedste GUI-aktiverede USB Image Writer-værktøjer på Linux

10 bedste nyttige Gutenberg blokerer plugins til WordPress

3 flere VoIP- alternativer til Skype

Academix GNU/Linux

Værktøjer til at få adgang til Linux-filsystemet fra Windows

Bedste programmeringsværktøjer til at undervise børn

3 Bedste GUI-aktiverede USB Image Writer-værktøjer på Linux

10 bedste nyttige Gutenberg blokerer plugins til WordPress

Bedste programmeringsværktøjer til at undervise børn

3 Bedste GUI-aktiverede USB Image Writer-værktøjer på Linux

10 bedste nyttige Gutenberg blokerer plugins til WordPress

Hvad styrker openai bot, der slår dendi

How Machines Learn

Indholdsfortegnelse:

Rise Of The Planet Of The AI

Forstærkningslæring

Hvordan adskiller det sig fra normale bot?

Belønning og straf

Hvorfor er der stadig ingen bil uden fører?

Fremtiden

Anbefalede

Interessante artikler