DeepMind Och Google: Kampen För Kontroll Av Konstgjord Intelligens - Alternativ Vy

Innehållsförteckning:

DeepMind Och Google: Kampen För Kontroll Av Konstgjord Intelligens - Alternativ Vy
DeepMind Och Google: Kampen För Kontroll Av Konstgjord Intelligens - Alternativ Vy

Video: DeepMind Och Google: Kampen För Kontroll Av Konstgjord Intelligens - Alternativ Vy

Video: DeepMind Och Google: Kampen För Kontroll Av Konstgjord Intelligens - Alternativ Vy
Video: Why Google's DeepMind Is The Future of AI 2024, April
Anonim

En kväll i augusti 2010 tog en 34-årig Londoner vid namn Demis Hassabis scenen i ett konferensrum i San Francisco Bay Area. När han klättrade upp till pallen med en tråkig gång från en man som försöker kontrollera sina nerver, pressade han sina läppar i ett kort leende och sa: "Nåväl, idag vill jag prata om olika sätt att skapa …". Han slutade, som om han insåg hur högt han förklarade sina ambitioner. Och han sa det: "AGI".

AGI står för General Artificial Intelligence, ett hypotetiskt datorprogram som kan utföra såväl intellektuella uppgifter som en människa eller ännu bättre. AGI kommer att kunna utföra specifika uppgifter, till exempel att känna igen personer på foton eller översätta språk, som för närvarande kan utföra många separata konstgjorda intelligenser i våra telefoner och datorer. De kommer att kunna fortsätta en konversation, spela schack och prata franska samtidigt. De kommer att kunna förstå fysikböcker, skriva romaner, utveckla investeringsstrategier och upprätthålla avslappnad konversation med främlingar. De kommer att övervaka kärnkraftsreaktioner, hantera elnät och trafik och utan problem lyckas med allt annat. AGI kommer att göra att den mest avancerade AI idag ser ut som fickräknare.

Det enda intellektet som för närvarande kan utföra alla dessa uppgifter tillhör människor. Men det mänskliga sinnet begränsas av storleken på skallen som rymmer hjärnan. Kraften begränsas av den lilla mängden energi som kroppen kan ge. Eftersom AGI kommer att köras på datorer kommer det inte att drabbas av dessa begränsningar. Hans intelligens kommer endast att begränsas av antalet tillgängliga processorer. AGI kan börja med att övervaka kärnreaktioner. Men snart nog kommer han att upptäcka nya energikällor och smälta mer fysikarbete per sekund än en person kan på tusen år. Intelligens på mänsklig nivå, stödd av datorns hastighet och skalbarhet, kommer att rädda oss besväret. Hassabis berättade för den brittiska tidningen Observer att han förväntar sig att AGI bland annat kommer att hantera problem som "cancer,klimatförändringar, energi, genomik, makroekonomi och finansiella system."

Konferensen vid vilken Hassabis talade kallades Singularity Summit. Singularitet - den första delen av namnet - avser den mest troliga konsekvensen av uppkomsten av AGI, enligt futurologer. Eftersom AGI kommer att behandla information i hög hastighet, kommer den att bli mycket intelligent mycket snabbt. Snabba självförbättringscykler kommer att leda till en explosion av maskinell intelligens, vilket gör att människor kan sniffa kiseldammet. Eftersom denna framtid enbart bygger på overifierade antaganden antas det nästan religiöst att Singulariteten kommer att visa sig vara antingen utopi eller helvete.

Utifrån anförandernas titlar trodde konferensdeltagarna mer på det första utfallet:”Sinne och hur man bygger det”,”AI mot åldrande”,”Byt ut våra kroppar”,”Ändra gränsen mellan liv och död”. Hassabis tal verkade å andra sidan tråkigt: "En systemisk neurovetenskaplig strategi för att skapa AGI."

Hassabis rusade mellan podiet och skärmen och talade i ett mönster. Han bar en vinröd tröja och en vit knäppt tröja som en skolpojke. Hans lilla status tycktes bara betona hans intelligens. Hittills, förklarade Hassabis, har forskare närmade sig AGI från två sidor. En metod, känd som symbolisk AI, försökte beskriva och programmera alla regler som krävs för ett system som kunde tänka som en människa. Denna metod var populär under 1980- och 1990-talet, men gav inte de önskade resultaten. Hassabis trodde att hjärnans mentala arkitektur var för subtil för att beskrivas på detta sätt.

Ett annat tillvägagångssätt har samlat forskare som försöker digitalt replikera de fysiska nätverk i hjärnan. Det gjorde en viss mening. När allt kommer omkring är hjärnan den mänskliga intelligensens säng. Men dessa forskare var också på fel väg, sa Hassabis. Deras uppgift liknade att skapa en karta över alla stjärnor i universum. Mer djup fokuserade de på fel nivå av hjärnfunktion. Det var som att försöka ta reda på hur Microsoft Excel fungerar genom att hacka in en dator och lära sig hur transistorer interagerar.

Istället erbjöd Hassabis en mellangrund: AGI borde hämta inspiration från de breda sätten på vilket hjärnan bearbetar information, inte från fysiska system eller specifika regler som den gäller för specifika situationer. Med andra ord, han bör fokusera på att förstå hjärnans programvara, inte hårdvaran. Nya tekniker, såsom funktionell magnetisk resonansavbildning (fMRI), som möjliggjorde insikt i hjärnan när den fungerade, antydde att en sådan förståelse var möjlig. Nya studier, sa Hassabis, visar att hjärnan lär sig genom att spela upp sina erfarenheter under sömnen för att avslöja allmänna principer. AI-forskare måste emulera ett sådant system.

Kampanjvideo:

I det nedre högra hörnet av öppningsglaset loggar logotypen i form av en rund blå virvel. De två orden bredvid är tryckta nedan: DeepMind. Det var första gången företaget nämndes offentligt. Hassabis tillbringade över ett år på att försöka få en inbjudan till Singularity-toppmötet. Föreläsningen var hans omslag. I själva verket behövde han en minut med Peter Thiel, Silicon Valley-miljardären som finansierade konferensen. Hassabis ville ha Thiel investering.

Hassabis talade aldrig om varför han behövde Thiels stöd. Men Thiel trodde på AGI ännu mer än Hassabis. Thiel talade vid Singularity-toppmötet 2009 och sa att hans största rädsla för framtiden inte var ett robotuppror. Han var mer orolig för att Singulariteten inte skulle komma snart. Världen behövde ny teknik för att avvärja en ekonomisk nedgång.

DeepMind tog upp två miljoner pund, varav Thiel var 1,4 miljoner. När Google köpte företaget i januari 2014 för $ 600 miljoner, gjorde Thiel och andra tidiga investerare en avkastning på 5 000% på sina investeringar.

För många grundare skulle detta vara ett lyckligt slut. Man kan vila, ta ett steg tillbaka, spendera tid ensam med pengar. För Hassabis var Google-förvärvet bara ytterligare ett steg i hans sökning efter AGI. Han tillbringade större delen av 2013 på att förhandla om villkoren för affären. DeepMind var tvungen att operera separat från sin ägare. Hon behövde få fördelarna med att äga Google, till exempel tillgång till kassaflöde och datorkraft, utan att tappa kontrollen.

Hassabis trodde DeepMind kunde vara en hybrid, med en startmotor, hjärnan från de största universiteten och djupa fickor hos ett av världens mest värdefulla företag. Varje ingrediens var på plats för att påskynda AGI: s ankomst och eliminera orsakerna till mänskligt lidande.

Hu från Herr Hassabis

Demis Hassabis föddes i norra London 1976 till en grekcypriotisk och Singaporean-född kinesisk familj. Han var den äldsta av tre syskon. Hans mor arbetade i det brittiska varuhuset John Lewis, och hans far drev en leksaksaffär. Hassabis själv tog upp schack vid fyra års ålder och tittade på sin far och farbror spela. På några veckor slog han redan vuxna. Vid 13 års ålder blev han världens näst bästa schackspelare i sin ålder. Vid åtta års ålder lärde han sig att programmera på en enkel dator.

Hassabis fick sin högre utbildning 1992, två år före schemat. Fick jobb som videospel-programmerare på Bullfrog Productions. Hassabis skrev Theme Park, där spelare skapar och förvaltar en virtuell nöjespark. Spelet var en stor framgång och sålde 15 miljoner exemplar, vilket skapade en hel genre av simuleringsspel där målet inte var att besegra fienden, utan att optimera funktionen i ett enormt komplext system, till exempel ett företag eller en stad.

Förutom att skapa spel spelade Demis dem bra. Som tonåring sprang han mellan våningarna i brädspelstävlingar, medan han tävlade i dueller av schack, scrabble, poker och backgammon. 1995, medan han studerade datavetenskap vid University of Cambridge, tävlade Hassabis i studentturneringen. Go är ett gammalt strategiskt brädspel som är betydligt svårare än schack. Behärskning måste kräva intuition som förvärvats under många års erfarenhet. Ingen visste om Hassabis någonsin hade spelat Go tidigare.

Först vann Hassabis nybörjarturneringen. Han besegrade sedan vinnaren av de erfarna spelarna, om än med ett handikapp. Charles Matthews, Cambridge go-mästaren som var värd för turneringen, påminner om chocken att förstöras av en 19-årig rookie. Matthews tog Hassabis under sin vinge.

Hassabis intelligens och ambition har alltid varit tydlig i spel. Spel, i sin tur, återskapade sin passion för intelligens. När han såg sin utveckling i schack undrade han om datorer kunde programmeras för att lära sig på samma sätt som han gjorde genom att få erfarenhet. Spel erbjöd en lärande miljö som inte matchades av den verkliga världen. De var strikta och stängda. Eftersom spel är separata från den verkliga världen, kan de övas utan störningar och läras effektivt. Spel påskyndar tiden: spelare skapar ett brottssyndikat på några dagar och slåss på Somme i några minuter.

Sommaren 1997 reste Hassabis till Japan. I maj samma år slog IBMs Deep Blue-dator Garry Kasparov, världens schackmästare. För första gången slog en dator en stormästare. Matchen väckte världen uppmärksamhet och väckte oro över datorns växande kraft och potentiella hot. När Hassabis träffade Masahiko Futszuvera, en japansk brädspelmästare, talade han om planer som skulle kombinera hans intressen i strategispel och artificiell intelligens: en dag skulle han utveckla ett datorprogram för att besegra den största go-spelaren.

Hassabis närmade sig sin karriär metodiskt. "Vid 20 års ålder trodde Hassabis att vissa saker måste vara på plats innan konstgjord intelligens kunde nå den nivå som den behövde," säger Matthews. "Han hade en plan."

1998 grundade han sin egen spelstudio med namnet Elixir. Hassabis fokuserade på ett enormt ambitiöst spel, Republic: The Revolution, en komplex politisk simulering. Några år tidigare, medan han fortfarande var i skolan, hade Hassabis berättat för sin vän Mustafa Suleiman att världen behövde grandios simuleringar för att modellera dess komplexa dynamik och lösa de mest komplexa sociala problemen. Nu försökte han göra det i spelet.

Det var svårare att koda hans ambitioner än väntat. Elixir slutade med att släppa en avskalad version av spelet för att få varma recensioner. Andra spel har misslyckats. I april 2005 stängde Hassabis Elixir. Matthews anser att Hassabis grundade företaget helt enkelt för att få ledarerfarenhet. Hassabis saknade nu bara ett viktigt kompetensområde innan han kunde börja sin strävan att hitta AGI. Han var tvungen att förstå den mänskliga hjärnan.

2005 fick Hassabis sin doktorsexamen i neurovetenskap från University College London. Han publicerade en mycket inflytelserik studie av minne och fantasi. En studie, som sedan har citerats över 1 000 gånger, visade att personer med minnesförlust också har svårt att föreställa sig nya upplevelser, vilket tyder på en koppling mellan att komma ihåg och skapa mentala bilder. Hassabis byggde förståelsen för hjärnan som behövs för att behärska AGI. Mycket av hans arbete kokade ner till en fråga: Hur får och håller den mänskliga hjärnan begrepp och kunskap?

Hassabis etablerade formellt DeepMind den 15 november 2010. Företagets uppdrag var detsamma som det är nu: "lösa intelligensen" och använd det sedan för att lösa allt annat. Som Hassabis berättade om Singularity Summit innebär detta att vi översätter vår förståelse för hur hjärnan utför uppgifter till programvara som kan använda samma metoder för att undervisa.

Hassabis påstår inte på något sätt att vetenskapen helt har förstått det mänskliga sinnet. Planen för att implementera AGI var omöjlig att lära av hundratals neurovetenskapliga studier. Men han tror helt klart att det är fullt möjligt att börja arbeta med AGI på det sätt som tilltalar honom. Men det är också möjligt att hans förtroende trumfer verkligheten. Vi vet fortfarande väldigt lite med säkerhet om hur hjärnan faktiskt fungerar. År 2018 ifrågasatte ett team av australiska forskare Hassabis egna resultat. Naturligtvis är detta bara ett dokument, men det visar att vetenskapen bakom DeepMinds arbete är långt ifrån bevisad.

Suleiman och Shane Legg, en AGI-besatt nyzeeländare som Hassabis också träffade på universitetet, gick med som grundare. Företagets rykte växte snabbt. Hassabis blomstrade. "Det lockar till sig som en magnet", säger Ben Faulkner, före detta chef för Deep Mind. Många rekryter kommer från Europa. Kanske DeepMinds största prestation var att aktivt rekrytera begåvade människor tidigt och behålla de ljusaste och bästa av dem.

En av maskininlärningstekniker som företaget har fokuserat på växte ut från Hassabis dubbla passion för spel och neurovetenskap: förstärkningsinlärning. Ett sådant program är utformat för att samla information om miljön och sedan lära av den och återge hans erfarenhet om och om igen - precis som Hassabis beskrev hjärnaktivitet under sömnen i sin föreläsning på Singularity Summit.

Förstärkningslärande börjar med en ren skiffer. Programmet visas en virtuell miljö som det inte vet något annat än reglerna, till exempel en schacksimulator eller ett videospel. Programmet innehåller minst en komponent känd som ett neuralt nätverk. Det består av lager av beräkningsstrukturer som siktar igenom information för att identifiera specifika funktioner eller strategier. Varje lager utforskar miljön på sin egen abstraktionsnivå. Till att börja med har dessa nätverk minimal framgång, men deras misstag - och detta är viktigt - kodas också i dem. Gradvis blir de smartare och smartare, experimenterar med olika strategier och får belöningar om de lyckas. Om programmet flyttar schackstycket och som ett resultat förlorar spelet kommer det inte att göra ett sådant misstag igen. Mycket av magin med konstgjord intelligens ligger i den hastighet med vilken den upprepar dessa uppgifter.

DeepMinds arbete nådde sin topp 2016 då teamet utvecklade ett artificiellt intelligensprogram som använde förstärkningslärande tillsammans med andra metoder för att spela go. Programmet, som kallas AlphaGo, höjde ögonbrynen efter att ha slått världsmästaren i en femspel i Seoul 2016. Maskinens seger, som sågs av 280 miljoner människor, hände tio år tidigare än maskinerna förutspådde. Året efter besegrade en förbättrad version av AlphaGo den kinesiska Go-mästaren.

Liksom Deep Blue 1997 förändrade AlphaGo uppfattningen om mänsklig prestation. De mänskliga mästarna, planetens lysande sinnen, stod inte längre på toppen av den intellektuella pyramiden. Nästan 20 år efter att Hassabis meddelade sina ambitioner till Fuzuvere, uppfyllde han dem. Hassabis sa att den här matchen tårade honom. Han var tacksam mot Matthews.

DeepBlue vann med brute force och beräkningshastighet, men AlphaGos stil kände konstnärlig, nästan mänsklig. Dess elegans och sofistikerade, beräkningskrafts överlägsenhet tycktes visa att DeepMind var före tävlingen när det gäller att skapa ett program som kunde läka sjukdomar och hantera städer.

DeepMind och artificiell intelligens

Hassabis har alltid sagt att DeepMind kommer att förändra världen till det bättre. Men det finns ingen säkerhet om AGI. Om han någonsin dyker upp, vet vi inte om det kommer att vara till bättre eller sämre, om han kommer att underkasta sig mänsklig kontroll. Om så är fallet, vem kommer att hålla i tyggen?

Från början försökte Hassabis försvara DeepMinds oberoende. Han insisterade alltid på att DeepMind skulle stanna i London. När Google köpte företaget 2014 blev frågan om kontroll mer pressande. Hassabis behövde inte sälja DeepMind till Google. Med tillräckligt med kontanter i handen ritade han fram en affärsmodell där företaget skulle utveckla spel för att finansiera forskning. De lovade mycket pengar på Google, men han ville inte överföra företaget han skapade. Som en del av affären skapade DeepMind ett avtal som skulle hindra Google från att ensidigt ta kontroll över företagets immateriella rättigheter. Under året fram till förvärvet säger källorna att båda sidor undertecknade ett avtal - etik- och säkerhetsavtalet. Detta avtal utarbetades av äldre advokater i London.

Avtalet överför kontrollen av kärnan AGI DeepMind-tekniken, om någon, till etikstyrelsen. Enligt samma källa är Etikrådet inte på något sätt en kosmetisk koncession från Google, utan ger DeepMind ett solidt juridiskt stöd för att behålla kontrollen över sin mest värdefulla och potentiellt farligaste teknik. Namnen på kommissionärerna har inte släppts, men en annan källa nära både DeepMind och Google sa att alla tre av DeepMinds grundare är i styrelsen. Företaget själv avslöjar ingenting.

Hassabis kan bestämma DeepMinds öde på andra sätt. En av dem är hängivenhet. Anställda, tidigare och nuvarande, säger att Hassabis forskningsprogram är en av DeepMinds största styrkor. Hans program, som erbjuder spännande och viktigt arbete utan tryck från akademin, har lockat hundratals världens mest begåvade experter. DeepMind har dotterbolag i Paris och Albert. Många anställda känner sig mer kopplade till Hassabis och dess uppdrag än med företagets förälder, som bara vill ha inkomst. Så länge Hassabis upprätthåller personlig lojalitet har han betydande makt över sin enda aktieägare. Bättre att låta talangen fungera för DeepMind på distans än att hamna på Facebook eller Apple.

DeepMind har en annan källa till hävstångseffekt, även om det kräver ständig påfyllning: lycklig glorie. Företaget har lyckats med detta. AlphaGo var en bra annons. Sedan förvärvet av Google har företaget upprepade gånger producerat mirakler som väckt världen uppmärksamhet. Ett exempel på programvara kan upptäcka ögonscanningsmönster som är indikatorer på makuladegeneration. Ett annat program lärde sig spela schack från grunden med en arkitektur som liknar AlphaGo och blev den största spelaren genom tiderna efter bara nio timmars spel med sig själv. I december 2018 visade sig AlphaFold vara mer exakt än konkurrenter när det gäller att förutsäga den tredimensionella strukturen hos proteiner från en lista över föreningar som potentiellt kan behandla sjukdomar som Parkinsons och Alzheimers.

DeepMind är särskilt stolt över de algoritmer som den har utvecklat för att beräkna de mest effektiva kyllösningarna för Googles datacentra, som innehåller cirka 2,5 miljoner datorservrar. Under 2016 sa DeepMind att det hade minskat Googles elräkning med 40%. Men vissa insiders säger att denna skryta är överdrivet. Google har använt algoritmer för att optimera sina datacentra långt innan DeepMind kom med. Det tros att DeepMind överskattar sin fördel för att få värde i Alfabetets ögon. Googles moderföretag Alphabet betalar DeepMind för liknande tjänster. Under 2017 utfärdade den senare en faktura till Alphabet för 54 miljoner pund. Dessa siffror bleka i jämförelse med DeepMinds omkostnader. Samma år spenderade hon 200 miljoner pund på personal. Rent generellt,2017 tappade DeepMind 282 miljoner pund.

Det är ett öre för en rika jätte. Men andra dotterbolag i Alfabetet fångade uppmärksamheten från Ruth Porat, Alfabets snåla CFO. Google Fiber, ett försök att bygga en Internetleverantör, sattes på vent efter att det blev klart att investeringarna skulle ta årtionden att betala sig. AI-forskare undrar också om DeepMind kommer att skruvas upp.

Den gradvisa avslöjandet av DeepMinds framsteg i AI är en del av en strategi som gradvis bygger upp företagets rykte. Detta är särskilt värdefullt i en tid då Google anklagas för att kränka användarnas integritet och sprida falska nyheter. DeepMind har också turen att ha en anhängare på högsta nivå: Larry Page, en av de två grundarna av Google, nu VD för Alphabet. Paige ligger mycket nära Hassabis. Sidas far, Karl, studerade neurala nätverk på 1960-talet. Tidigt i sin karriär sade Page att han skapade Google enbart för att grunda ett AI-företag.

DeepMinds nära kontroll av pressen överensstämmer inte med den akademiska andan som genomsyrar företaget. Vissa forskare klagar över att det är svårt för dem att publicera sitt arbete: de måste övervinna lagren av internt godkännande innan de ens kan skicka ett papper till en konferens eller tidskrift. DeepMind anser att det är nödvändigt att fortsätta med försiktighet för att inte skrämma allmänheten med möjligheterna till AGI. Men alltför hårda anklagelser kan förstöra den akademiska atmosfären och försvaga anställdas lojalitet.

Fem år efter Google-förvärvet blir frågan om vem som styr DeepMind kritisk. Grundarna och tidiga anställda i företaget närmar sig tröskeln när de kan gå bort med den ekonomiska ersättningen de fick från köpet av företaget (Hassabis-aktier är förmodligen värda cirka 100 miljoner pund). Men en källa nära företaget antyder att Alphabet har drivit tillbaka betalningar till grundarna i flera år. Med tanke på hans obevekliga fokus är det troligt att Hassabis hoppar av fartyget. Han är intresserad av pengar endast i den mån det hjälper honom att närma sig hela livet. Men några av mina kollegor lämnade. Tre AI-ingenjörer har lämnat företaget sedan början av 2019. Ben Laurie, en av världens mest framstående säkerhetsingenjörer, är tillbaka på Google. Det här är verkligen inte mycketMen DeepMind erbjuder ett sådant fantastiskt uppdrag och anständig lön att ingen ska lämna.

Hittills har Google inte riktigt besvärat DeepMind. Men en ny utveckling har gett upphov till oro över hur länge företaget kommer att kunna behålla sitt oberoende.

DeepMind, medicin och artificiell intelligens

DeepMind har alltid planerat att använda AI för att förbättra sjukvården. I februari 2016 skapades en ny division av DeepMind Health, ledd av Mustafa Suleiman, en av företagets medgrundare. Suleiman, vars mamma var sjuksköterska, hoppades kunna skapa ett program som heter Strömmar som skulle varna läkare när patientens hälsa försämrades. DeepMind skulle belönas baserat på mätvärden. Eftersom detta arbete krävde åtkomst till konfidentiell patientinformation, inrättade Suleiman en Independent Review Panel (IRP) som rekryterade bra engelska hälso- och tekniker. DeepMind var klok nog att vara försiktig. Därefter upptäckte den brittiska informationskommissionen att en av sjukhuspartnerna hade brutit mot lagen vid behandling av patientuppgifter. I slutet av 2017 hade Suleiman emellertid tecknat avtal med fyra större sjukhus.

Den 8 november 2018 meddelade Google inrättandet av en egen hälsodivision - Google Health. Fem dagar senare tillkännagavs att DeepMind Health skulle gå med i moderbolagets ansträngningar. DeepMind har inte blivit varnat. Enligt information från FOI-förfrågningar meddelade hon endast partnersjukhus om förändringen tre dagar i förväg. DeepMind vägrade avslöja när diskussioner om fusionen inleddes, men sade att den korta tiden mellan varsel och offentligt tillkännagivande var i intresse för öppenhet. 2016 skrev Suleiman att "patientdata aldrig kommer att kopplas till Google-konton, produkter eller tjänster." Hans löfte verkade ha brutits.

Googles annektering förargade DeepMind Health-anställda. Fler anställda planerar att lämna företaget efter att övertagningsprocessen är klar, enligt folk nära hälsovården.

Det här avsnittet visar att perifera delar av DeepMinds arbete är sårbara för Google. DeepMind uttalade att "vi var alla överens om att det är vettigt att kombinera dessa ansträngningar i en samarbetsinsats med ökade resurser." Detta väcker frågan om Google kommer att tillämpa samma logik för DeepMinds arbete med AGI.

I stor skala har DeepMind gjort stora framsteg. Hon har redan skapat mjukvara som kan lära sig att utföra uppgifter på en övermänsklig nivå. Hassabis hänvisar ofta till Breakout, ett videospel för Atari-konsolen. Spelaren kontrollerar ett slagträ, som kan röra sig horisontellt och med sin hjälp studsar bollarna, riktar dem i block ovanför, som förstörs vid kollision. Spelaren vinner när alla block förstörs. Förlorar om bollen faller förbi plattformen. Utan mänsklig instruktion lärde DeepMind inte bara att spela spelet, utan också att kasta bollar i rymden bakom block för att dra nytta av studsen. Detta demonstrerar styrkan av förstärkningslärande och de övernaturliga krafterna i DeepMinds datorprogram.

Demonstrationen är verkligen imponerande. Men Hassabis tystar om något. Om den virtuella plattformen höjs ännu något högre kommer programmet att göra ett fel. Färdigheten som DeepMind har förvärvat är så begränsad att den inte kan svara på ens små förändringar i miljön som en människa lätt skulle kunna övervinna. Men det finns många subtiliteter i världen. För diagnostisk intelligens är inga två kroppsorgan lika. För mekanisk intelligens kommer två liknande motorer aldrig att vara desamma vid inställning. Därför är det svårt att släppa program i naturen.

Den andra, som DeepMind sällan pratar om, är att framgång i virtuella miljöer beror på att ha en belöningsfunktion: en signal som gör att programvara kan mäta dess framsteg. Programmet får veta att studsning från bakväggen ökar poängen. Mycket av DeepMinds arbete med AlphaGo har varit att skapa en belöningsfunktion som är kompatibel med ett så komplext spel. Tyvärr erbjuder den verkliga världen inte enkla belöningar. Framsteg mäts sällan i enskilda poäng. Den mänskliga hjärnan får en signal om hur framgångsrik uppgiften är i genomförandet, och inte efter.

DeepMind har räknat ut ett sätt att komma runt detta genom att använda enorma mängder processorkraft. AlphaGo har spelat spel i tusentals år av mänsklig tid för att lära sig något. Många AI-filosofer misstänker att denna lösning är oacceptabel för uppgifter som ger svagare belöningar. DeepMind erkänner sådana oklarheter. Hon tog nyligen upp StarCraft 2, ett datorstrategispel. Beslut som fattades i början av spelet får konsekvenser som dyker upp senare, vilket är ganska karakteristiskt för den krångliga och försenade feedbacken av verkliga problem. I januari slog DeepMinds mjukvara några av världens bästa spelare, och det var ganska imponerande trots snäva restriktioner. Programmen har också börjat utforska belöningsfunktioner genom att följa människors feedback. Men att inkludera mänskliga instruktioner i en slinga skapar risken för att förlora skala och hastighet.

Både nuvarande och tidigare forskare på DeepMind och Google har, på villkor av anonymitet, uttryckt skepsis om att DeepMind kan uppnå AGI med hjälp av sådana metoder. För dem gör önskan att uppnå hög prestanda i simulerade miljöer det svårt att lösa problemet med belöningsfunktionen. Ändå är just denna metod kärnan i DeepMind. Det finns en intern konkurrens inom ett företag där program från konkurrerande lag tävlar om överhöghet.

Hassabis har alltid sett livet som ett spel. Mycket av hans karriär har ägnats åt att göra dem, mest av hans lediga tid spenderades på att spela dem. På DeepMind använder han dem för att utveckla kraftfull konstgjord intelligens. Liksom sin programvara lär Hassabis av sin egen erfarenhet. Strävan efter AGI kan i slutändan leda till en återvändsgränd, uppfinna användbar medicinsk teknik på vägen och övermannas de bästa spelarna i deras skicklighet. Men det kan också skapa AGI precis under Googles näsa, men utanför dess kontroll. Och om han lyckas göra det kommer Demis Hassabis att vinna det svåraste spelet av alla.

Ilya Khel

Rekommenderas: