Case Studies: Cmu GCP - Google for Education

På Carnegie Mellon University är maskininlärningen social

I Articulab-teamet på Carnegie Mellon University ville man lära sig mer om hur robotassistenter samarbetar med människor för att slutföra uppgifter och skapa relationer, i stället för att bara ta över arbetet från mänskliga assistenter. De använde maskininlärningsmotorn från Google Cloud för att studera hur robotarna interagerar med människorna och träna upp deras sociala medvetande.

Ger artificiell intelligens social kompetens

När mötet The Annual Meeting of the New Champions hölls i Tianjin i Kina 2016 presenterades bland annat en märklig debutant: SARA, en socialt medveten robotassistent (Socially Aware Robot Assistant) som kunde interagera med människor på ett helt nytt sätt. I stället för att enbart ta över rollen som mänsklig assistent, eller behandla och leverera information på ett opersonligt sätt arbetade SARA på ett intuitivt, vänligt och engagerande sätt. SARA är utformad för att samarbeta med mänskliga användare, känna igen och svara på ansiktsuttryck, lära sig deras preferenser och genomföra uppgifter bättre utifrån de användare hon träffar. Hon har även programmerats för att lära sig vissa sociala signaler, så som att nicka när användaren pratar och förstå olika betoningar.

Ett halvår senare, i januari 2017, presenterades projektet på World Economic Forum i schweiziska Davos och det var den enda demonstrationen som visades på Davos Congress Center. SARA fungerade som en virtuell assistent och erbjöd deltagarna information om de olika sessionerna som hölls, presenterade dem för andra deltagare, rekommenderade matställen och mycket annat.

I början fungerade SARA som en virtuell assistent med en specifik funktion – att erbjuda hjälp vid konferenser och interagera med gästerna. Hon kunde lära sig vilka målsättningar och intressen världens olika ledare hade och sedan rekommendera sessioner som kunde vara av intresse för dem. Dessutom kunde SARA använda konversationerna för att skapa relationer med alla som pratade med henne, vilket var ännu bättre. Hon kunde lära sig mer om deras önskemål och målsättningar och därefter prestera ännu bättre i kommande konversationer genom att erbjuda ännu mer personlig hjälp.

Hon skapades av Articulab, ett litet team på Carnegie Mellon University som arbetar med att studera mänskliga interaktioner i sociala och kulturella sammanhang och föra in resultaten i datasystem. Dessa ska i sin tur hjälpa oss att förstå mänsklig interaktion bättre. Hur kommunicerar människor med teknik och hur kan kommunikationen förbättras med tiden? Att forma och utveckla sociala relationer är viktigt, på samma sätt som de är helt nödvändiga mellan människor. I Articulab-teamet säger man följande om SARA: ”I stället för att strunta i de sociala och emotionella relationer som samhället bygger på använder sig SARA av dem för att förbättra sin samarbetsförmåga.”

”Google Cloud ökar takten inom akademisk AI-forskning.”
Yoichi Matsuyama, postdoktoral ledamot vid institutet för språkteknologi och chef över SARA-projektet

Använder Googles verktyg för att skapa SARA

Articulab leds av Justine Cassell som arbetar som vicedekanus med inriktning på tekniska strategier och teknisk påverkan vid institutionen för datavetenskap på Carnegie Mellon University. På Articulab kände de till Google Cloud redan innan arbetet med SARA inleddes, eftersom de tidigare använt verktyg från Google Cloud och fått finansiering för andra forskningsprojekt. ”Eftersom vi hade använt TensorFlow i ett antal maskininlärningsuppgifter var det naturligt att börja använda Google Cloud i våra nya projekt inom djupinlärning”, säger Yoichi Matsuyama, postdoktoral ledamot vid institutet för språkteknologi och chef över SARA-projektet. ”Vi har även använt ett antal API:er från Google, till exempel Google Speech API (taligenkänning) för våra konversationsagenter, och Firebase när vi samlar in data med hjälp av massförfrågningar till allmänheten.” Google Cloud används även fortsättningsvis i takt med att SARA:s kapacitet utökas till nya domäner och användningsområden. ”Vi är fortfarande i distributionsfasen”, säger han och fortsätter: ”Med Google Cloud går den akademiska AI-forskningen snabbare.”

Matsuyama säger att labbet använder Compute Engine mycket, inklusive GPU-instanser med 4 x Nvidia Tesla K80 och TensorFlow. I år har teamet arbetat med modeller som Deep Reinforcement Learning-Based Social Reasoning in Task Contexts (förstärkta inlärningsbaserade sociala resonemang i uppgiftssammanhang) och Socially Conditioned Natural Language Generation (socialt betingad naturlig språkgenerering).

I en utvärdering av vad som kan kallas SARA 1.0 – som lanserades på World Economic Forum – säger Matsuyama: ”Över 250 deltagare testade SARA under den fyra dagar långa konferensen, vilket var lyckat på det stora hela. Men vi analyserar fortfarande resultaten, det vill säga vad som var bra och vad som var dåligt. Ett av de viktigaste resultaten handlar om att det vi kallar samspel – interpersonella relationer – faktiskt kan kopplas till prestationer vid olika uppgifter, och i det här fallet påverkade det hur väl en rekommendation accepterades. När samspelet fungerade bra och SARA lyckades etablera en bra relation med användaren var sannolikheten att användaren skulle acceptera rekommendationen hög. Det är vår viktigaste upptäckt hittills, men vi fortsätter att analysera all data.”

Utökas till nya områden – inklusive utbildning

SARA:s arbete verkar bara ha börjat. Denna så kallade socialt medvetna artificiella intelligens från Articulab har hittills också använts till bland annat utbildning, och då som stöd för barn i skolor som har ont om resurser, och som ett sätt att uppmuntra eleverna att samarbeta (vilket har visat sig vara mycket viktigt för inlärningen). Dessutom har SARA använts för att hjälpa högfungerande autistiska barn och barn med Aspergers att träna upp interaktiva sociala färdigheter och därmed skapa bättre relationer med klasskamraterna.

Michael Madaio är doktorand vid institutet för interaktion mellan människa och dator och chef över Rapport-Aware Peer Tutor-projektet (RAPT). När det gäller den data som de samlat in om mellanmänsklig inlärning när den sker mellan klasskamrater säger han följande: ”Samspelet mellan eleverna som samarbetade kan i hög grad kopplas till deras engagemang för uppgiften, till deras problemlösningar och slutligen till deras inlärning.” Med andra ord är sociala samarbeten något alla kan dra nytta av.

Samtidigt som de utvecklar inlärningsapparna med sina lärdomar om samspelet mellan lärare och elever påpekar Madaio att de vill erbjuda verktyg som kan göra mer än hjälpa eleverna med inlärningen. ”Plattformar för inlärning finns redan”, säger han, ”men utbildningsforskningen visar att elever inte fungerar som maskiner som bearbetar information och räknar ut tal. Där finns också en social aspekt. Och för att lära sig något är det viktigt att skapa relationer med andra elever. Detsamma gäller när en virtuell lärare ger feedback. Hur ska läraren göra för att tala om för en elev att han eller hon har fel? Kanske på ett vänligare och artigare sätt, till att börja med. Men med tiden, när de har skapat en relation, kan läraren vara lite mer rakt på sak och faktiskt ge specifik feedback som är till hjälp för eleven.”

Om en virtuell lärare lyckas med sitt uppdrag ökar ”sannolikheten att de vill komma tillbaka”, tillägger han. Och detta är viktigt, precis som att elevernas engagemang är viktigt. ”Det handlar inte bara om ifall eleverna ber om hjälp, utan om hur de beter sig när de interagerar med den virtuella läraren. Tar de för sig mer? Känner de sig trygga i att dela med sig av sina målsättningar och orosmoment?” Det är som vilken annan relation som helst som utvecklas med tiden. Men det fantastiska är att en sådan relation kan skapas, vilket SARA har visat.

Så här långt har responsen från användningen inom utbildningsområdet varit positiv. Madaio säger: ”Men vi har inte distribuerat SARA i skolor ännu. En av våra designutmaningar det här året är att komma underfund med hur en storskalig lansering ska se ut.” De försöker föreställa sig hur en framtida lansering kan se ut, till exempel vad gäller att skapa läxläsningsstöd eller lärare för elever med läs- och skrivsvårigheter.

Även om det inte finns några planer på att införa ett virtuellt lärarsystem på Carnegie Mellon kan det hända att teamet utvecklar en assistent som kan informera studenterna om kommande föreläsningar på campus, tipsa om evenemang och mycket annat. Men den mest ambitiösa målsättningen för Articulab är kanske att skapa en version av SARA som inte bara fungerar på en fyra dagar lång konferens, utan som kan arbeta dygnet runt och på flera områden. Tanken är både utmanande och spännande och möjligheterna är oändliga.

”Det handlar inte bara om ifall eleverna ber om hjälp, utan om hur de beter sig när de interagerar med den virtuella läraren. Tar de för sig mer? Känner de sig trygga i att dela med sig av sina målsättningar och orosmoment?”
Michael Madaio, doktorand, Institutet för interaktion mellan människa och dator