Forskare på universitetet Northeastern skapar modeller över zikavirusets spridning med Google Cloud Platform

Northeastern Universitys laboratorium för modellering av biologiska och sociotekniska system (MoBS) behövde ett sätt att snabbt modellera zikaviruset. Med Google Cloud-plattformen och icke-prioriterade virtuella maskiner har MoBS kört över 10 miljoner simuleringar och drastiskt minskat tiden det tar att analysera data.

År 2015, när det myggburna zikaviruset snabbt spred sig i Amerika, utfärdades reseförbud och karantän. Dessutom höjdes röster om att OS 2016 i Brasilien borde ställas in. När Världshälsoorganisationen klassade viruset som ett internationellt hot mot människors hälsa behövde regeringarna i påverkade länder ett sätt att förutsäga antal och platser för nya smittfall. Det är ett särskilt svårt virus att förutspå eftersom bara 20 procent av zikafallen uppvisar symtom.

I januari 2016 inledde teamet på Northeastern Universitys MoBS-laboratorium zikamodelleringsprojektet med stöd av Center for Inference and Dynamics of Infectious Diseases för att hjälpa myndigheter och forskare att bättre förstå dess utveckling och spridning.

"Med stordata och massiv processorkraft hoppas vi kunna hjälpa forskare och folkhälsomyndigheter."

Matteo Chinazzi, Northeastern University, Biträdande forskare

Google Cloud-plattformen tillhandahåller viktiga prognostiseringsverktyg, analytiska verktyg och mer därtill

Genom en matematik- och beräkningsbaserad metod baserad på Google Cloud Platform har teamet studerat olika scenarier för zikavirusets spridning och projicerat effekten på berörda populationer. Modellen baseras på zikavirusets inledande spridning i Brasilien, där viruset bröt ut 2015. Forskarna kan nu förutspå effekten av nya smittfall på andra platser genom att inkludera ytterligare datalager som temperatur, antal myggor, befolkningens storlek och människors resemönster.

Med Google Cloud-plattformen kan de köra flera parallella simuleringar och analysera de terabyte av data som genereras av de scenarier som modellerats. ”Vi använder flera produkter från Google Cloud-plattformen”, säger Matteo Chinazzi, Associate Research Scientist på Northeastern University. ”Google Cloud Storage lagrar alla våra modelleringsdata och är värd för webbplatsen. Google Compute Engine (GCE) och icke-prioriterade virtuella maskiner kör simuleringar av sjukdomens spridning. Google BigQuery undersöker simulerade scenarier, som alla innefattar variabler som datum och smittoantal. Hittills har vi tagit oss igenom enorma mängder data, totalt hundratals terabyte. Google Cloud Storage lagrar allt.”

Få snabba resultat i stor skala

Med Google Cloud-plattformen och icke-prioriterade virtuella maskiner har MoBS kört över 10 miljoner simuleringar. Google Cloud-plattformen och BigQuery har drastiskt minskat tidsåtgången vid simuleringar och dataanalys. (Båda processerna tar några timmar i stället för veckor.) ”Vi har flexibiliteten att skala upp till flera tusen oberoende virtuella instanser parallellt”, säger han, ”så att vi kan generera en fullständig analys för ett enskilt epidemiscenario – som kan bestå av upp till 250 000 oberoende simuleringar – på mindre än en dag.”

Tanken är att modellen inte bara ska göra det möjligt för forskarna att förstå zikavirusets spridning, utan även bli en mall för att analysera andra epidemier som denguefeber. Även om zikaviruset inte längre utgör en internationell nödsituation enligt Världshälsoorganisationen, finns det mycket att göra när det kommer till att förhindra utbrott av myggburna sjukdomar. Med hjälp av stordata och obegränsad beräkningskraft hoppas teamet på MoBS hjälpa forskare och folkhälsomyndigheter på vägen.

”Tiden är mycket viktig vid sjukdomsutbrott”, säger Chinazzi, ”och Google Cloud-plattformen ger oss verktygen vi behöver för att få snabba resultat i stor skala.”

Om du vill veta mer om zikaforskningen och analyserna från MoBS-laboratoriet kan du läsa ”Spread of Zika virus in the Americas” (Zikavirusets spridning i Amerika) som publicerats av Proceedings of the National Academy of Sciences of the United States of America.

"Vi har flexibiliteten att skala upp till flera tusen oberoende virtuella instanser parallellt, så att vi kan generera en fullständig analys för ett enskilt epidemiscenario – som kan bestå av upp till 250 000 oberoende simuleringar – på mindre än en dag."

Matteo Chinazzi, Northeastern University, Biträdande forskare

Organisationsprofil

Laboratoriet för modellering av biologiska och sociotekniska system (MoBS) på Northeastern University fokuserar på att utveckla datadrivna modeller för spridning av smittsamma sjukdomar, studera människors sociala beteende, modellera utvecklingen av komplexa sociala och tekniska nätverk, analysera datautvinning och trafikmönster i tekniska nätverk som webben och internet och studera samverkan mellan social dynamik och onlinebeteende.

Produkter som används

Tack för att du registrerade dig!

Vi vill gärna veta vad du är intresserad av.