A Google szerdán egy nagy csomó adatot tett elérhetővé azokkal a webes keresésekkel kapcsolatban, amelyek a koronavírus-fertőzés tüneteivel állnak összefüggésben. Ez több mint 400 olyan keresőkifejezést ölel fel az elmúlt három évből amelyek a betegség különféle jeleihez, szimptómáihoz és általában az ahhoz kapcsolódó közérzethez rendelhetők, és első körben az Egyesült Államok területéről származó kérdéseket összesíti idő és hely szerinti bontásban. Az anonimizált adatkészlettel a Google azt a munkát próbálja segíteni, amelyeket az egészségügyi hatóságok és kutatók végeznek a járvány terjedésének feltérképezésében.
A vállalat nem egyszerűen a keresések számának változását mutatja be, hanem a vonatkozó blogbejegyzése szerint úgy próbál trendeket meghatározni, hogy egy százas skála értékeivel normalizálja a megfelelő kifejezéseket, és a Google Trends működéséhez hasonlóan ábrázolja a kiugrásokat. Az azt is jelenti, hogy az adatok nem tartalmazzák az egyes kereséseket, de a tünetek és kondíciók szerint segítenek pontosan meghatározni azok eloszlását és volumenét, lehetőséget adva az összehasonlításra is a járvány felbukkanása előtti állapotokkal.
Sok mindent kiolvasnának a keresésekből
Ahogy más területeken, úgy az emberek az egészségi állapotukkal kapcsolatban is gyakran fordulnak legelőször az internetes keresőkhöz, az ilyen összefüggéseket pedig már korábban is igazolták például a betegség tüneteire utaló kulcsszavak szaporodása és a halálozási statisztikák, sőt a "szuperterjesztőnek" nevezett események és rendezvények között. A járvány orvosi vonatkozásai mellett természetesen a gazdasági vagy társadalmi jellegű jatások feltérképezése és előrejelzése is fontos, ebben pedig ugyanilyen hasznos eszköz a keresési trendek elemzése.
forrás: blog.google/technology/health
Néhány nappal ezelőtt számoltunk be a Microsoft egyik hasonló projektjéről, amely ilyen értelemben segítene felmérni az egyes járványügyi döntések következményeit az érintett közösségekben. Az általuk fejlesztett keretrendszer a Bing keresőben zajló felhasználói interakció értelmezésével értelmezné a fizikai, pszichológiai és gazdasági-szociális szükségletek alakulását, ami egyelőre 14 hónap, illetve 35 millió webes keresés és a földrajzilag hozzájuk kapcsolódó 36 ezer irányítószám elemzésével ad képet az egyes folyamatokról.
A Google közleménye a vállalat egészségügyi ágazatának egyik vezető kutatóját idézi, aki szerint a keresési trendek adatainak tanulmányozása korábbi és sokkal pontosabb indikációt biztosíthat a járvány (újra) kitöréséről az ország különböző részeiben. Ezt azért is tartja különösen lényegesnek, mert a most kialakult helyzetben a járvány terjedésének másodlagos egészségügyi következnényeivel is foglalkozni kell, tekintettel az emberek általános közérzetének változására és az ellátáshoz való hozzáférés egyenlőtlenné válására.
Az influenzával nem igazán jött össze
A "COVID-19 Search Trends symptoms data set" közzététele egyébként a Google Cloud egy átfogóbb, COVID-19 Public Datasets nevű programjának a része, amit a társaság idén nyáron indított el, párhuzamosan azzal az együtműködéssel, amelyet a Harvarddal folytat a COVID-19 predikciós modellek kidolgázására. Ebben mások mellett a Johns Hopkins Center for Systems Science and Engineering (JHU CSSE) publikus adatkészletei, a Világbank globális egészségügyi adatai vagy az OpenStreetMap információi is szerepelnek, amelyeket a Google Cloud ingyenesen tárol és tesz elérhetővé.
A koronavírus-fertőzésekkel összefüggő keresési statisztikák egyelőre angol és spanyol nyelven állnak rendelkezésre, de a későbbiekben ez bővülhet, mint ahogy az USA-n kívül azoknak az országoknak a listája is, amelyek megfelelnek bizonyos (egyelőre nem definiált) küszöbértékeknek a felhasználók személyes adatainak védelmében. Ez utóbbit az úgynevezett differential privacy eljárással erősítik, véletlenszerű zajjal egészítve ki a felhasználói információkat, gyakorlatilag lehetetlenné téve az egyes felhasználók beazonosítását.
Bár a két esetet nem feltétlenül érdemes egymáshoz hasonlítani, azt mindenképpen érdemes megjegyezni, hogy a Google korábban már az influenza vonatkozásában is próbálkozott ilyen típusú elemzésekkel. A 2008-ban indított Google Flu Trends ugyancsak a keresési aktivitásból próbált trendeket azonosítani a betegség terjedésében, a projektet azonban 2015-ben elkaszálták, miután az rendszeresen és igen nagy mértékben túlértékelte az influenzajárványok prevalenciáját.
A NIS2-megfelelőség néhány technológiai aspektusa
A legtöbb vállalatnál a megfeleléshez fejleszteni kell a védelmi rendszerek kulcselemeit is.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak