Az év elején kezdték építeni a kínai keresőóriás, a Baidu szuperszámítógépét, a Minwa-t, melyet a gépi tanulás és a mesterséges intelligencia kutatásának a szolgálatába állítottak. Itt vannak az első eredmények, melyek egyelőre minden várakozást felülmúlnak.
Az első kísérletek során az ImageNet adatbázisából 1 millió képet rendeztettek ezer kategóriába a géppel, valamint a hozzá fejlesztett képfelismerő algoritmus segítségével. A kísérlet több mint ígéretes. A Baidu rendszere árnyalt megkülönböztetésekre is képes: még egy lakeland terriert is meg tud különböztetni egy drótszőrű foxitól, ami valószínűleg még egy kutyákat csak felszínesen ismerőnek is gondot okozna.
De nem is ez az igazán nagy fegyvertény. A képfelismerésben még az ember sem végez tökéletes munkát, a kategorizálásban mintegy 5 százalékos hibaaránnyal dolgozik. Ezt már februárban túlszárnyalta a Microsoft algoritmusa, amely 4,94 százalékos hibaaránnyal azonosított be mintegy százezer képet az ImageNet adatbázisából.
A Google, amely szintén komoly erőkkel fejleszti a képfelismerő algoritmusát, mára 4,8 százalékra szorította le annak hibaarányát (februárban ez még 6 százaléknál is magasabb volt). Most a Baidunak a Google-t is sikerült leköröznie 4,58 százalékos hibázási aránnyal. (A teljes kutatási projektről egy kattintásnyira olvashat összefoglaló leírást.)
Habár az emberi hibák aránya ennél magasabb, azt figyelembe kell venni, hogy az emberek nem vétenek kapitális hibát, azaz lehet, hogy összekeverik a vadkacsáknál a hímet és a tojót, ám a sast és a kárókatonát már nem. Ugyanakkor az algoritmus olyan triviális hibát is véthet, amit az ember soha.
Képfelismerő algoritmusok királyvize: ImageNet
A képfelismerő algoritmusokat az ImageNet adatbázisán végzik el. Az ImageNet több mint 14 millió képet tartalmaz, melyek hétköznapi tárgyakat, embereket, állatokat stb. ábrázolnak. A kifejezetten kutatási célokra létrehozott adatbázisra alapozva 2010. óta évente rendezik meg a Large Scale Visual Recognition Challenge nevű versenyt, amelyen egyetemi kutatócsoportok és a nagy cégek (IBM, Microsoft, Google stb.) csapatai is indulnak, hogy összemérjék a gépi tanulásra épülő képfelismerésben elért eredményeiket.
Tavaly ezt a versenyt a Google nyerte. A keresőóriásnál többek között a vezető nélküli autó fejlesztése miatt is nagy energiákat ölnek ennek a területnek a kutatásába.
Jól példázza az ezen a téren tapasztalható rohamos fejlődést, hogy 2011-ben a Stanfordon kidolgozott képfelismerő algoritmus még csupán 80 százalékos pontossággal dolgozott ebben az adatbázisban, ráadásul sokkal kevésbé árnyal azonosításra volt képest, mint a most legjobban teljesítő megoldások: 50 ezer képet 10 különböző kategóriába tudott besorolni.
A hangfelismerés legalább ilyen fontos
A Baidu kutatócsoportjának vezetője, Andrew Ng, akit egyébként a Google-től igazolt le tavaly a Baidu, úgy nyilatkozott, hogy a következő másfél év legfontosabb feladata, hogy tovább tökéletesítsék a felismerő algoritmust, valamint megfelelő számítási teljesítményt is tegyenek mögé. Olyan gépet építenek hozzá, amely másodpercenként 7 billiárd (1015) művelet végrehajtására képes, azaz 7 PFLOP/s-os teljesítményre lesz képes. A Minwa ennek alig tizedére képes. (Ha megépül az új gép, tovább olvad az amerikaiak előnye a szuperszámítógépek frontján, mivel egy ilyen gép már befér a világ top 10 szuperszámítógépe közé.)
Ez adja majd a beszédfelismerő algoritmus fejlesztésének hátterét is. A Baidu mintegy 14 ezer órányi hanganyagot használ ahhoz, hogy tökéletesítse angol és kínai beszédfelismerő algoritmusát.
Megjegyzendő ugyanakkor, hogy az ilyen kutatások egyelőre csak a legnagyobb cégek kiváltságai, főleg a szükséges számítási kapacitás biztosítása miatt. Az azonban látszik, hogy a nagy internetes cégek – többek között a Google és a Baidu mellett a Facebook is – nagy erőket fektetnek ezekbe a kutatásokba. Működésükből adódóan ugyanis ők alapból is rendelkeznek minden erőforrással ehhez: jó kutatócsapattal és a vizsgálatokhoz megfelelően nagy mennyiségű adathalmazzal.
Rendszerek és emberek: a CIO választásai egy új magyar felmérés tükrében
"Nehéz informatikusnak lenni egy olyan cégben, ahol sok az IT-s" – jegyezte meg egy egészségügyi technológiákat fejlesztő cég informatikai vezetője, amikor megkérdeztük, milyennek látja házon belül az IT és a többi osztály közötti kommunikációt.
Így lehet sok önálló kiberbiztonsági eszközéből egy erősebbet csinálni
A kulcsszó a platform. Ha egy cég jó platformot választ, akkor az egyes eszközök előnyei nem kioltják, hanem erősítik egymást, és még az üzemeltetés is olcsóbb lesz.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak