A Facebook kutatói szerint a SEER modell áttörést jelent a felügyelet nélküli tanulásban, és forradalmasíthatja a gépi képfeldolgozás hatékonyságát is.

A Facebook mesterséges intelligenciával foglalkozó blogja a múlt héten osztott meg részleteket a vállalat egyik programjáról, amelynek eddigi eredményeit áttörésnek nevezi a gépi látás (computer vision) fejlődésében, utat nyitva az eddiginél rugalmasabb, pontosabb és alkalmazkodóképesebb rendszerek jövöbeni fejlesztésében. A SEER néven futó MI-modell teljesítménye a bejegyzés szerint lényegesen felülmúlja a már létező objektumfelismerő programokét, 84,2 százalékos értékelést szerezve az ImageNet vizuláis adatbázisán végzett tesztekben.

Ez tulajdonképpen azt jelenti, hogy a Facebook algotritmusa ilyen pontossággal volt képes osztályozni azokat a dolgokat, amelyek az általa vizsgált fotókon szerepeltek. Ennél is lényegesebb azonban, hogy a SEER betanítása nem körültekintően összeállított és felcímkézett adatkészleteken történt, hanem az Instagramról összevadászott, nem válogatott és nem címkézett képeken. Bár az önfelügyelt tanulás (self-supervised learning) koncepciója az utóbbi időben több alkalmazásában is komoly előrelépésekhez vezetett, a gépi látást eddig még nem forradalmasította.

Az MI-kutatások egyes területein, így például a természetes nyelvek feldolgozásában is kifejezetten sikeres technika lényege, hogy az ilyen elven működő rendszerek közvetlenül próbálnak tanulni a rendelkezésükre bocsátott információból. Más szóval, a fejlődésük során nem támaszkodnak a megfelelő módon válogatott és osztályozott adatokra, legyen szó a fotókon szereplő tárgyak felismeréséről vagy a szövegek szabatos fordításáról. Az önfelügyelt tanuláshoz így nincs szükség irdatlan méterű adatkészletekre, amelyek címkézése számottevő emberi közreműködést is igényel.

Másfelől éppen ez a képesség az, ami lehetővé teszi a minél nagyobb adatkészletek felhasználását, éppen amiatt, mert azok következetes összeállítása nem igényel jelentős emberi beavatkozást. Nem véletlen, hogy a tanulásuk során egyre terjedelmesebb adatbázisokat feldolgozó algoritmusok teljesítménye látványosan javul a kérdés-megválaszoló, a gépi fordító vagy a természetes nyelvű következtetéses (natural language inference) alkalmazásokban, míg a SEER modell a maga területén úttörőnek számít a technika eredményes kiaknázásában.

Csak a lényeget tartják meg maguknak

A Facebook szerint a SEER a legelső, teljes önfelügyelet mellett működő computer vison modell, amelyet az internetről véletlenszerűen gyűjtött képeken tanítottak, szemben azokkal az ugyancsak önfelügyelt tanulásra épülő programokkal, amelyek az ImageNet több milliós, szakemberek által válogatott és címkézett adatkészletén okosodnak. A Facebook az ImageNet adatbázisát ezzel sezmben benchmarkolásra használja, és a mostani megállapítása szerint a SEER már világosan lepipálja a felügyelt tanulással fejlesztett modelleket, legyen szó a szokatlan szögből készített felvételekről, az objektumok észleléséről, a szegmentációról vagy a képek osztályozásáról.

A bejegyzés szerint mindez azt bizonyítja, hogy a gépi látás fejlesztésében is túl lehet lépni a nagy gonddal összeállított adatkészleteken, és az önfelügyelt tanulás alkalmazásával totál véletlenszerű képeken is be lehet tanítani magas minőségű modelleket. Mindez természetesen rendkívül szofisztikált algoritmusokat feltételez, és a kutatók előtt álló kihívások sem feleltethetők meg a nyelvi feldolgozásra tervezett gépi intelligenciának. A munka során milliárdos nagyságrendben vették igénybe az Instagramról származó publikus képeket, a következő időszak legfontosabb feladatának pedig azt tekintik, hogy a szoftverkód és a kutatási technikák tisztításával a számítási erőforrások költségarányos felhasználásában is javítsák a rendszer hatékonyságát.

A Facebook azt tervezi, hogy közzé teszi a kutatás bizonyos részleteit, és egy olyan nyílt könyvtárat is létrehoz, ami más kutatóknak is lehetővé teszi a technika vizsgálatát, a SEER eljárását vagy az alkalmazott instagramos képeket viszont nem osztja meg a közönséggel. Ez utóbbinak az (is) az oka, hogy a felhasználói szerződések szerint a Facebook mindazokat a fotókat szabadon felhasználhatja kutatási és technológiai fejlesztési célokra, amelyeket bárki feltölt az általa üzemeltetett Instagram szolgáltatásba, ahhoz azonban nincs joga, hogy ezeket ugyanilyen céllal harmadik félnek is továbbadja.

Közösség & HR

Van az a pénz... Kivették a kínai App Store-ból a WhatsAppot és Threadset

Peking szerint a Meta két mobil appja nemzetbiztonsági aggályokat vet fel.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.