A közösségi hálózat tudósai a gépi tanulás eszköztárát bevetve igyekeznek beazonosítani a rendszerbe feltöltött milliárdnyi képen esetlegesen elhelyezett szövegeket. Bár a számítógépes szövegfelismerés (optical character recognition - OCR) már hosszú évtizedek óta bevett és használt metódus, az adatok tömege és változatos megjelenési formája miatt új trükkökre volt szükség.
A Facebook természetesen mindent megtesz, hogy a felhasználókat a lehető leginkább a hálozataihoz láncolja. Ennek egyik módját látja abban, ha a sok internetező által kedvelt és használt mémeket gyorsan és hatékonyan lehet előkeresni az adattengerből. Ehhez komoly munkára fogják a mesterséges intelligenciát, amely egyébként sem tétlenkedik a vállalatnál, hiszen a meztelenkedés kiszúrásától kezdve a gyűlöletbeszéd elleni harcon át az öngyilkos szándék felismeréséig számtalan fronton teljesít szolgálatot.
Vicces, de komoly meló
A vállalt szakmai blogjában frissen megjelent leírás szerint a mémek elemzéséhez a Rosettának nevezett rendszert fejlesztették ki, amely a gépi tanulásban rejlő előnyeivel képes magasabb fokozatra kapcsolni a jól bevált OCR-t. A vicces képek elemzésének egyik nehézségét a teljesen változatos és "zajos" környezet adja, azaz egy algoritmusnak magát a képre applikált szöveget is néha igencsak nehéz kiszúrnia. Ellentétben mondjuk egy regény oldalával, ahol a fehér háttérből egyértelműen kitűnnek és könnyen azonosíthatók a betűk.
A másik gondot maga az adattömeg nagysága okozza, hiszen a Facebookra és a szintén a vállalat érdekeltségébe tartozó Instagramra százmilliós nagyságrendben érkeznek naponta újabb és újabb fotók. Úgy tűnik Rossetta mindkét problémára megoldást kínál.
A kutatók a feladatot két részre osztják. Az első fázisban az algoritmusnak csak annyi a dolga, hogy elemezze a fotókat és azokon a lehető legnagyobb pontossággal felismerje a szöveget tartalmazó részeket, és azokat pontosan elkülönítse a munka szempontjából lényegtelen (azaz nem szöveges) területektől.
A neurális hálózatokra épülő algoritmus az így leszűkített területeket vizsgálja már csak át, és a szavakat betűről betűre haladva rakja össze. A folyamatot meggyorsítandó, a gépet igyekeznek a szavak felismerésére is trenírozni. Első körben csak rövidebb kifejezésekkel "etették" meg az algoritmust, majd lépésenként egyre bonyolultabb szavakkal bővítették a repertoárját.
Kétségtelen tény, hogy az emberiségnek jól jön egy gyorsan és hatékonyan működő mémkereső rendszer, de a mesterséges intelligenciával végzett kutatás eredményeit ennél komolyabb területeken is be lehet majd vetni. A gépi szövegfelismerés például sokat javíthat a gyengénlátók életminőségén, ha ezek a fejlesztések egyéb alkalmazásokba, felületekre is eljutnak.
Jöhet a mozi!
A rendszer egyébként már élesben működik a Facebook hálózatain, de a szakemberek tovább dolgoznak, hiszen az újabb célkitűzés az, hogy ne csak állóképekben, de videós formátumokban is működőképes legyen a gyors szövegfelismerés. Ez utóbbi azonban egy nagyságrenddel keményebb diónak ígérkezik.
Adathelyreállítás pillanatok alatt
A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak