A közösségi hálózat tudósai a gépi tanulás eszköztárát bevetve igyekeznek beazonosítani a rendszerbe feltöltött milliárdnyi képen esetlegesen elhelyezett szövegeket. Bár a számítógépes szövegfelismerés (optical character recognition - OCR) már hosszú évtizedek óta bevett és használt metódus, az adatok tömege és változatos megjelenési formája miatt új trükkökre volt szükség.
A Facebook természetesen mindent megtesz, hogy a felhasználókat a lehető leginkább a hálozataihoz láncolja. Ennek egyik módját látja abban, ha a sok internetező által kedvelt és használt mémeket gyorsan és hatékonyan lehet előkeresni az adattengerből. Ehhez komoly munkára fogják a mesterséges intelligenciát, amely egyébként sem tétlenkedik a vállalatnál, hiszen a meztelenkedés kiszúrásától kezdve a gyűlöletbeszéd elleni harcon át az öngyilkos szándék felismeréséig számtalan fronton teljesít szolgálatot.
Vicces, de komoly meló
A vállalt szakmai blogjában frissen megjelent leírás szerint a mémek elemzéséhez a Rosettának nevezett rendszert fejlesztették ki, amely a gépi tanulásban rejlő előnyeivel képes magasabb fokozatra kapcsolni a jól bevált OCR-t. A vicces képek elemzésének egyik nehézségét a teljesen változatos és "zajos" környezet adja, azaz egy algoritmusnak magát a képre applikált szöveget is néha igencsak nehéz kiszúrnia. Ellentétben mondjuk egy regény oldalával, ahol a fehér háttérből egyértelműen kitűnnek és könnyen azonosíthatók a betűk.
A másik gondot maga az adattömeg nagysága okozza, hiszen a Facebookra és a szintén a vállalat érdekeltségébe tartozó Instagramra százmilliós nagyságrendben érkeznek naponta újabb és újabb fotók. Úgy tűnik Rossetta mindkét problémára megoldást kínál.
A kutatók a feladatot két részre osztják. Az első fázisban az algoritmusnak csak annyi a dolga, hogy elemezze a fotókat és azokon a lehető legnagyobb pontossággal felismerje a szöveget tartalmazó részeket, és azokat pontosan elkülönítse a munka szempontjából lényegtelen (azaz nem szöveges) területektől.
A neurális hálózatokra épülő algoritmus az így leszűkített területeket vizsgálja már csak át, és a szavakat betűről betűre haladva rakja össze. A folyamatot meggyorsítandó, a gépet igyekeznek a szavak felismerésére is trenírozni. Első körben csak rövidebb kifejezésekkel "etették" meg az algoritmust, majd lépésenként egyre bonyolultabb szavakkal bővítették a repertoárját.
Kétségtelen tény, hogy az emberiségnek jól jön egy gyorsan és hatékonyan működő mémkereső rendszer, de a mesterséges intelligenciával végzett kutatás eredményeit ennél komolyabb területeken is be lehet majd vetni. A gépi szövegfelismerés például sokat javíthat a gyengénlátók életminőségén, ha ezek a fejlesztések egyéb alkalmazásokba, felületekre is eljutnak.
Jöhet a mozi!
A rendszer egyébként már élesben működik a Facebook hálózatain, de a szakemberek tovább dolgoznak, hiszen az újabb célkitűzés az, hogy ne csak állóképekben, de videós formátumokban is működőképes legyen a gyors szövegfelismerés. Ez utóbbi azonban egy nagyságrenddel keményebb diónak ígérkezik.
Költségcsökkenésből finanszírozott modernizáció
A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.
CIO kutatás
Merre tart a vállalati IT és annak irányítója?
Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.
Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!
Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.
Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?