A vicces szöveggel ellátott képek gyors megtalálása mellett ez jobb lehetőségeket ígér más területeken is, mint amilyen például a gyengénlátók támogatása.

A közösségi hálózat tudósai a gépi tanulás eszköztárát bevetve igyekeznek beazonosítani a rendszerbe feltöltött milliárdnyi képen esetlegesen elhelyezett szövegeket. Bár a számítógépes szövegfelismerés (optical character recognition - OCR) már hosszú évtizedek óta bevett és használt metódus, az adatok tömege és változatos megjelenési formája miatt új trükkökre volt szükség.

A Facebook természetesen mindent megtesz, hogy a felhasználókat a lehető leginkább a hálozataihoz láncolja. Ennek egyik módját látja abban, ha a sok internetező által kedvelt és használt mémeket gyorsan és hatékonyan lehet előkeresni az adattengerből. Ehhez komoly munkára fogják a mesterséges intelligenciát, amely egyébként sem tétlenkedik a vállalatnál, hiszen a meztelenkedés kiszúrásától kezdve a gyűlöletbeszéd elleni harcon át az öngyilkos szándék felismeréséig számtalan fronton teljesít szolgálatot.

Vicces, de komoly meló

A vállalt szakmai blogjában frissen megjelent leírás szerint a mémek elemzéséhez a Rosettának nevezett rendszert fejlesztették ki, amely a gépi tanulásban rejlő előnyeivel képes magasabb fokozatra kapcsolni a jól bevált OCR-t. A vicces képek elemzésének egyik nehézségét a teljesen változatos és "zajos" környezet adja, azaz egy algoritmusnak magát a képre applikált szöveget is néha igencsak nehéz kiszúrnia. Ellentétben mondjuk egy regény oldalával, ahol a fehér háttérből egyértelműen kitűnnek és könnyen azonosíthatók a betűk.

A másik gondot maga az adattömeg nagysága okozza, hiszen a Facebookra és a szintén a vállalat érdekeltségébe tartozó Instagramra százmilliós nagyságrendben érkeznek naponta újabb és újabb fotók. Úgy tűnik Rossetta mindkét problémára megoldást kínál.

A kutatók a feladatot két részre osztják. Az első fázisban az algoritmusnak csak annyi a dolga, hogy elemezze a fotókat és azokon a lehető legnagyobb pontossággal felismerje a szöveget tartalmazó részeket, és azokat pontosan elkülönítse a munka szempontjából lényegtelen (azaz nem szöveges) területektől.

A neurális hálózatokra épülő algoritmus az így leszűkített területeket vizsgálja már csak át, és a szavakat betűről betűre haladva rakja össze. A folyamatot meggyorsítandó, a gépet igyekeznek a szavak felismerésére is trenírozni. Első körben csak rövidebb kifejezésekkel "etették" meg az algoritmust, majd lépésenként egyre bonyolultabb szavakkal bővítették a repertoárját.

Kétségtelen tény, hogy az emberiségnek jól jön egy gyorsan és hatékonyan működő mémkereső rendszer, de a mesterséges intelligenciával végzett kutatás eredményeit ennél komolyabb területeken is be lehet majd vetni. A gépi szövegfelismerés például sokat javíthat a gyengénlátók életminőségén, ha ezek a fejlesztések egyéb alkalmazásokba, felületekre is eljutnak.

Jöhet a mozi!

A rendszer egyébként már élesben működik a Facebook hálózatain, de a szakemberek tovább dolgoznak, hiszen az újabb célkitűzés az, hogy ne csak állóképekben, de videós formátumokban is működőképes legyen a gyors szövegfelismerés. Ez utóbbi azonban egy nagyságrenddel keményebb diónak ígérkezik.

Cloud & big data

Van az a pénz... Kivették a kínai App Store-ból a WhatsAppot és Threadset

Peking szerint a Meta két mobil appja nemzetbiztonsági aggályokat vet fel.
 
Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.