A vicces szöveggel ellátott képek gyors megtalálása mellett ez jobb lehetőségeket ígér más területeken is, mint amilyen például a gyengénlátók támogatása.

A közösségi hálózat tudósai a gépi tanulás eszköztárát bevetve igyekeznek beazonosítani a rendszerbe feltöltött milliárdnyi képen esetlegesen elhelyezett szövegeket. Bár a számítógépes szövegfelismerés (optical character recognition - OCR) már hosszú évtizedek óta bevett és használt metódus, az adatok tömege és változatos megjelenési formája miatt új trükkökre volt szükség.

A Facebook természetesen mindent megtesz, hogy a felhasználókat a lehető leginkább a hálozataihoz láncolja. Ennek egyik módját látja abban, ha a sok internetező által kedvelt és használt mémeket gyorsan és hatékonyan lehet előkeresni az adattengerből. Ehhez komoly munkára fogják a mesterséges intelligenciát, amely egyébként sem tétlenkedik a vállalatnál, hiszen a meztelenkedés kiszúrásától kezdve a gyűlöletbeszéd elleni harcon át az öngyilkos szándék felismeréséig számtalan fronton teljesít szolgálatot.

Vicces, de komoly meló

A vállalt szakmai blogjában frissen megjelent leírás szerint a mémek elemzéséhez a Rosettának nevezett rendszert fejlesztették ki, amely a gépi tanulásban rejlő előnyeivel képes magasabb fokozatra kapcsolni a jól bevált OCR-t. A vicces képek elemzésének egyik nehézségét a teljesen változatos és "zajos" környezet adja, azaz egy algoritmusnak magát a képre applikált szöveget is néha igencsak nehéz kiszúrnia. Ellentétben mondjuk egy regény oldalával, ahol a fehér háttérből egyértelműen kitűnnek és könnyen azonosíthatók a betűk.

A másik gondot maga az adattömeg nagysága okozza, hiszen a Facebookra és a szintén a vállalat érdekeltségébe tartozó Instagramra százmilliós nagyságrendben érkeznek naponta újabb és újabb fotók. Úgy tűnik Rossetta mindkét problémára megoldást kínál.

A kutatók a feladatot két részre osztják. Az első fázisban az algoritmusnak csak annyi a dolga, hogy elemezze a fotókat és azokon a lehető legnagyobb pontossággal felismerje a szöveget tartalmazó részeket, és azokat pontosan elkülönítse a munka szempontjából lényegtelen (azaz nem szöveges) területektől.

A neurális hálózatokra épülő algoritmus az így leszűkített területeket vizsgálja már csak át, és a szavakat betűről betűre haladva rakja össze. A folyamatot meggyorsítandó, a gépet igyekeznek a szavak felismerésére is trenírozni. Első körben csak rövidebb kifejezésekkel "etették" meg az algoritmust, majd lépésenként egyre bonyolultabb szavakkal bővítették a repertoárját.

Kétségtelen tény, hogy az emberiségnek jól jön egy gyorsan és hatékonyan működő mémkereső rendszer, de a mesterséges intelligenciával végzett kutatás eredményeit ennél komolyabb területeken is be lehet majd vetni. A gépi szövegfelismerés például sokat javíthat a gyengénlátók életminőségén, ha ezek a fejlesztések egyéb alkalmazásokba, felületekre is eljutnak.

Jöhet a mozi!

A rendszer egyébként már élesben működik a Facebook hálózatain, de a szakemberek tovább dolgoznak, hiszen az újabb célkitűzés az, hogy ne csak állóképekben, de videós formátumokban is működőképes legyen a gyors szövegfelismerés. Ez utóbbi azonban egy nagyságrenddel keményebb diónak ígérkezik.

Cloud & big data

Végre lesz egy nyomós érve az okostelefon-gyártóknak a drágításra: az MI

A technológii hamarosan a viselhető eszközökben is általános lesz – akár szeretjük, akár nem.
 
Hirdetés

Költségcsökkenésből finanszírozott modernizáció

A cloud-native alkalmazások megkövetelik az adatközpontok modernizációját, amihez a SUSE többek között a virtualizációs költségek csökkentésével szabadítana fel jelentős forrásokat.

Felhőalapú automatizációs modellek konkrét vállalati felhasználásban - hat folyamat, ahol már bizonyított az AIaaS és az RPAaaS.

a melléklet támogatója a ONE Solutions

CIO kutatás

Merre tart a vállalati IT és annak irányítója?

Hiánypótló nagykép a hazai nagyvállalati informatikáról és az IT-vezetőkről: skillek, felelősségek, feladatkörök a múltban, a jelenben és a jövőben.

Töltse ki Ön is, hogy tisztábban lássa, hogyan építse vállalata IT-ját és saját karrierjét!

Az eredményeket május 8-án ismertetjük a 17. CIO Hungary konferencián.

LÁSSUNK NEKI!

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.