A vicces szöveggel ellátott képek gyors megtalálása mellett ez jobb lehetőségeket ígér más területeken is, mint amilyen például a gyengénlátók támogatása.
Hirdetés
 

A közösségi hálózat tudósai a gépi tanulás eszköztárát bevetve igyekeznek beazonosítani a rendszerbe feltöltött milliárdnyi képen esetlegesen elhelyezett szövegeket. Bár a számítógépes szövegfelismerés (optical character recognition - OCR) már hosszú évtizedek óta bevett és használt metódus, az adatok tömege és változatos megjelenési formája miatt új trükkökre volt szükség.

A Facebook természetesen mindent megtesz, hogy a felhasználókat a lehető leginkább a hálozataihoz láncolja. Ennek egyik módját látja abban, ha a sok internetező által kedvelt és használt mémeket gyorsan és hatékonyan lehet előkeresni az adattengerből. Ehhez komoly munkára fogják a mesterséges intelligenciát, amely egyébként sem tétlenkedik a vállalatnál, hiszen a meztelenkedés kiszúrásától kezdve a gyűlöletbeszéd elleni harcon át az öngyilkos szándék felismeréséig számtalan fronton teljesít szolgálatot.

Vicces, de komoly meló

A vállalt szakmai blogjában frissen megjelent leírás szerint a mémek elemzéséhez a Rosettának nevezett rendszert fejlesztették ki, amely a gépi tanulásban rejlő előnyeivel képes magasabb fokozatra kapcsolni a jól bevált OCR-t. A vicces képek elemzésének egyik nehézségét a teljesen változatos és "zajos" környezet adja, azaz egy algoritmusnak magát a képre applikált szöveget is néha igencsak nehéz kiszúrnia. Ellentétben mondjuk egy regény oldalával, ahol a fehér háttérből egyértelműen kitűnnek és könnyen azonosíthatók a betűk.

A másik gondot maga az adattömeg nagysága okozza, hiszen a Facebookra és a szintén a vállalat érdekeltségébe tartozó Instagramra százmilliós nagyságrendben érkeznek naponta újabb és újabb fotók. Úgy tűnik Rossetta mindkét problémára megoldást kínál.

A kutatók a feladatot két részre osztják. Az első fázisban az algoritmusnak csak annyi a dolga, hogy elemezze a fotókat és azokon a lehető legnagyobb pontossággal felismerje a szöveget tartalmazó részeket, és azokat pontosan elkülönítse a munka szempontjából lényegtelen (azaz nem szöveges) területektől.

A neurális hálózatokra épülő algoritmus az így leszűkített területeket vizsgálja már csak át, és a szavakat betűről betűre haladva rakja össze. A folyamatot meggyorsítandó, a gépet igyekeznek a szavak felismerésére is trenírozni. Első körben csak rövidebb kifejezésekkel "etették" meg az algoritmust, majd lépésenként egyre bonyolultabb szavakkal bővítették a repertoárját.

Kétségtelen tény, hogy az emberiségnek jól jön egy gyorsan és hatékonyan működő mémkereső rendszer, de a mesterséges intelligenciával végzett kutatás eredményeit ennél komolyabb területeken is be lehet majd vetni. A gépi szövegfelismerés például sokat javíthat a gyengénlátók életminőségén, ha ezek a fejlesztések egyéb alkalmazásokba, felületekre is eljutnak.

Jöhet a mozi!

A rendszer egyébként már élesben működik a Facebook hálózatain, de a szakemberek tovább dolgoznak, hiszen az újabb célkitűzés az, hogy ne csak állóképekben, de videós formátumokban is működőképes legyen a gyors szövegfelismerés. Ez utóbbi azonban egy nagyságrenddel keményebb diónak ígérkezik.

Cloud & big data

Japánban is bezárják a kaput a techszektorban

A szigetország kormányzata augusztustól egy sor új szektorban fogja sokkal szigorúbban vizsgálni a külföldi befektetéseket. Az intézkedés bejelentése egybeesik Donald Trump látogatásával.
 
Ha nem sikerül megválaszolni azokat a biztonsági kihívásokat, amelyek az informatikai fejlesztések még mélyebb integrációjával járnak, nem teljesedhet ki a gyártóipar negyedik forradalmát elhozó trend. Lehetőségek és buktatók.
A VISZ éves INFOHajó rendezvényén az agilitás nagyvállalati alkalmazhatósága és tanulhatósága volt az egyik kerekasztal témája. Az ott elhangzottakat gondolta tovább Both András (Idomsoft), a kerekasztal egyik résztvevője.

Ez a nyolc technológia alakítja át a gyártást

a Bitport
a Vezető Informatikusok Szövetségének
médiapartnere

Az Oracle átáll a féléves verzió-életciklusra, és megszünteti az ingyenes támogatást üzleti felhasználóknak. Mire kell felkészülni? Dr. Hegedüs Tamás licencelési tanácsadó (IPR-Insights Hungary) írása.
Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthetően, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport kilencedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2019 Bitport.hu Média Kft. Minden jog fenntartva.