Az Amazon felhős leányvállalata Textract néven indít új szolgáltatást, amely az ígéretek szerint intelligensen és gyorsan kezeli a feldolgozandó szöveges dokumentumokat.

Ha minden jól megy, lassan elfelejthetjük azokat az értelmetlen betűhalmazokat, amelyeket a hagyományos szövegfelismerő szoftverek (OCR) adnak ki magukból végeredmény gyanánt, amennyiben a digitalizálásra váró anyag egy kicsit is eltér a jól strukturált folyószövegtől.

Átadás kulcsrakész állapotban

Az Amazon leányvállalataként működő AWS ugyanis előállt cloudos portfóliója legújabb elemével. A még tavaly novemberben beharangozott Textract szolgáltatás úgy ad erős mesterséges intelligenciával támogatott eszközt a felhasználók kezébe, hogy azoknak semmiféle ilyen irányú előképzettségre nincs szüksége. A nyomtatott anyagokról készült digitális másolatot az amerikai cég megoldása a korábban megszokottnál lényegesen jobb hatásfokkal, az eredetivel megegyező struktúrában tudja számítógépek számára feldolgozható adattömeggé konvertálni.

 

 

Ahogy ebből a rövid tavalyi bemutatóból is kitűnik, a rendszer nem csupán gyorsan dolgozik, de közben felismeri a táblázatokat és a különböző űrlapokat is. Ezeket pedig nem sima szövegként, gépiesen írja egymás mellé, hanem ugyanolyan formában rögzíti, ahogy azt az eredeti dokumentum logikája megköveteli.

A táblázatokból kinyert információk tehát digitálisan is táblázatos formában születnek meg, a kitöltött űrlapmezőknél pedig nem az elrendezés, hanem az adatok típusa lesz a döntő. Utóbbi esetében a karaktersorokat például nem "agyatlanul" vizsgálja, hanem felismeri a személyi számot, a születési időt, a társadalombiztosítási kódot stb. Ráadásul a rendszer tanulni is képes: ha egy űrlapon átrendezik a mezőket, az sem hozza zavarba a gépi feldolgozást, mert azonosítja az eltérő tartalmú mezőket és annak megfelelően rögzíti az adatokat.

A jól strukturált digitalizálás legnagyobb előnye, hogy így nincs szükség emberi beavatkozásra, a bevitt adatok utólagos javítására. Az ügyfélnek csak azt kell eldöntenie, hogy hol és mire használja fel a frissen elkészült adattengert.

Pár cent és más semmi

A cég egyelőre három amerikai központjából, valamint az európai ügyfeleket kiszolgáló ír bázisról kínálja a Textract képességeit, de a tervek szerint folyamatban van a földrajzi lefedettség kiterjesztése. Ami az árakat illeti, az függ a mennyiségtől és az elvégzendő feladat összetettségétől is: laponként a szó szerint fillérektől a pár forinting terjed a skála.

Cloud & big data

Tervezni kezdik az óriási, űrhajósok generációit szállító hajókat

A legközelebbi exobolygók is csak több száz vagy ezer év alatt lesznek megközelíthetők, ami különféle kérdések egész sorát veti majd fel az utazás fizikai megvalósításán túl is.
 
Ezt már akkor sokan állították, amikor a Watson vagy a DeepMind még legfeljebb érdekes játék volt, mert jó volt kvízben, sakkban vagy góban.
Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2024 Bitport.hu Média Kft. Minden jog fenntartva.