Azzal már jó ideje foglalkoznak a vállalatok, hogy a big datához értő adattudósokat találjanak a munkaerőpiacon. De hiába az igény, úgy tűnik, egyre nehezebb dolguk lesz. A Gartner például azt jósolja, hogy néhány éven belül mintegy 4,4 millió új munkahelyet hoz létre a big data elemzéseik iránti igény, ám csupán az állások harmadára lesz szakember.
A hagyományos BI és a big data viszonya is terítékre kerülnek az idei CIO Hungary-n.
A probléma elsősorban az, hogy a big datahoz speciális, sok esetben interdiszciplináris szaktudás kell. Itt már az adatelemzésben szerzett tapasztalat nem elég. A magas szintű adattudományi szaktudás mellett ugyanis olyan képességek is kellenek, amelyek a lekérdezések paraméterezésének megtervezésében is segítenek. Mélyebb szinten kell érteniük például a speciális szűrőalgoritmusok megtervezésében. Nem véletlen, hogy az adattudósok általában nem IT-területről érkeznek.
Outsiderek előnyben!
Az azonban csak másodlagos, hogy az adattudósok többsége outsider az informatikai iparágban. Mert ugyanakkor ők az átlagosan legmagasabban képzett alkalmazottak. Egy 2013-as amerikai felmérés szerint például minden tíz adattudósból kilencnek MSc (Master of Science) fokozatú diplomája volt, sőt nagyon nagy arányban PhD fokozattal is rendelkeztek – az Egyesült Államokban. Mint azzal korábban a Bitport is foglalkozott, sokan a nagy presztízsű akadémiai karriert hagyják ott – például a jóval magasabb fizetés reményében –, hogy az adattudományoknak szenteljék életüket.
Az ágazat már most is elsősorban a statisztika, a fizika, az alkalmazott matematika vagy például a közgazdaságtan területéről szipkázza el a legjobbakat. De szükség is van az új szemléletű adatmunkásokra. Az IDC egy globális kutatása szerint ugyanis a big data területe, különösen az adatvizuálizációs eszközök piaca 2,5-szer gyorsabban nő, mint a hagyományos BI.
Az igény tehát óriási, ám még mindig nehéz megtalálni a megfelelő tudású szakembert.
Hagyományos BI és a big data
A szakemberek megtalálását nem csak az nehezíti, hogy a big data jellegű képzések egyelőre gyerekcipőben járnak (Magyarországon például elsőként a CEU indított posztgraduális képzést kifejezetten közgazdászoknak az IBM támogatásával big data szakemberek képzésére), hanem az is, hogy a vállalatok sokszor azt sem tudják felmérni, hogy milyen képességekkel és tudással felvértezett szakembereket keressenek.
Sokan beleesnek abba a csapdába, hogy aki a fejlett analitikához ért, vagy otthon van a gépi tanulás problémakörében, az majd a big datához is ért. De a probléma épp az, hogy itt valami egészen újra, egyfajta valóban interdiszciplináris tudásra van szükség. Ráadásul – és talán ez a kulcsa a big data hatékony felhasználásának – az elméleti háttér mellett szükség van az üzleti folyamatok és célok mély ismeretére is.
Csak mindezek birtokában lehet ugyanis meghatározni ugyanis, hogy meddig tart BI határa, és milyen célokra érdemes bevetni – mellette? vagy a hagyományos BI-megoldásokkal integrálva? – a big datát.
A belső képzés a legjobb út
A big data szakembereket kereső vállalatok között kezd kialakulni az a konszenzus, hogy a legeredményesebb, ha a belső neveléshez folyamodnak. Így igazából csak a jól képezhető, de természetesen megfelelő előképzettséggel rendelkező fiatalokat kell megtalálni. Persze ez sem egyszerű. Egy amerikai vállalat big data részlegének vezetője például az egyetemeken keres fiatalokat, elsősorban fizikusokat. És miért pont fizikusokat? Mert – és akkor jöjjenek a közhelyek – aki fizikus diplomát szerez, kellően okos, analitikus a gondolkodása, jó a modellalkotásban, magas szintű matematikai tudással bír, és a modern fizikai kurzusokon megkövetelik tőle a magas szintű programozási ismereteket is.
Azaz egy jó fizikusban minden együtt van, amire egy jó big data adattudósnak szüksége lehet, az üzleti folyamatokat pedig majd megtanulja a vállalatnál.
Az Excel is jó kiinduló pont lehet
Egy amerikai vállalat menedzsere egészen meglepő felfedezést tett. Szerinte ugyanis az Excel-gurukat simán át lehet képezni big data szakértőkké. Az Excel ugyanis egy roppan rugalmas eszköz. (Hogy mennyire az, azt jól példázza a Karma Platform sikere, amely épp arra épül, hogy ennek a programozható, ezerféleképpen használható eszköznek a kezelését még rugalmasabbá tegye.)
Az Excel ugyanis gyorsan bevethető, rugalmasan alakítható az aktuális üzleti igényekhez és – ami talán a big data szempontjából a legfontosabb – roppant nagy teret enged a kreativitásnak, sőt bizonyos értelemben meg is követeli. Még az excelezéshez szükséges előismeretek tárháza is sok ponton megegyezik a big data igényeivel: alapvető statisztikai ismeretek, modellalkotás, vizualizációs képességek stb.
Összességében tehát nem csak a felsőoktatástól kell várni a kész szakembereket, jöhetnek más területről, sőt valószínűleg a vállalaton belül is vannak megfelelő készségekkel és alapismeretekkel rendelkező szakemberek. Utóbbiak esetleg még az üzleti folyamatokat is értik.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak