A Microsoft Excel táblázatkezelője a hírek szerint hagyományosan sok kellemetlenséget okoz a genetikusoknak, amennyiben egyes gének elnevezése naptári dátumokra hasonlít, és ezeket a szoftver egyrészt dátumként ismeri fel, másrészt ennek megfelelően át is formázza. Ez nem meglepő módon tönkreteszi az egyes adatkészleteket, nagyban megnehezítve a velük való munkát: nem csak a táblázatok szerzőinek kell újra módosítaniuk az adatmezőket, de ha ismét szerkeszteni és menteni akarja az Excel-fájlokat, valaki más nyitja meg azokat, ott a beállítások függvényében ismét dátummá alakul a szóban forgó cellák tartalma.
Az Excel mindezzel együtt az egyik legytöbbet használt adatkezelő- és elemző eszköz ebben a tudományágban is, köszönhetően egyszerűségének és jól ismert funkcióinak. Az adatok agresszív átformázása sok esetben praktikus dolog lehet, a fentiekhez hasonló esetekben azonban minimum kétszer, manuálisan kell korrigálni a hibákat – ez önmagában is frusztráló, de még inkább az, ha valamelyik módosítás észrevétlen marad mondjuk a génexpressziós mátrixokban. A The Verge által idézett 2016-os tanulmány szerint akkor a genetikai témájú anyagok 20 százaléka tartalmazott az Excelből származó hibákat.
Ez a gyakorlatban azt jelenti, hogy a MARCH2 vagy MARC2 jelölésekből például automatikusan 2-Mar vagy March 2nd lesz a táblázatokban, ami még tévedések a visszafejtését is megnehezíti. Ahogy a lap beszámolójából kiderül, a probléma mostanra odáig gyűrűzött, hogy inkább megváltoztatták a HUGO Gene Nomenclature Committee (Génnómenklatúra Bizottság, HGNC) nevezéktanát is a megfelelő helyeken. Mivel az Excel esetében nincs mód az automatikus korrekció teljes kikapcsolására, a szoftvert pedig nem fogják módosítani egy szűk réteget érintő probléma miatt, a bizottság ezzel is kénytelen volt foglalkozni az augusztus elején közzétett ajánlásában.
Semmi személyes, az csak üzlet
A dokumentum kitér az olyan szimbólumokra, melyek befolyásolhatják az adatok kezelését vagy visszanyerését, így a jelölések összesen 27 emberi gén és az általuk kódolt proteinek vonatkozásában változtak meg – egyelőre. A HGNC szerint a változások már tavaly óta élnek, de csak most formalizálták azokat, és az érintett tudósokat már korábban értesítették a várható hivatalos módosításokról. Maguk az elnevezések egyébként széles körű konszenzusra épülnek, és éppen ez az oka, hogy a bizottság figyelembe vette a hosszú ideje viselt az exceles nyomasztást is. A cikk szerint korábban kissé kaotikus volt a dolog, amire jó példa a "Sonic hedgehog" nevű protein, de a HGNC újabb kori iránymutatásai már nem adnak teret a hasonló hóbortoknak.
A The Verge kérdéseire a Microsoft nem adott hivatalos választ ebben az ügyben, de a HGNC nyilatkozó képviselője szerint egész egyszerűen egy annyira limitált felhasználási esetről van szó, hogy csak emiatt nem érné meg nekik érdemben módosítani az Excel működését. A szervezet emiatt praktikusan úgy döntött, hogy ha saját maguk is képesek megoldani a problémát, akkor nem várnak egy esetleges jövőbeni módosításra a Microsoft részéről. Jellemző, hogy az automatikus korrekció ellen már számtalan praktikát fejlesztettek ki, sőt Oct4th néven külön applikáció és parancssori eszköz is elérhető, amely elvileg a gének elnevezését felforgató Excel-funkciókat kerüli meg a CSV/TSV fájlok Excelbe importálásával.
A NIS2-megfelelőség néhány technológiai aspektusa
A legtöbb vállalatnál a megfeleléshez fejleszteni kell a védelmi rendszerek kulcselemeit is.
CIO KUTATÁS
TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?
Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »
Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak