Elkészítették és július 8-án a Norvégiához tartozó Spitzbergákon biztonságba helyezték a GitHub pillanatképét. A szigetcsoport Longyearbyen nevű települése mellett lévő elhagyott bányájában, 250 méterrel a föld alatt kialakították azokat a tárolókat, melyekben a 21 terabájtnyi adatot elhelyezték a Piql nevű cég speciális archiváló filmjein. A 186 tekercs a jelenleg legnagyobb nyílt forrású repository február 2-i állapotát rögzíti.
Nem mindent, de minden lényegeset
A pillanatkép nem a GitHub teljes tartalma. Az archívum készítői szelektáltak a projektek közül időben (legalább egy éves múlt kellett), valamint a közreműködők száma (népszerűség) és méret szerint is. A jelentősebb projekteket azonban szinte teljes egészében mentették, de csak a 100 kilobájtnál kisebb bináris fáljlok kerülhettek be az adott repo TAR formátumú tömörített csomagjába.
Az adatok nagy részét QR-kódok segítségével rögzítették. A teljes anyaghoz mellékeltek egy olvasható szöveges útmutatót is. Ez tartalmazza az egyes repók helyét, valamint leírja azt, hogy az archívumból hogyan lehet helyreállítani az eredeti tartalmakat.
A GitHub projektért felelős igazgatója, Julia Metcalf a blogbejegyzésben úgy fogalmazott, hogy a világ nyílt forráskódjanak biztonságos megőrzését oldották meg több mint 1000 évre. Mint a The Register megjegyzi, Metcalfnak kicsit megszaladt a billenytűzete, tekinteve, hogy Piql is csak 500 éves élettartammal hirdeti a filmjeit. De mivel a GitHub blogbejegyzéseit valószínűleg nem őrzik meg így az utókornak, senki sem fog tudni az igazgató nagyotmondásáról – teszi hozzá a lap némi malíciával.
Több archiválási projekt is csőben van
A GitHub tavaly novemberben jelentette be, hogy a Spitzbergákon ki akarnak alakítani egy a Nemzetközi Magbunkerhez hasonló tárolót a repositoryban összegyűlt kód biztonságos megőrzéséhez. Ez azonban csak az egyik eleme a GitHub Archive Programnak. Több párhuzamos módszert is alkalmaznak. A Spitzbergákon elhelyezett archívumnak például van egy másolata, melyet az Oxford Egyetem híres könyvtára, a Bodleian őriz. Emellett a forró adatok biztonságát szolgálja, hogy a GitHubra felkerülő frissítéseket több adatközpontban is replikálják. A nyilvános repókat folyamatosan archiválja az Internet Archivum és a Software Heritage Foundation által működtetett archívum. A folyamatos állapotváltozást figyeli és rögzíti a GH Torrent és a GH Archive projekt. A legambiciózusabb a Microsoft Research projektje, a Silica, amely azzal kísérletezik, hogy kvarcüvegbe femtoszekundumos (10-15 másodperc) lézerimpulzusokkal rögzítsenek adatokat, amelyek így akár 10 ezer évig is tárolhatók.
Sokan, köztük olyanok is, akik egyébként támogatják az ilyen jellegű hosszú távú archiválási próbálkozásokat, leginkább PR-fogásnak minősítik az ilyen akciókat. David Rosenthal, aki az ezredfordulón indította el a Stanford Egyetem égisze alatt a LOCKSS (Lot of Copies Keeps Stuff Safe) nevű digitális archiválási projektet, úgy véli, hogy szerinte senki sem fogja dekódolni a belátható jövőben ezeket az archívumokat. Az ilyen akciók voltaképpen PR-mutatványok, jobb esetben a Voyager űrhajókon elhelyezett aranylemezekhez hasonlíthatók, vagy esetleg a Long Now órához, amely a tervek szerint tízezer évig fog működni: egyetlen racionális céljuk, hogy az embereket rávegyék a hosszú távban való gondolkodásra – írta egy tavalyi blogbejegyzésében Rosenthal.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak