Engelse National Archives: ‘We have a ticking time bomb of data loss’

4 juli 2007

Ook de Engelse National Archives hebben in de gaten dat digitale duurzaamheid een item is en hebben dienaangaande een overeenkomst gesloten met Microsoft. Natalie Ceeney stelt dat 'the growing problem of accessing old digital file formats is a ticking time bomb. Society faces the possibility of losing years of critical knowledge because modern PC's can not always open old file formats'. Ze sprak deze woorden bij de startbijeenkomst van een partnership tussen de National Archives en Microsoft om te verzekeren dat de oude bestandsformaten, die door de National Archives worden beheerd, ook gelezen kunnen worden. Gordon Frazer, verantwoordelijk voor Microsoft's Britse activiteiten, waarschuwde van een dreigende 'digital dark age'. En hij voegde daar aan toe: 'Unless more work is done to ensure legacy file formats can be read and edited in the future, we face a digital dark hole'. Onderzoek door de British Library suggereert dat in Europa jaarlijks drie miljard euro verloren gaat 'in business value because of issues around digital preservation'.

De National Archives, dat archiefmateriaal van de afgelopen 900 jaar beheerd, heeft meer dan 580 Terabyte aan gegevens (vergelijk het met 580.000 keer de Encyclopedia Britannica), opgeslagen in bestandsformaten, die niet langer commercieel beschikbaar zijn en onderhouden worden. Ceeney zei: 'If you put paper on shelves, it's pretty certain it is going to be there in a hundred years. If you stored something on a floppy disc just three or four years ago, you'd have a hard time finding a modern computer capable of opening it. Digital information is in fact inherently far more ephemeral than paper'. Ze voegde er aan toe: 'The pace of software and hardware developments means we are living in the world of a ticking time bomb when it comes to digital preservation. We cannot afford to let digital assets being created today disappear. We need to make information created in the digital age to be as resilient as paper'. Ze gaf aan dat meerdere digitale documentenbestanden reeds verloren zijn gegaan omdat de programma's die ze konden lezen niet langer bestaan. 'We are starting to find an awful lot of cases of what has been lost. What we have got to make sure is that it doesn't get any worse'. De basis van het probleem is de grote hoeveelheid proprietary bestandsformaten die zich gedurende de vroege ontwikkeling van de digitalisering verspreiden. Technologiebedrijven, zoals Microsoft, gebruikten bestandsformaten die niet alleen incompatibel waren met softwareproducten van rivaliserende bedrijven, maar ook met andere versies van de zelfde software. Frazer stelde dat Microsoft zijn positie veranderd heeft. 'Historically within the IT industry, the prevailing trend was for proprietary file formats. We have worked very hard to embrace open standards, specifically in the area of file formats'. En dan verwijst hij naar de ontwikkeling van Office OpenXML, gebruikt om bestanden van Word, Excel en Powerpoint op te slaan. Frazer: 'It's an open international standard under independent control. These are no longer under control of Microsoft and are free for access by all'. Die opmerking ligt echter gevoelig, want de 'openness' van OOXML is twijfelachtig. Critici vragen zich -terecht- af waarom het bedrijf een eigen nieuwe standaard ontwikkelde, terwijl het ook mee had kunnen werken aan de ontwikkeling van ODF. In plaats daarvan heeft Microsoft een tool laten ontwikkelen die vertaalt tussen de twee formaten. Ben Laurie, directeur van de Open Rights Group, zei: 'This is a well-known, standard Microsoft move. Microsoft likes lock-ins. Typically what happens is that you end up with two or three standards'. De National Archives blijft (en dat is terecht) verre van het formaat. De overeenkomst betreft het gebruik van virtualisatie-mogelijkheden. Frazer: 'The archive will be able to read older file formats in the format they were originally saved by running emulated versions of the older Windows operating systems on modern PCs. For example, if a Word document was saved using Office 97 under Windows 95, then the National Archives will be able to open that document by emulating the older operating system and software on a modern machine'. Ceeney stelde dat het probleem van de oudere bestandsformaten een veel groter probleem was dan dat van de snel verouderende gegevensdragers. 'The media it is stored in is not relevant. Back-up is important, but back-up is not preservation'. Adam Farquhar, hoofd e-architecture van de British Library, prijst Microsoft voor de acceptatie van meer open standaarden. 'Microsoft has taken tremendous strides forward in addressing this problem. There has been a sea change in attitude. It's a huge challenge for anyone who keeps digital information for more than 15 years because you are talking about five different technology generations'. Nu moet deze uitspraak met de nodige korrels zout genomen worden, omdat de British Library een Microsoft-bolwerk is, waar niet veel kritische geluiden over de softwaregigant te horen zijn. 'Automation is a key area to work on. We need to be able to convert hundreds and even thousands of documents at a time'. Overigens: ook Ceeney is afkomstig uit de Britisch Library. De keuze voor Microsoft is als zodanig te verklaren. Er zijn meer (en betere) virtualisatie-engines dan die van Microsoft. En er gaan ook nu nog bestandsformaten verloren, want Microsoft's virtualisatie heeft grote problemen met niet-Microsoft omgevingen. Dat kan nog voor grote problemen zorgen….

Share This:

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.