Category Archives: Archieven

Backups voor archivering ?

backupHet is afgezaagd, maar laten we er toch nog maar een keer op terugkopmen. Uit onderzoeken blijkt nog steeds dat veel ondernemingen hun gegevens eindeloos lang opslaan en geen grip hebben op het beheer van die gegevens, met alle risico’s van dien.

Hoewel 87 procent van de Nederlandse ondernemingen aangeeft het belang van procedures voor gegevensretentie in te zien, beschikt slechts de helft over zo’n procedure. De andere helft geeft aan de eigen richtlijnen niet of niet altijd op te volgen. Daardoor krijgen deze bedrijven te maken met een ongebreidelde groei van de hoeveelheid opgeslagen documenten, onhoudbare back-uptijden, een verhoogd risico op rechtszaken en dure en inefficiënte ontsluiting.

In veel bedrijven is het nog gebruikelijk alles voor altijd te bewaren. De hoeveelheid gegevens groeit echter exponentieel, dus alles bewaren kost heel veel opslagruimte en stelt grote eisen aan de beschikbare IT-resources. Bedrijven zijn veel meer tijd en geld kwijt aan de negatieve gevolgen van slecht gegevensbeheer en ondermaatse gegevensontsluiting dan aan de maatregelen die ze op dit gebied zouden kunnen nemen.

Continue reading

Share This:

Archivering van sociale media

Kenny de Vilder voert een onderzoek uit naar de archivering van Sociale Media. Het is een afstudeerproject van de opleiding MIC van de Hogeschool van Amsterdam. Het is een onderzoek dat het Lectoraat Digital Archiving & Compliance ondersteunt.

Hij heeft een korte oline enquete gemaakt, en ik zou iedere bezoeker van deze site willen vragen deze enquete in te vullen. Het geeft essentiele gegevens over hoe organisaties met de archivering van sociale media omgaan. Wellicht dat we op basis hiervan een praktijkinstrument kunnen maken dat door organisaties kan worden gebruikt om greep te krijgen op de archivering van sociale media.

Alvast bedankt voor de medewerking.

De enquete is hier te vinden.

Share This:

Digital Humanities

Vandaag een intrigerend overzicht van wat ‘Digital Humanities’ is op basis van een seminar hierover bij de Columbia University in april 2011. Volgens de bijgevoegde tekst gaat het seminar over het volgende:

‘Digital humanities scholars are a diverse group whose work is the result of cross-pollination among humanities scholarship, computer science, and digital media. Many well-known digital humanities projects apply tools borrowed from computer science—such as data-mining or geographic information systems—to works of literature, historical documents, and other materials traditionally in the domain of the humanities.

What do digital humanities scholars see as the potential of this interdisciplinary field?

And what are the important theoretical and methodological contributions digital humanities can offer to both the humanities and the sciences ?

Panelists: Daniel J. Cohen, Assoc. Professor of History and Director of the Center for History and New Media (CHNM) at George Mason University.

Federica Frabetti, Senior Lecturer in the Communication, Media, and Culture Program at Oxford Brookes University.

Dino Buzzetti recently retired from the Dept. of Philosophy at the University of Bologna’.

Een interessant uitstapje naar een multidisciplinair domein. Het duurt ongeveer 2 uren. Dat is een hele zit, maar het is absoluut de moeite waard!

Share This:

Managing historical collections with IT

Een verhaal van David de Lorenzo van de Bancroft Library (februari 2012):

‘The scope of collection management activities with archival collections have changed and broadened due to advances in technology. With the advent of desktop computing, born-digital records have challenged the long-held precepts of recordkeeping and preservation. Digital imaging and conversion of traditional communication formats has allowed vast quantities of ‘hidden’ materials to be shared with a wider and more diverse audience through the Internet.

Various technological solutions have arisen to manage and make accessible archival collections, some successful and some not. The presentation will review the major technological achievements to date and discuss current trends and future possibilities. This conversation will include a review of mass digitization efforts, the application of Library of Congress MARC 21 and EAD XML, open-source collection management tools like Archivist’s Toolkit, current developments in Electronic Document/Records Management Systems (EDRMS), the potential of digital forensics, as well as, the role of digital curation, the continuum model, and other theoretical advances’.

Share This:

Een boek dat de geschiedenis had kunnen veranderen…

Het verhaal van een boek dat de geschiedenis had kunnen veranderen. Voor de leek is het niets meer dan een klein en relatief nietszeggend Byzantijns gebedenboek, dat echter door Christies voor 2 miljoen dollar werd verkocht. Want nauwelijks zichtbaar onder de gebeden was een uniek geschrift leesbaar, woorden die bijna tweeduizend jaren verloren waren geacht.

De tekst is het enige geschrift van een van ‘s wereld grootste geesten: Archimedes, een wiskundig genie, die zijn tijd eeuwen vooruit was. Het was verborgen in een bibliotheek in het Midden Oosten voor meer dan duizend jaren, overschreven, uit elkaar gehaald, beschilderd, versneden en weer aan elkaar gelijmd. Het geschrift maakt duidelijk hoe geniaal revolutionair Archimedes was. Dit boek is vooral zo belangrijk omdat de wiskundige hierin vastlegde hoe hij tot zijn ideeen kwam.

De documentaire is een knap staaltje historisch onderzoek naar de oorsprong en geschiedenis van een spectaculaire archiefbron.

Ik heb tevens een TED Talk over dit oude handschrift toegevoegd van William Noel, directeur van het Kislak Center for Special Collections, Rare Books and Manuscripts en het Schoenberg Institute for Manuscript Studies van de University of Pennsylvania.

Share This:

The information deluge

Een webinar van TheBrain, knowledge management software, over manieren om de enorme vloed aan informatie de baas te worden. Ze zeggen er zelf het volgende over:

‘We’re all connected to a vast sea of information: Twitter, email, news and social networking sites, blogs and corporate portals… But with all this information at our fingertips it begs the question: are we getting smarter with all this data or just bogged down?

With TheBrain you can create large networks of information that match your style of thought, finally putting you in control of the deluge of information, instead of it controlling you.

In this must see webinar we’ll cover strategies to master information overload so you can actually leverage relevant information sources and capture your best knowledge.

Learn how to:
• Develop guidelines and ‘Rules of Engagement’ for your data sources
• Setup of a visual workflow of relevancy and urgency for projects and information
• Create a single point of access that leverages key information relationships
• Organize and link organic knowledge hubs
• Integrate files, web and intranet pages in a way that reflects your work style
• Track files, capture new ideas and version documents
• Setup reminders and review Thoughts to better control and manage information’

Het webinar duurt ongeveer 1 1/2 uur. Dat is lang, maar het is wel de moeite, al is de geluidskwaliteit niet 100 %.

Share This:

Manuscripten Timbuktu grotendeels gered

Terwijl de radicale moslims lagen te slapen in de historische bibliotheek van het Malinese Timboektoe, haalde de lokale bevolking in het diepste geheim de eeuwenoude en kostbare manuscripten naar buiten. Maandenlang brachten ze zo document na document in veiligheid. Voor zover bekend is vrijwel de gehele kunstschat nu gered, op de inhoud van één enkele kamer na, die in januari uitbrandde.

Dat zegt directeur Christa Meindersma van het Prins Claus Fonds. De organisatie hielp bij de redding. Het Fonds betaalde onder meer mee aan de hutkoffers waarin de documenten werden verstopt, de telefoons en de auto’s voor de Malinezen die de actie uitvoerden, en voor hun eten onderweg.

Meindersma zegt niet hoeveel manuscripten precies uit Timboektoe zijn gehaald en waar de documenten nu zijn. Ze geeft wel aan dat de documenten in Timboektoe in dozen waren opgeslagen. De manuscripten werden eruitgehaald, de dozen bleven staan, waardoor de extremisten niet doorhadden dat het erfgoed onder hun ogen verdween. De reddingsactie riep onder de lokale bevolking een gevoel van saamhorigheid op. ‘Kooplieden hielpen bijvoorbeeld om de documenten verder te brengen’, aldus Meindersma. Continue reading

Share This:

Dataverlies aan de orde van de dag

Kritiek gegevensverlies komt steeds vaker voor: het aantal spoedgevallen steeg in een jaar tijd met 21 procent, concludeert gegevensherstelspecialist Attingo uit zijn interne opdrachtstatistieken. Vooral RAID-systemen en virtualisatie zouden tot incidenten leiden.

Dataverlies
Opvallend vaak wordt in het weekend of op feestdagen een beroep gedaan op de ‘recovery service’. Dat is volgens Attingo geen toeval: om de dagelijke werkzaamheden niet te verstoren voeren IT-afdelingen wijzigingen in hun IT-infrastructuur doorgaans tijdens rustige perioden door. Maar wijzigingen zijn blijkbaar ook een belangrijke bron van datadrama’s.

Attingo claimt gegevens van de gecrashte servers of RAID-systemen in 92 procent van de gevallen te kunnen terughalen. In minder dan 1 procent van de gevallen is RAID-gegevensherstel vanwege onherstelbare schade aan de defecte vaste schijf niet mogelijk. In de resterende 7 procent van de gevallen zijn voorafgaande ‘eigen’ pogingen oorzaak van definitief verlies van gegevens, stelt Attingo. Om zo veel mogelijk merken en typen RAID-controllers te kunnen simuleren, past het bedrijf doorlopend reversed engineering toe op de originele controllersoftware.

Continue reading

Share This:

Datamining en de toekomst

Eric Horvitz van Microsoft Research en Kira Radinsky van het Israëlische Technion-instituut gebruiken software om de digitale archieven van de New York Times en online archieven door te spitten. Ze doen dit in de hoop patronen te ontdekken die het mogelijk maken toekomstige ontwikkelingen rondom bijvoorbeeld humanitaire rampen te voorspellen. 

eric_horvitz_w20De software die ze ontwikkeld hebben doorzoekt behalve 22 jaar aan digitale krantenarchieven van de New York Times ook bronnen als Wikipedia en andere internetsites. Ze zijn met name op zoek naar berichtgeving rondom rampen, ongelukken en rellen. Dergelijke data-mining wordt al langer gedaan, maar voor dit soort onderwerpen gebeurt dat meestal door personen.

Volgens de onderzoekers heeft het gebruik van software om digitale archieven te doorzoeken diverse voordelen boven menselijk onderzoek. Zo kan software makkelijk patronen ontdekken in grote hoeveelheden data, doorzoekt software ook bronnen waar onderzoekers niet aan toe komen, en signaleert de software ook verhalen die de voorpagina’s niet gehaald hebben maar toch belangrijk kunnen zijn in een ontwikkeling. Een van de problemen die de onderzoekers tegenkwamen, was het feit dat lang niet over alle tragische gebeurtenissen uit Afrika uitgebreide berichtgeving is.

Continue reading

Share This:

But storage is cheap ?

Een Yale-Lecture over het voortbestaan van informatie: Digital preservation in the age of abundance. Abby Smith Rumsey, historica en ‘consulting analyst’ over het gebruik van erfgoed in de media, geeft haar mening over het behoud van digitale data en de rol van bibliotheken in het behoud van elektronische media. Het is een hele zit, het is Amerikaans en af en toe wat moeilijk te volgen, maar het is een interessant overzicht van de mogelijkheden.

Share This:

EDiscovery en Records in Amerikaanse juridische procedure

In bijgaande video’s (die de overlegfase bij de rechtbank voor een ediscovery procedure simuleren) wordt duidelijk tot welk bewijsbeslag partijen mogen overgaan en wat de rol is die archieven spelen in een dergelijke procedure. Het is een Amerikaanse situatie, die dus afwijkt van de Nederlandse. Wel is het zo dat ook in Nederland bewijsbeslag mag en is toegestaan, dus de procedure zelf is ook hier niet vreemd.

De inleiding van deze simulatie stelt het volgende: ‘Attorneys for the City of Pleasantville and Global Chemical Corporation are due to appear in federal court … to explain how they intend to proceed in the multiple lawsuits against Global for alleged injuries and environmental cleanup costs that the City and several residents are blaming on Global’s Bugacide division.

Today’s pre-trial conference will focus on the parties’ plans for “discovery,” the stage in a lawsuit during which both sides are allowed to request business records, email communications, personal files, and other documents that may lead to evidence at trial. The parties are required to respond to such requests, but the court has the power to modify or limit requests which go beyond the scope of the lawsuits, are unduly costly or burdensome, or may violate legally-recognized privileges or privacy rights’.

De simulatie kent een viertal video’s, die het totale proces in beeld brengen: interessant videowerk, die helder maakt wat bewijsbeslag en ediscovery inhouden. Het maakt duidelijk hoe belangrijk een goed records management is.

Klik hier.

Share This:

Zicht op het Vaticaans Geheim Archief

Het Vaticaans Geheim Archief spreekt al eeuwenlang tot de verbeelding van eenieder. Voornamelijk door zijn onvergelijkbaar lange en boeiende geschiedenis. Vandaag de dag bevat het Archief maar liefst 84 kilometer aan documenten en het is nog steeds in aangroei. Het beslaat een ononderbroken tijdspanne van meer dan achthonderd jaar. Daarnaast dragen de unieke locatie, de grootse documentaire schatten en de beperkte toegankelijkheid bij tot dit mysterieuze aura. Het waas van geheimzinnigheid dat deze belangrijke instelling van de Heilige Stoel van oudsher omgeeft, met haar allusie op ontoegankelijke geheimen, maar ook de reputatie die zij in die zin meekreeg in de literatuur en de media, maken een publicatie als deze des te aantrekkelijker.

Voor het eerst kreeg een uitgever toestemming om vrij rond te lopen in het Vaticaans Geheim Archief en kon deze bewonderenswaardige plek vastgelegd worden in schitterende foto’s. U legt een onvergetelijke wandeling af langs de meest bijzondere plaatsen en documenten. Van de voor academici toegankelijke leesruimtes tot de ontoegankelijke zalen, gedecoreerd met prachtige 16de en 17de-eeuwse fresco’s, en lokalen waar vele duizenden documenten bewaard worden. Er is ook een korte video beschikbaar, die we hierna laten volgen.

Continue reading

Share This:

Videoreeks Library of Congress

In het kader van het National Digital Information Infrastructure and Preservation Program van de Library of Congress is de Digital preservation Video Series vervaardigd, samen met talloze webcasts en presentaties. Ze zijn uitingen van het streven naar een strategie voor de verzameling, bewaring en toegankelijk making van digitale content. Er zijn films over het bewaren van digitale foto’s, geluid, publieke televisie, websites, etc.

Al deze films zijn hier te vinden.

Ter intro laat ik hieronder twee interessante films volgen uit deze collectie, de eerste over audio en de tweede over digitale foto’s.

Share This:

Webinars over PDF-conversie

Ik neem hier twee webinars op over conversie naar PDF/A. Ze dateren beide uit 2009, maar zijn pas in mei van dit jaar gepubliceerd op YouTube door Luratech. Beide webinars duren ongeveer drie kwartier en geven veel specifieke informatie over deze conversie en migratiefaciliteit. Het eerste webinar gaat over de conversie van ‘born digital’ documenten, de tweede over het gebruik van PDF/A voor gescande documenten.

Share This:

Learning about Archiving

Gogotraining.com biedt een enorme hoeveelheid online opleidingen aan. Een daarvan is ‘Archiving – Data Preservation, Economics, and Compliance’. Het is een interessant overzicht van het domein: gezien vanuit Amerikaans standpunt, maar wel duidelijk en goed te begrijpen. Het Gogo-kanaal op YouTube bevat alle modulen, maar die zijn uiteraard niet allemaal toegankelijk voor niet-betalende bezoekers. ik heb er twee gevonden die vrijelijk te zien zijn. Het ene gaat over de basisprincipes van Archiving en het verschil met backups. Het ander gaat over de economische aspecten ervan. Beide duren ongeveer een half uur.

Update 2 oktober 2014:
op het Gogotraining kanaal op YouTube zijn deze video’s verdwenen. Op de eigen website van GoGo is detraining nog steeds te vinden, maar blijken (m.u.v. de eerste module) de video’s achter een betaalmuur te zitten. Ik kan niet rechtstreeks verbinden met de betreffende video. Vandaar hier de link naar de cursus-site, waarop de eerste module gratis te zien is.

Share This:

Records Management instructie

De site blackvault.com kreeg op basis van de Freedom of Information Act de onderstaande instructiefilm in handen voor FBI-personeel. De film verduidelijkt het belang van Records Management. Nuttig om te zien. Nog interessanter is het om te weten waarom de FOIA nodig was om de film boven tafel te krijgen…. 

 

 

Share This:

‘Archivering is een commodity’

In het juli-augustusnummer van OD verscheen een artikel van Annemieke Adema, waarin ze verslag doet van een interview dat ze had met Geert-Jan van Bussel. Het interview ging over het lectoraat Digital Archiving & Compliance en de visie die daarin wordt gepresenteerd.

‘We zitten nu technologisch op een punt waarop volautomatische archivering mogelijk kan worden. Door studenten en het bedrijfsleven een multidisciplinair platform te bieden waarin samengewerkt kan worden aan prototypen, kunnen hier stappen in worden gezet. Het lectoraat wil dit platform bieden. Een lectoraat heeft de taak om vernieuwend te zijn voor het onderwijs door middel van praktijkgericht onderzoek’.  

Het artikel: Archivering is een commodity.

Citatie: Annemieke Adema, ‘Bijzonder Lectoraat Digital Archiving & Compliance. Archivering is een commodity’, OD, juli-augustus 2012, blz. 7-9.

Share This:

‘Archiving should be just like an Apple’

Op 16 oktober om 16.00 u. zal Geert-Jan van Bussel zijn Lectorale Rede uitspreken in de Kohnstammzaal, op de 9de etage van het Kohnstammhuis van de Hogeschool van Amsterdam. In zijn rede zal hij de breedte van het vakdomein Digital Archiving en Compliance aangeven en zal hij ingaan op de vier dimensies van informatie: Kwaliteit, Context, Relevantie en Voortbestaan. In deze rede zal hij tevens een blik werpen op de competenties van een Digital Archivist (en/of een Compliance Officer). Om U alvast in de sfeer te brengen: de titel is: ‘Archiving should be just like an Apple, en acht andere nuttige (?) stellingen’.

Een Lectorale Rede is openbaar: dat betekent dat iedereen die het vakgebied een warm hart toedraagt, welkom is. De rede is van belang: het Bijzonder Lectoraat Digital Archiving & Compliance is het enige in zijn soort in Nederland. Het wil een stimulans vormen voor het beroependomein, maar ook voor marktpartijen. 

Ik nodig U (en Uw collega’s) van harte uit deze rede bij te wonen. Begin september zal er een speciale pagina op de HvA site worden geopend, waarop U zich kunt inschrijven. 

Mocht U zich nu al willen inschrijven, klik dan hier en geef Uw naam en adres door (als U met meerdere collega’s wilt komen: geef dat dan ook even door).  Ik zorg er dan voor dat U ingeschreven wordt en U ontvangt van mij dan een uitnodiging met alle benodigde gegevens. Als U er zeker van wilt zijn deze rede bij te wonen, schrijft U zich dan vroeg in, want de zaal heeft slechts een beperkte capaciteit (plm. 120-130 personen).

Nogmaals: de rede vindt plaats in het Kohnstammhuis, Wibautstraat 2-4
1091 GM Amsterdam, op de 9de etage in de Kohnstammzaal. Vanaf het Amstelstation neemt U de metro naar het station Weesperplein (2de stop), vanaf Centraal Sation (3de stop).

Geert-Jan van Bussel

Share This:

Hoe Toy Story 2 gered werd….

Een toevallige vondst: een filmpje van Pixar dat duidelijk maakt hoe ze bijna een goot gedeelte van Toy Story 2 kwijtraakten, doordat ‘iemand’ een rm * commando ingaf (‘remove all’). En toen kwam de conclusie dat de backups niet hadden gewerkt ! De technisch directeur van de filmproductie bleek een kopie van de gehele film te hebben gemaakt en die op haar eigen computer thuis te hebben geplaatst. Op deze manier kon het meeste van de film worden gered.

Twee opmerkingen:

  1. Hoe is het mogelijk dat er maar een backupsysteem werkte en dat niet voortdurend werd geverifieerd of de backup juist was. In de film wordt gesuggereerd dat er 20 tot 30 mensjaren werk verloren hadden kunnen gaan.
  2. Het is verwonderlijk dat een film moet worden gered door een illegale kopie: het kan niet anders dan in een bedrijf waarin men uiterst voorzichtig is met ‘things getting out’ in haar beleid blij is met kopieen buiten de muren van het bedrijf. Het redt de film, maar daartoe had men wat anders moeten regelenn

Wat gebeurde er werkelijk ?

Continue reading

Share This: