Category Archives: Digital Archiving

Digital preservation: what, why and how ?

Nir Sherwinter is product manager bij Ex Libris en heeft enkele zeer interessante presentatie verspreid via slideshare. Ik neem hier twee van die presentaties op, beide over ‘digital preservation’. De eerste presentatie is een ‘Overview of the world of digital preservation’ uit oktober 2011; de tweede is ‘Digital preservation: whay, why and how’. Beide presentaties geven een mooi overziocht van de stand van zaken en en hoe het probleem van het overleven van informatie aan te pakken.

‘Overview of the world of Digital preservation’

Digital Preservation: what, why and how.

Share This:

The history of email

Email is nu precies 42 jaar een belangrijk medium. Het is op dit moment een onmisbaar onderdeel van het sociale, economische en politieke leven. Er zijn vele veranderingen geweest in email (en de manier waarop het gepresenteerd wordt) sinds het ontstaan ervan als een communicatiemiddel voor universiteiten. Een mooie infographics brengt de geschiedenis van email in kaart. De infographic is gemaakt door reachmail.com bij het 40-jarig bestaan van email in 2011.

email-history-infographic

Share This:

It’s 2013, people !

Een beetje humor is nooit weg ! Alhoewel: wie heeft het beter geregeld ? 

Ontleend aan de Doghousediaries.

It's 2013 people

Share This:

Linking Open Data

Het volgende diagram visualiseert de datasets die in de Linked Open Data Cloud zijn opgenomen met hun relaties. Iedere node in dit diagram representeert een identificeerbare dataset, die als Linked Data is gepubliceerd. Linked Open Data betekent dat de datasets herbruikbaar zijn en gedownload kunnen worden via de Datahub. De laatste versie van dit diagram dateert van september 2011.

Informatie gepubliceerd als Linked Open Data stimuleert het hergebruik van data, omdat je zelf zoveel mogelijk verwijzingen aanbrengt naar kennisbronnen elders en omdat anderen gemakkelijk naar jouw informatie kunnen verwijzen.

Wikipedia definieert Linked Data als ‘a term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web using URIs and RDF’.

Voor wetenschappelijke datasets betekent dit dat uitgevoerd onderzoek kan worden geverifieerd op nasis van de ‘open’ onderzoeksdata. Dat is een belangrijk middel om wetenschappelijk wangedrag tegen te gaan, maar ook om uitgevoerd onderzoek ‘her-uitvoerbaar’ te maken. Het komt de betrouwbaarheid van onderzoek ten goede.

Door op het diagram te klikken wordt een interactieve versie geactiveerd, die het mogelijkmaakt om via elke node van het diagram bij de specifieke data en databeschrijving op de datahub uit te komen. Op die manier zijn de data te bekijken via een preview, zijn kleinere bestanden als een voorbeeld van het bestand te dowbloaden en kan de totale dataset worden gedownload.

By Richard Cyganiak en Anja Jentzsch

 
LOD Cloud Diagram as of September 2011

Share This:

Big Brother is an internet company

Elke activiteit die online op Internet wordt uitgevoerd wordt vastgelegd. Niet alleen door de NSA, maar ook door de grote internetbedrijven. Alle handelingen die tijdens het afnemen van software of ‘diensten’ worden verricht worden vastgelegd in de databases van deze bedrijven. Onderstaande infographic brengt in kaart wat en hoe die bedrijven dat doen, alleen maar met het doel de gebruiker en zijn gedrag in kaart te brengen.

Deze infographic is ontwikkeld door Baynote, een bedrijf dat oplossingen ontwikkeld om de gebruikservaring van online klanten te verbeteren en (uiteraard) gebaseerd op al die verzamelde data.

Infographic_Big_Brother_Tech_Company_06192013

Share This:

Good reasons for email archiving

Het Australische SaveIt is gespecialiseerd in email archiving en heeft een mooie infographic gemaakt om het belang daarvan aan te geven. Nuttig om duidelijk te maken waarom (email) archiving van groot belang is.

 

SaveItInfographicV6

Share This:

The lifespan of storage media

Media zijn niet eeuwigdurend, dat blijkt uit de onderstaande infographic in ieder geval. Theoretisch en rakrisch is dat natuurlijk ook al jaren bekend. De donkergroene balk impliceert de jaren dat het medium in ‘regular use’ is; de lichtgroene balk de tijd dat het medium slechts met extreme zorg kan worden gebruikt.

Overigens: de tijd waarin het medium kan worden gebruikt zegt niets over de mogelijkheden om de informatie die daarop is weggeschreven kan worden gebruikt. Daarvoor zijn hele nadere randvoorwaarden van belang: software, besturingssystemen, hardware compatibiliteit, bestandsformaten, en zo. En uiteraard ook de ‘additional ways media can fail’, waarmee de infographic wordt afgesloten. Een belangrijk aspect voor het langdurige behoud zijn de klimatologische omstandigheden waarin de media worden beheerd. Hoe langer media worden bewaard, hoe extremer de klimaatomstandigheden in de behoudruimten afgestemd moeten worden op de media. Die effecten van het klimaat zijn in deze infographic ideaal. In werkleijkheid is dat bijna nooit zo.

De infographic is van Code 42 Software, Inc en is gemaakt in 2012.

 

storage-media-lifespan

Share This:

Van Records Management naar Information Governance

It’s infographics time !

Zoals ik in mijn vorige post al zei: ik heb iets met infographics de laatste tijd !

Vandaag eentje die het belang laat zien van records management voor information governance.

Een infographic van RSD.
 
ig-evolution-from-records-management-to-information-governance

Share This:

2016: zettabyte-jaar !

Ik heb wat met infographics de laatste tijd !

Tegen het einde van 2016 zal de informatiewereld (tenminste volgens Cisco’s Visual Networking Index, de grens van de Zettabyte passeren, voornamelijk veroorzaakt door video streaming, telefonie (video calling) en mobiele streaming. Dit wordt allemaal versneld door extreem snelle internetsnelheden en data transfers. De hier opgenomen infographic visualiseert ‘how big zettabytes will be’.

De bron van deze infographic is: XO Communications, Are you Ready for 2016: The Year of the Zettabyte.

 

INFOGRAPHIC - 2016 - The Year Of The Zettabyte V6

Share This:

Information Risk Management

Een nieuwe infographic die de risico’s van ‘data loss’ in kaart brengt en information risk management op de kaart zet. De infographic is ontwikkeld door Iron Mountain.

risk-management-research--iron-mountain_5029160563cef

Share This:

What happens in 1 minute on (or related to) the internet ?

Ik heb hier twee infographics opgenomen die aangeven wat er in 60 seconden gebeurt op (of in relatie tot) het internet. De enorme activiteit die er in 1 minuut wereldwijd plaatsvindt is ‘staggering’. Laat inwerken en denk na hoe deze massa organisaties beinvloedt en of het analoge paradigma nog wel een kader biedt om deze problematiek te benaderen.

60scs_v2

60seconds
Bron

Share This:

Backups voor archivering ?

backupHet is afgezaagd, maar laten we er toch nog maar een keer op terugkopmen. Uit onderzoeken blijkt nog steeds dat veel ondernemingen hun gegevens eindeloos lang opslaan en geen grip hebben op het beheer van die gegevens, met alle risico’s van dien.

Hoewel 87 procent van de Nederlandse ondernemingen aangeeft het belang van procedures voor gegevensretentie in te zien, beschikt slechts de helft over zo’n procedure. De andere helft geeft aan de eigen richtlijnen niet of niet altijd op te volgen. Daardoor krijgen deze bedrijven te maken met een ongebreidelde groei van de hoeveelheid opgeslagen documenten, onhoudbare back-uptijden, een verhoogd risico op rechtszaken en dure en inefficiënte ontsluiting.

In veel bedrijven is het nog gebruikelijk alles voor altijd te bewaren. De hoeveelheid gegevens groeit echter exponentieel, dus alles bewaren kost heel veel opslagruimte en stelt grote eisen aan de beschikbare IT-resources. Bedrijven zijn veel meer tijd en geld kwijt aan de negatieve gevolgen van slecht gegevensbeheer en ondermaatse gegevensontsluiting dan aan de maatregelen die ze op dit gebied zouden kunnen nemen.

Continue reading

Share This:

Email management in the cloud

Een reeks video’s over email management in de cloud. De eerste video is hier. De andere video’s zijn via deze link te vinden.

Share This:

Digital Humanities

Vandaag een intrigerend overzicht van wat ‘Digital Humanities’ is op basis van een seminar hierover bij de Columbia University in april 2011. Volgens de bijgevoegde tekst gaat het seminar over het volgende:

‘Digital humanities scholars are a diverse group whose work is the result of cross-pollination among humanities scholarship, computer science, and digital media. Many well-known digital humanities projects apply tools borrowed from computer science—such as data-mining or geographic information systems—to works of literature, historical documents, and other materials traditionally in the domain of the humanities.

What do digital humanities scholars see as the potential of this interdisciplinary field?

And what are the important theoretical and methodological contributions digital humanities can offer to both the humanities and the sciences ?

Panelists: Daniel J. Cohen, Assoc. Professor of History and Director of the Center for History and New Media (CHNM) at George Mason University.

Federica Frabetti, Senior Lecturer in the Communication, Media, and Culture Program at Oxford Brookes University.

Dino Buzzetti recently retired from the Dept. of Philosophy at the University of Bologna’.

Een interessant uitstapje naar een multidisciplinair domein. Het duurt ongeveer 2 uren. Dat is een hele zit, maar het is absoluut de moeite waard!

Share This:

Managing historical collections with IT

Een verhaal van David de Lorenzo van de Bancroft Library (februari 2012):

‘The scope of collection management activities with archival collections have changed and broadened due to advances in technology. With the advent of desktop computing, born-digital records have challenged the long-held precepts of recordkeeping and preservation. Digital imaging and conversion of traditional communication formats has allowed vast quantities of ‘hidden’ materials to be shared with a wider and more diverse audience through the Internet.

Various technological solutions have arisen to manage and make accessible archival collections, some successful and some not. The presentation will review the major technological achievements to date and discuss current trends and future possibilities. This conversation will include a review of mass digitization efforts, the application of Library of Congress MARC 21 and EAD XML, open-source collection management tools like Archivist’s Toolkit, current developments in Electronic Document/Records Management Systems (EDRMS), the potential of digital forensics, as well as, the role of digital curation, the continuum model, and other theoretical advances’.

Share This:

Record Keeping & the fundamental fabrics of the universe

Eind 2012 zond BBC Horizon een tweedelige documentaire uit: Order & Disorder. De eerste aflevering ging over energie. De tweede aflevering, waarnaar we hier verwijzen, gaat over, zoals Jim Al Khalili, hoogleraar Theoretische Natuurkunde aan de Universiteit van Surrey, stelt: ‘one of the most important concepts in the world today – information’.

Hij laat zien hoe wij ‘harnessed the power of symbols, everything from the first alphabet to the electric telegraph through to the modern digital age’. En gedurende deze reis laat hij ons zien dat informatie niet enkel gaat om menselijke communicatie, maar dat verweven is in ‘the fabric of reality’ en dat ‘record keeping’ een van de mechanismen is waardoor informatie voldoet aan de fundamentele natuurkundige wetten.

Een ‘must see’ voor iedere informatieprofessional, omdat het blootlegt wat het belang is van informatie in deze wereld. De documentaire duurt een uur, maar de fenomenale presentatie van Al Khalili laat dat uur razendsnel voorbijgaan.

Share This:

The information deluge

Een webinar van TheBrain, knowledge management software, over manieren om de enorme vloed aan informatie de baas te worden. Ze zeggen er zelf het volgende over:

‘We’re all connected to a vast sea of information: Twitter, email, news and social networking sites, blogs and corporate portals… But with all this information at our fingertips it begs the question: are we getting smarter with all this data or just bogged down?

With TheBrain you can create large networks of information that match your style of thought, finally putting you in control of the deluge of information, instead of it controlling you.

In this must see webinar we’ll cover strategies to master information overload so you can actually leverage relevant information sources and capture your best knowledge.

Learn how to:
• Develop guidelines and ‘Rules of Engagement’ for your data sources
• Setup of a visual workflow of relevancy and urgency for projects and information
• Create a single point of access that leverages key information relationships
• Organize and link organic knowledge hubs
• Integrate files, web and intranet pages in a way that reflects your work style
• Track files, capture new ideas and version documents
• Setup reminders and review Thoughts to better control and manage information’

Het webinar duurt ongeveer 1 1/2 uur. Dat is lang, maar het is wel de moeite, al is de geluidskwaliteit niet 100 %.

Share This:

Datamining en de toekomst

Eric Horvitz van Microsoft Research en Kira Radinsky van het Israëlische Technion-instituut gebruiken software om de digitale archieven van de New York Times en online archieven door te spitten. Ze doen dit in de hoop patronen te ontdekken die het mogelijk maken toekomstige ontwikkelingen rondom bijvoorbeeld humanitaire rampen te voorspellen. 

eric_horvitz_w20De software die ze ontwikkeld hebben doorzoekt behalve 22 jaar aan digitale krantenarchieven van de New York Times ook bronnen als Wikipedia en andere internetsites. Ze zijn met name op zoek naar berichtgeving rondom rampen, ongelukken en rellen. Dergelijke data-mining wordt al langer gedaan, maar voor dit soort onderwerpen gebeurt dat meestal door personen.

Volgens de onderzoekers heeft het gebruik van software om digitale archieven te doorzoeken diverse voordelen boven menselijk onderzoek. Zo kan software makkelijk patronen ontdekken in grote hoeveelheden data, doorzoekt software ook bronnen waar onderzoekers niet aan toe komen, en signaleert de software ook verhalen die de voorpagina’s niet gehaald hebben maar toch belangrijk kunnen zijn in een ontwikkeling. Een van de problemen die de onderzoekers tegenkwamen, was het feit dat lang niet over alle tragische gebeurtenissen uit Afrika uitgebreide berichtgeving is.

Continue reading

Share This: