Monk brengt oude handschriften digitaal in beeld

1 november 2010

Het Target project, het grootste publiek-private ICT project in Nederland, heeft een uniek testbed opgeleverd. Het testbed kan nu 1,5 petabytes (1 petabyte = 1.000.000 gigabytes) aan data opslaan en verwerken en zal uiteindelijk een capaciteit hebben van maar liefst 10 petabytes – een hoeveelheid data gelijk aan een stapel DVD’s met een hoogte van 30 x de Martinitoren. Het Target testbed bestaat uit een grote hoeveelheid harde schijven en tapes, die samen één groot opslagsysteem vormen. Het bijzondere aan het Target testbed is het feit dat schijven (en tapes) zich op vier verschillende locaties (storage pools) bevinden in verschillende systemen. Door een ‘state of the art’ netwerk en de gecombineerde kracht van deze systemen ontstaat een zeer snel opslagsysteem met een grote opslagcapaciteit. Deze enorme verwerkingscapaciteit maakt het Target testbed uniek in de wereld. Target is in eerste instantie geïnitieerd door toepassingen binnen de sterrenkunde, één van deze toepassingen is de Lofar radiotelescoop, van stichting Astron. Lofar is ‘s werelds grootste radiotelescoop, bestaande uit lage frequentie antennes die verspreid staan over Noord-Oost Nederland en Europa. Astron zal het testbed gebruiken voor de opslag van de gigantische hoeveelheid gegevens van Lofar in het Lofar Long Term Archief.


LifeLines is een ander voorbeeld van een project dat gebruik zal maken van het Target testbed. In dit project, dat aansluit bij Healthy Ageing, worden DNA-samples van 10.000 mensen opgeslagen, bewerkt en toegankelijk gemaakt. Het Target testbed maakt het mogelijk dat deze samples kunnen worden verwerkt. Eén van de pilots waarvoor het nieuwe testbed gebruikt gaat worden is Monk. Het gaat hier om een samenwerking tussen onderzoekers van de RUG-afdeling Kunstmatige Intelligentie en het Nationaal Archief. De onderzoekgroep heeft een methode ontwikkeld om historische handgeschreven teksten te ontcijferen met behulp van herkenningsalgoritmes en vervolgens digitaal toegankelijk te maken. Zo wordt het mogelijk om het proefschrift van Ubbo Emmius en het ‘Archief van het Kabinet der Koningin’ (KdK) digitaal op te slaan en te annoteren (web-based). De combinatie van Target herkenningsalgoritmes, computers en database engines levert ongekende prestaties op. Uiteindelijk zullen er zo’n 600.000 bladzijden van het KdK op het testbed landen. Op het nieuwe testbed kunnen 2.500 pagina’s per seconde worden doorzocht, zo’n 100 x sneller dan voorheen. Een essentieel onderdeel van het Target project is de valorisatie van kennis. Binnen Target wordt op unieke wijze invulling gegeven aan de valorisatie van kennis, namelijk door een speciaal opgerichte private onderneming Target Holding. Tegelijk met het operationeel worden van het Target testbed zijn nu ook de eerste valorisatietrajecten opgestart. Twee marktpartijen zijn een pilotproject gestart op het nieuwe testbed. Daarnaast zitten er nog verscheidene pilotprojecten in de pijplijn waarmee de Target technologie een brede marktoepassing zal gaan krijgen. Het Target testbed is gebouwd in samenwerking met het Centrum voor Informatie Technologie (CIT) van de RUG en IBM. Op het testbed worden zowel wetenschappelijke als bedrijfsgerichte projecten gelanceerd. Het project Target ging in april 2009 van start: een expertise centrum van de RUG, het UMCG, astronomisch centrum OmegaCEN, de stichting Astron, Target Holding BV, IBM, Task24, Oracle en Heeii. Het project bouwt een kenniscluster en doet precompetitief onderzoek voor de valorisatie van de kennis van haar partners, voornamelijk voor het beheer en het verwerken van zeer grote hoeveelheden (sensor)data.

Share This:

Leave a Reply

Your email address will not be published. Required fields are marked *