Van Bussel Document Services

Database Cracking zal zoekresultaten versnellen

2 juli 2010

Onderzoeker Stratos Idreos van het Centrum Wiskunde & Informatica (CWI) in Amsterdam heeft een techniek ontwikkeld om grote databestanden sneller te doorzoeken. Hij noemt zijn methode ‘database cracking’. Daarbij wordt bij elke zoekopdracht de data opnieuw gesorteerd. Daardoor ontstaat een steeds betere sortering en kan bij elke volgende zoekopdracht het antwoord sneller worden gevonden. Binnen de databasetechnologie worden zoekopdracht meestal uitgevoerd via index-structuren. Daarbij wordt vantevoren een zoekindex opgezet en vastgelegd. Idreos claimt de eerste techniek ontwikkeld te hebben waarbij het databasesysteem de rol van de beheerder overneemt. Idreos verdedigt zijn proefschrift 24 juni 2010 aan de Universiteit van Amsterdam.

Share This:

Doet U aan Datawarehousing 2.0. ?

Doet U aan Datawarehousing 2.0. ?

Weet U waarin Uw gegevens worden opgeslagen ? Bent U er zeker van dat ze daarin veilig worden bewaard ? Dat ze niet zomaar toegankelijk zijn voor iedereen die daar een behoefte toe voelt ? Weet U zeker dat U vertrouwelijke gegevens kunt vastleggen, zonder dat de vertrouwelijkheid wordt geschaad ?

Uiteraard is dat deels een kwestie van organisatie, van procedures, van beveiliging, van toetsing en van ethiek. Voor een deel echter heeft dat ook te maken met de databasetechnologie die wordt gebruikt. Het grootste deel van de infomatie, of het nu persoonlijke gegevens zijn, email, tekstdocumenten, spreadsheets, presentaties, video-opnamen, podcasts, sms-berichten en messagingsessies, komt in grote databases terecht. Deze databases worden veelal datawarehouses genoemd.

Laten we eens wat nader ingaan op deze datawarehouses, en dan uiteraard zoals het is gedefinieerd door één van de geestelijke vaders ervan, Bill Inmon . Datawarehouses in deze zin bestaan al vanaf ongeveer 1980. In deze periode hebben ze een evolutie doorgemaakt, waarbij echter de essentie behouden is gebleven. Inmon zelf spreekt over de huidige generatie datawarehouses als Datawarehouse 2.0, waarschijnlijk in analogie met Web 2.0. Deze datawarehouses bevatten, in aanvulling op de specifieke transactiegegevens, (bewerkte) ongestructureerde gegevens in verschillende vormen, metadata, zowel aangaande zakentransacties als aangaande de gebruikte informatietechnologie, (te bewerken) online gegevens, referentiegegevens en gegevens over de ‘live span’ van de opgenomen gegevens.

Share This: