Een database in ‘the cloud’

15 juni 2009

Google experimenteert met een nieuw type relationele database. Fusion Tables, zoals het product genoemd wordt, werkt in een 'cloud'-omgeving (met ander woorden: via het Web) en is nu al in Google Labs te vinden. In plaats van het verwerken van SQL-query's in een traditionele relationele database, zou bij Fusion Tables volgens Google de nadruk liggen op het samenvoegen van data binnen een omgeving waarin wordt samengewerkt. 'Today we're introducing Google Fusion Tables on Labs, an experimental system for data management in the cloud. It draws on the expertise of folks within Google Research who have been studying collaboration, data integration, and user requirements from a variety of domains. Fusion Tables is not a traditional database system focusing on complicated SQL queries and transaction processing. Instead, the focus is on fusing data management and collaboration: merging multiple data sources, discussion of the data, querying, visualization, and Web publishing. We plan to iteratively add new features to the systems as we get feedback from users'. Door deze benadering kunnen meer personen tegelijkertijd aan een database werken, zonder dat de data veroudert, iets dat bij synchronisatie vaak voorkomt. De huidige testversie heeft nog de nodige beperkingen. Datasets die een gebruiker uploadt, in spreadsheetvorm of als CSV-bestand, zijn beperkt tot 100MB per tabel en 250MB per gebruiker. Gebruikers kunnen datasets met elkaar delen of juist tabellen voor anderen ontoegankelijk maken. Met behulp van de Google Visualization-API kan de data op Google Maps gevisualiseerd worden.

Het onderliggende databaseconcept van Fusion Tables, Data-Spaces geheten, kan volgens Stephen Arnold (van Arnold Information Technology) een revolutie betekenen. De techniek werd al begin jaren negentig ontwikkeld door Transformic, een bedrijf dat in 2005 werd opgekocht door Google. 'Data-spaces technology seeks to solve the problem of the multiple data types and data formats that reside in organizations, which have to scrub the data and make it uniform, often at great cost and effort, in order to store and analyze it in conventional databases', zo zegt Arnold. 'Data spaces envisions a system that creates an index that provides access to data in its disparate formats and types, solving what I call the 'Tower of Babel' problem'. Met Fusion Tables kunnen ook vier-dimensionale databases gebouwd worden. Naast de traditionele twee dimensionele tabellen van normale databases, kunnen gerelateerde informatie-elementen zoals product-reviews en blog-postings een derde dimensie vormen. In de vierde dimensie kunnen daar realtime updates worden naastgelegd. 'In the case of Fusion Tables, the technology should allow Google to add to the conventional two-dimensional database tables a third coordinate with elements like product reviews, blog posts, Twitter messages and the like, as well as a fourth dimension of real-time updates', zo zegt hij. 'So now we have an n-cube, a four-dimensional space, and in that space we can now do new kinds of queries which create new kinds of products and new market opportunities'. En hij vervolgt: 'If you're IBM, Microsoft and Oracle, your worst nightmare is now visible. Google is going to automatically construct data spaces and implement new types of queries', zo zegt hij. 'Those guys are going to be blindsided'. Google kan met Fusion Tables automatisch databases aanleggen die ongekende marketingmogelijkheden kunnen bieden.

