21 augustus 2006
Chris Gladwin, software-ontwikkeling en zakenman uit Chicago, had tijd over toen het zijn bedrijf, de online muziekwinkel Music Now in 2004 verkocht had. Zodoende besloot hij om al zijn muziek, foto's en rondliggende papieren mappen te digitaliseren, iets wat hij al jarenlang van plan was. Toen hij klaar was kwam hij tot de conclusie dat hij 27 GB aan data had, wat gelijk staat aan een bibliotheek van 22.000 boeken. Uiteraard wenste hij dat bestand, waar hij zoveel werk ingestoken had, zo goed mogelijk te beschermen. 'I wondered, 'what are my options?'' zo zegt hij, 'and I realized that none of them were that good'. Maar hij had veel gelezen over het vroege cryptografische onderzoek die informatie veilig houden door het in onderdelen te verdelen en het vervolgens te verspreiden.
Wat begon als een privé verbeteringsproject groeide uit tot het systeem 'Cleversafe'. Voor bedrijven en overheidsorganen die netwerk-data trachten te beveiligen biedt het een eenvoudige manier om digitale documenten en elk mogelijk ander bestand op te slaan in delen die alleen kunnen worden gereconstrueerd door de computers die de bestanden in oorsprong hebben gecreëerd. Het idee van gedistribueerde data-opslag is geen nieuw idee, maar Cleversafe is zo interessant omdat het een open source project is. De technologie wordt uitgegeven onder een vrije licentie, zodat anderen het ontwerp kunnen adopteren om commerciële producten te ontwikkelen. Die benadering draagt bij aan Cleversafe's potentie om de kosten van betrouwbare data-opslag aanzienlijk te verlagen. 'If we distributed data around the world this way, it would be a pretty resilient way to store data', zegt David Patterson, computer wetenschapper van de University of California, Berkeley, een pionier in gedistribueerde gegevensopslag. Gladwin beweert dat Cleversafe data veel goedkoper kan opslaan dan de nu bestaande internetdiensten. Computerwetenschappers stellen dat projecten zoals Cleversafe een indicatie zijn dat het breedband-Internet dezelfde impact zal hebben op data-opslag die het heeft op de communicatietechnologie. Er zijn talrijke webopslagdiensten die gebruikt worden om data veilig op te slaan. Talrijke andere staan klaar om een graantje mee te pukken. Het ontwerp van de meeste van deze webdiensten leidt er toe dat er vijf of meer volledige kopieën van de oorspronkelijke data moeten worden gemaakt om ze op verschillende plekken op te slaan om te garanderen dat de data niet verloren gaat door een of andere catastrophe. Gladwin ontwikkelde een set software routines die de data op zijn PC kopieerden in een groot aantal fragmenten, ook wel 'doorsneden' genoemd. De oplossing had als voordeel dat de originele data gereconstrueerd zouden kunnen worden uit een meerderheid van de doorsneden.Het ontwerp maakt het dus mogelijk een een complete reconstructie van alle data te realiseren, zelfs als sommige van de dragers waar 'doorsneden' op opgeslagen zijn niet meer online zijn. Het experimentele Cleversafe onderzoeksnetwerk bevat 11 opslagsites, verspreid over de wereld, maar Gladwin hoopt op het ontstaan van een netwerk dat tien of honderduizenden opslagplaatsen telt. Hoe meer, hoe groter de mogelijkheden op reconstructie. Het nieuwe is het open source karakter van het project. Het project verspreid de data over haar netwerk in geëncrypteerde 'doorsneden'. De benadering lijkt op het OceanStore project van Berkely, die ook gericht is op het tot stand brengen van een wereldwijd opslagsysteem. 'They're not making a commercially implemented solution', stelt Gladwin. 'Our focus is something that people can use'. Een opslag-analist stelt dat een dergelijke benadering grote mogelijkheden heeft. 'The great thing about storage is that it's always a moving target', zegt Michael Dortch, analist bij de Robert Frances Group. 'The I.T. industry is littered with the bodies of people who have said solution X will never fly'. Het Cleversafe project, met 25 personeelsleden, is gevestigd op de campus van het Illinois Institute of Technology in Chicago. Stewart Alsop is een van de financiers van het project. Hij stelt: 'Data storage on the Internet is one of the most brutally competitive markets in the world. But nobody is using this architecture, and the logical benefits of this are remarkable'. De effecten voor de duurzaamheid van de data zijn groot: hoe meer computers in het netwerk zijn opgenomen, hoe meer 'doorsneden' kunnen worden gemaakt en opgeslagen. Hoe groter de kans dat de data gedurende de tijd bewaard blijft….