Content Addressable Storage (CAS): hardware-onafhankelijke opslag

15 juli 2006

Een nieuwe speler in de opslagmarkt met wortels in een van de best verkopende 'content-addressable storage ' (CAS)-systemen is een interessante introductie, zeker wanneer het samengaat met een voorstel voor goedkoper en flexibeler CAS. Caringo heeft CAStor geïntroduceerd, een USB memory stick uitgerust met CAS-software voor gebruik met PC's. In tegenstelling tot andere producten in de markt gaat het hier dus om een op software gebaseerd CAS, waarbij het niet uitmaakt welke hardware wordt gebruikt. De oprichter van Caringo is Paul Carpentier, een Belgische technoloog, die in april 2001 zijn patenten werden verkocht aan EMC samen met een door hem opgericht bedrijf FilePool. FilePool ontwikkelde de opslagtechnologie die in EMC's topprodukt Centera is verwerkt. Caroentier wordt in Caringo ondersteund door Jonathan Ring en Mark Goros, die beide grote ervaring hebben in de financiering van technologie-driven bedrijven. CAStor's 'claim to fame', zoals de oprichters zeggen, 'is that it offers a way to set up CAS on secure clustered SATA-based hardware, without requiring a specific vendor's platform, as does EMC's Centera and most other CAS wares on offer today'.

De oprichters van Caringo verwachten dat integrators in staat zijn om vooral aan telecombedrijven, medische instellingen en pharmaceutische bedrijven CAStor aan de man te brengen tegen aanzienlijk goedkopere prijzen dan andere CAS-producten. Er is echter wel het een en ander aan integratie benodigd. De vraag is dan ook in hoeverre in dat opzicht het product positief blijft afsteken tegen producten van EMC, Archivas, Bycast, Nexsan, Permabit, Sun en Symantec/Veritas, die de integratie via de geleverde hardware regelen. Carpentier erkent dat integratie noodzakelijk is, maar zegt dat hij ' created a method that should minimize the effort involved. Instead of creating a set of APIs (application programming interfaces), Caringo engineers have designed a subset of the HTTP protocol to serve as a way for adding specific browser-based functionality to a system. You have to have integration at some point, always. We've made that as painless as possible', zo stelt hij. Hij houdt vol dat andere aspecten CAStor in de CAS-markt zullen onderscheiden. Een van die voordelen is de mogelijkheden die CAStor heeft voor clustering. 'CAStor can be clustered from two to thousands of nodes, allowing for faster data recovery compared with failover RAID systems'. Performance wordt gegarandeerd tot 500 nodes, zo zegt Carpentier. De prijs wordt eveneens als een groot voordeel gezien. Volgens Goros, 'CASstor will be priced at about $500 per disk drive. Hence, a customer could get a two-node CAS system for rackmount PCs containing two 500-Gbyte SATA drives at about $1,000, or $1 per Gbyte. That's considerably less than an entry-level Centera setup, with sells for roughly $80,000 for a four-node configuration'. Een ander verkoopargument is beveiliging. Carpentier heeft een patent op wat hij noemt een 'transparent upgradeable hash'-techniek, dat de hash-indentificatie-code van een CAS-bestand losmaakt van het hash-algoritme dat het bestand beschermt (het zegel of de vingerafdruk). De hash-bescherming kan automatisch worden veranderd zonder dat de data worden gewijzigd. Dat is ook nodig ook, aangezien met het sneller worden van computers hash-codes gebroken kunnen worden. In het Centera-model (dat Carpentier dus ook ontwikkeld heeft) functioneert de 128-bit hash code tegelijk als naam van het bestand, als plaatsaanduiding om het terug te vinden en als digitale handtekening die wijzigingen onmogelijk maakt. Caringo haalt dit nu uit elkaar. 'We keep content safe and upgrade the hash, and we can provide proof that content has never been exposed to corruption', zo stelt hij. Dit gebeurt door middel van continue audit-logs. Dit kenmerk is zeer handig voor klanten die data gedurende zeer lange tijd moeten bewaren, terwijl aan regelgevende instanties kan worden bewezen dat men 'compliant' is. Het klinkt allemaal erg goed, maar er is nog geen bewijs dat het ook werkelijk werkt. Er zijn nog geen klanten die het product kunnen aanbevelen. De oprichters zeggen een handjevol beta-sites te hebben. Ze zijn eind juni in volledige productie gegaan. Het probleem is nog de hash beveiliging. Die wordt namelijk pas over enkele maanden geleverd. Pas op dat moment kan het product succesvol zijn. 'We don’t believe CAS should be in the archiving corner of the data center, which is where EMC parked it', zo gaat Carpentier verder. 'CAS has its own place next to NAS and SAN in a much broader role for storage of fixed content, which is the fastest-growing sector of the market. Our goal is to have something that’s fast enough for primary storage and cheap enough to keep it there'. Dit in tegenstelling tot de meeste andere CAS-systemen die bekend staan om hun trage retrieval.

Share This:

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.