Meer gegevens beschikbaar dan opslagcapaciteit

11 maart 2008

In 2007 zijn er zoveel gegevens ontstaan dat er meer gegevens zijn dan opslagcapaciteit. Dat lijkt heel vreemd, maar is wel te verklaren. Een groot deel van deze gegevens namelijk bestaat uit 'vluchtige data', zoals streaming video, die niet opgeslagen worden, of caching. Uit onderzoek van IDC in opdracht van EMC blijkt dat er in 2007 281 Exabyte (een exabyte is een miljard Gigabyte) aan digitale gegevens is gegenereerd. Wereldwijd is er een opslagcapaciteit van 264 Exabyte, waardoor er dus 17 exabyte niet opgeslagen kan worden. Het onderzoek is vastgelegd in het rapport 'The diverse and exploding digital universe'. In 2006 schatte IDC de hoeveelheid digitale gegevens nog op 161 Exabyte. 'De schattingen van IDC zijn wat te conservatief geweest', zegt Hans Timmerman, Country Technology Officer (CTO) van EMC Nederland. 'Zo heeft IDC de groei van het gebruik van digitale camera's, digitale televisie en mobiele telefoons verkeerd ingeschat. Ook komen er steeds meer sensor based applicaties, zoals RFID, die kleine datapakketjes versturen'. Aan de groeiende hoeveelheid gegevens lijkt voorlopig geen einde te komen. IDC spreekt de verwachting uit dat de hoeveelheid gegevens ieder jaar met 60 procent gaat groeien. In 2011 'the digital universe will be 10 times the size it was in 2006'. In 2011 is er dan 1800 Exabyte aan digitale data. 'As forecast, the amount of information created, captured, or replicated exceeded available storage for the first time in 2007. Not all information created and transmitted gets stored, but by 2011, almost half of the digital universe will not have a permanent home'.


De diversiteit van de data neemt toe. Het aantal databestanden groeit de helft harder dan de hoeveelheid data. Dat betekent dat IT-afdelingen steeds vaker met kleinere gegevenspakketten te maken krijgen. 'Er moeten meer kleine pakketjes gemanaged worden', zegt Timmerman. Gegevensbeheer wordt steeds belangrijker. In 2007 diende 30 procent van de gegevens beveiligd te worden, was op 25 % wet- en regelgeving van toepassing en moest 20 procent voor lagere tijd bewaard blijven. De grote hoeveelheid gegevens heeft gevolgen voor de IT-afdeling. Timmerman: 'De ICT-afdeling is erg conservatief. In datacenters is in de loop der tijd zoveel gebouwd. Men is blij dat het werkt, daar wordt niet veel meer veranderd. Maar ik denk dat het datacenter nog verder geautomatiseerd kan worden'. Het rapport stelt dat IT afdelingen drie belangrijke uitdagingen hebben: 'One. They will need to transform their existing relationships with the business units. It will take all competent hands in an organization to deal with information creation, storage, management, security, retention, and disposal in an enterprise. Dealing with the digital universe is not a technical problem alone. Two. They will need to spearhead the development of organizationwide policies for information governance: information security, information retention, data access, and compliance. Three. They will need to rush new tools and standards into the organization, from storage optimization, unstructured data search, and database analytics to resource pooling (virtualization) and management and security tools. All will be required to make the information infrastructure as flexible, adaptable, and scalable as possible. We have many of the tools in place — from Web 2.0 technologies and terabyte drives to unstructured data search software and the Semantic Web — to tame the digital universe. Done right, we can turn information growth into economic growth'. Een dergelijke groei van het 'digitaal universum' in vijf jaar tijd zal een enorme impact hebben op onze leefomgeving, 'in terms of both power consumed and electronic waste'. Electronische vervuiling neemt gigantische vormen aan, met een toevoeging van meer dan een miljard objecten per jaar, vooral mobiele telefoons, maar ook andere persoonlijke electronische gadgets en PC's. De overgang naar digitale TV brengt een enorme hoeveelheid analoge TV's, verouderde settop-boxes en DVD's op de vuilnishoop. Die zal in 2011 verdubbeld zijn. 'Power consumption is harder to determine, especially as manufacturers develop power-saving chips and users install power-saving systems, including new cooling and air conditioning and new management systems. But in a study of server power and cooling costs conducted in 2006, IDC found that power and cooling costs are escalating rapidly as newer, denser servers come online. Power consumption that was 1kW per server rack in 2000 is now closer to 10kW. Customers building new datacenters are planning for 20kW per rack'. Het lijkt erop dat denken over 'groene IT' nu echt achter ons ligt. Het wordt tijd om daden om te zetten in woorden.

Share This:

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.