Tag Archives: Big Data

Big Data Revolution

Big Data in a nutshell! Een PBS documentaire over Big Data en wat er mee kan, wat de prijs is die daarvoor moet worden betaald en hoe niet-democratisch gecontroleerde partijen kunnen doen en laten wat ze willen. Tenminste, daar lijkt het op…..

Share This:

The Joy of Data

In deze BBC documentaire verkent de wiskundige Dr Hannah Fry de wereld van data, de wijze waarop het wordt verzameld, opgeslagen, gedeeld en van betekenis voorzien. De ‘Joy of Data’ is over het ontdekken van patronen. Fry ziet data als de brug tussen de gewone, fysieke wereld en de geordende wereld van de wiskunde, waar alles gevangen kan worden in wiskundige vergelijkingen en formules. Het gaat over de verbinding tussen Scrabble en online streaming, verklaart waarom melkkoeien stappenmeters om hebben en onthult het netwerk achter Wikipedia. Fry benadrukt de rol van Claude Shannon, die een manier bedacht om informatie te digitaliseren. Het op een voetstuk plaatsen van Shannon slaat door, maar het blijft een mooie en interessante documentaire. Fry concludeert uiteindelijk dat ondanks alles de mens nodig zal zijn om data betekenis te geven.

Share This:

Big Earth Data: The Film.

Wetenschappers dienen ‘de maatschappij’ op de hoogte te stellen van wat ze doen, welke resultaten ze bereiken en wat de gevolgen en implicaties zijn daarvan. Wetenschappelijk onderzoek is vaak erg moeilijk te communiceren naar een lekenpubliek en goede simplificaties vereist grote inspanning. Daarnaast zijn de media niet altijd geïnteresseerd in wetenschappelijk onderzoek. Het maakt het dus moeilijk om het publiek te informeren wat een wetenschapper onderzoekt en het draagt ook niet echt bij aan wetenschappelijke waardering. Publicaties in belangrijle tijdschriften worden al veel belangrijker gezien.
De TV documentaire ‘Big Earth Data’ vergde lange tijd om een producer te vinden die begreep dat het niet om de aarde en de natuur zelf ging, maar over het menselijke inzicht dat verworven kan worden uit de softwareondersteunde analyse van enorme hoeveelheden data. De resulterende 53 minuten lange film werd uitgezonden in februari 2015 en maakt duidelijk welke uitdagingen er zijn in het managen, analyseren, visualiserenen gebruiken van Big Data. De film presenteert dat proces op begrijpelijke en aandachtvragende wijze. De film duurt lang, maar geeft ook een heel goed inzicht in Big Data en Big Data analysis.

Share This:

Privacy, Data, Democracy

‘We need to move beyond the Silicon Valley model’.
Aral Balkan is oprichter en beangrijkste ontwikkelaar van Ind.ie, een bedrijf dat onafhankelijke alternatieven maakt voor ‘spyware 2.0’. Aral benadrukt dat wij als individuen het eigendom en de controle over onze ‘digitale identiteiten’ moeten hebben. We zijn produkten geworden die bedrijven verkopen aan hun klanten. Dat is het business model van Silicon Valley, wat door wetgevers onvoldoende wordt bestreden. Hij wil met zijn werk fundamentele vrijheden, mensenrechten, en democratie beschermen door onafhankelijke technologie te ontwerpen die niet spioneren op hun gebruikers. Aral heeft het Ind.ie Manifesto geschreven.
Op dit moment werkt hij aan de core van het Ind.ie platform, een gedistribueerd social network: Heartbeat.
In deze video vertelt hij over Heartbeat, en allerlei aspecten inzake privacy, data en democratie. Duidelijk wordt waarom het model van Silicon Valley dient te veranderen.
Hij vertelde dit verhaal op The Conference 2015 in Malmö.

 

Share This:

Digital Data and the City

Nog net voor het sluiten van 2015 verscheen de digitale versie van een artikel over digitale data en de ‘smart city’, een hoofdstuk geschreven in samenwerking met John van de Pas, Mettina Veenstra en Frans Jorna (allen van Saxion Hogescholen). In dit hoofdstuk beschrijven we de bouwblokken van een Smart City Architectuur, waarin wij Informatiemanagement (op basis van Informatiewaardeketen en de Vier Dimensies van Informatie) de plaats geven die het verdient, namelijk als een separaat bouwblok. Het is de eerste keer dat informatiemanagement als een dergelijk fundamenteel onderdeel van een Smart City Architectuur wordt gepositioneerd. We publiceren hier een pre-press van dit hoofdstuk, die in lichte mate afwijkt van het uiteindelijk gepubliceerde. Graag naar het definitieve hoofdstuk verwijzen bij gebruik als referentie. Het boek zelf is verschenen in januari 2016.

Citatie: J. van de Pas, G.J. van Bussel, M. Veenstra, F. Jorna, ‘Digital Data and the City. An exploration of the building blocks of a Smart City Architecture’, D.P. Baker, W. Evans (eds.), Digital Information Strategies. From Applications and Content to Libraries and People (Waltham, MA USA: Chandos Publishing, 2016), Chapter 13, pp. 185-198). PDF

 

Share This:

Over Cloud en Big Data – artikel in META

In META. Tijdschrift voor Bibliotheek en Archief, 2015, nr. 4, blz. 32-35, verscheen mijn artikel ‘Over Cloud en Big Data. Uitdagingen en onontkoombaarheid’. Het is als PDF te downloaden.
 
Ik sluit dat artikel af met de volgende bespiegeling: 
 
“Cloud computing wordt in tijden van bezuiniging vooral gezien als een mogelijke en interessante automatiseringsoptie, ook in bibliotheken, musea en archieven. Het concept biedt vele mogelijkheden om kosten te besparen en tegelijkertijd kwaliteit en performance te verhogen. Uiteraard kunnen die laatste twee alleen indien de hiervoor aangegeven uitdagingen en juridische complicaties kunnen worden ondervangen. Veel organisaties zijn echter vooral gecharmeerd door de kostenverminderingen die kunnen worden gerealiseerd en de mogelijkheden om de eigen, complexe informatie infrastructuren af te bouwen. Ze zijn zich niet echt bewust van de potentiële problematiek, die cloud computing en Big Data met zich meebrengen. Juist die uitdagingen en complicaties echter oefenen rechtstreeks invloed uit op de performance van bedrijfsprocessen en zijn niet zomaar te ondervangen. Dat vergt nogal wat, waardoor het van belang is de organisatorische risico’s goed in kaart te brengen en af te wegen.”
 
Citatie: G.J. van Bussel, ‘Over Cloud en Big Data, Uitdagingen en onontkoombaarheid’, META. Tijdschrift voor Biblotheek en Archief, 2015, nr. 4, pp. 32-35.

Share This:

Big Data Bla Bla

Mijn nieuwe column in IP. Vakblad voor Informatieprofessionals, 2015, nr. 4, p. 25.

“In 2008 schreef Chris Anderson, een redacteur bij Wired, dat de zondvloed aan data (later Big Data genoemd) en nieuwe analysetools de wetenschappelijke methode onnodig maakten en een nieuwe manier waren om de wereld te begrijpen. ‘Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all’.

Big Data blabla-ers (ook evangelisten genoemd) hebben deze idee met vele anekdotes ondersteund en verkondigd. Volgens hen breekt er een nieuwe tijd aan: de dataficatie van onze maatschappij maakt alles meetbaar en doet alle bestaande problemen verdwijnen. Gemakshalve wordt er aan voorbij gegaan dat (zoals onderzoeksbedrijf Gartner stelt) 55% van alle Big Data projecten mislukt, vooral omdat ze niet de optimistische resultaten leveren die vooraf zijn ingecalculeerd. Zélfs het paradepaardje van de Big Data evangelisten niet: het in 2008 gestarte Google Flu Trends (GFT). Het geprofeteerde succes bleek rafelrandjes te kennen. In 2014 werd in Science aangetoond dat de resultaten (nog steeds) niet overeenkwamen met de ‘echte’ feiten. Het voorspellen van grieptrends lukte vele malen beter met drie weken oude, op traditionele wijze verzamelde en geanalyseerde gegevens van griepcentra.”

Lees meer op mijn blog, Bevlogen Bespiegelingen.

Share This:

Big Ideas: Demystifying Hadoop

Patricia Florissi (EMC Americas/EMEA CTO) publiceert regelmatig video’s waarin nieuwe ontwikkelingen op begrijpelijke wijze worden uitgelegd. Dit keer gaat het over Hadoop, een beangrijk verschijnsel in het Big Data-tijdperk. Het gaat in op de geschiedenis, de architecturele principes en de functies van het platform. Nuttig om te bekijken! Het vergt even een wenningsproces aan het accent, maar als dat eenmaal ‘gevallen’ is, is het een interessante, nuttige en vermakelijke 20 minuten.
 

Share This:

Big Data and its Dark Side

Op 6 maart 2013 hielden Viktor Mayer-Schoenberger en Neil Cukier een voordracht over Big Data en vooral over de ‘donkere kant’ van deze Big Data op een door het Berkman Center van de Harvard University georganiseerd seminar hierover. De voordracht werd als volgt aangekondigd: ‘The power of big data—analyzing huge swaths of information to uncover insights and make predictions that were largely impossible in the past—is poised to transform business and society. Yet there is a dark side. Privacy is eroded like never before. And a new harm emerges: predictions about human behavior that may result in penalties prior to actual the infraction being committed. In this talk Viktor Mayer-Schönberger—Professor of Internet Governance and Regulation at Oxford—and Kenneth Neil Cukier—Data Editor of The Economist—take a look at big data’s power, the dangers it poses and how to address them’. Nog in ‘the mood’ van de KVAN Dagen 2014 in Assen over ‘Big Archives’ is deze voordracht wel heel interessant voor iedere informatieprofessional.
 

Share This:

Disaster Big Data? The key to recovery

De Japanse aardbeving van 11 maart 2011 (met de tsunami die daaraan gepaard ging) heeft enorme hoeveelheden data achtergelaten in cyberspace. Deze data vertellen het verhaal van de mensen tijdens (en na) deze ramp. Die data worden Disaster Big Data genoemd. Wat kunnen deze data betekenen voor de toekomst van de heropbouw van dit land? 
 

Share This:

The age of Big Data: voorspellen met data

Een van de genoemde ‘benefits’ van Big Data is het kunnen voorspellen van wat er gaat gebeuren op korte termijn. Dus bijvoorbeeld het voorspellen van criminele handelingen of het plotselinge stijgen of dalen van aandelenkoersen. Of dat werkelijk zo is en ook leidt tot een daadwerkelijke aanpassing van werkwijzen moet nog worden aangetoond. De BBC documentaire Horizon besteedde aandacht aan deze “Age of Big Data” in 2013. Het is een introductie in het fenomeen. De documentaire duurt een uur, maar het is de moeite waard om een idee te krijgen over wat er allemaal ‘zou kunnen’ en de verwachtingen die kunnen ontstaan.

11 februari 2015: de oorspronkelijke film is verwijderd. We verbinden nu met een gecomprimeerde (spaans ondertitelde) versie van 16 minuten.

The Age of Big Data – Recorte do Documentário da BBC. from Carlo Caricchio on Vimeo.

Share This:

What are Big Data – really!

Een animatie van EMC over Big Data: wat is het, wat kunnen we er mee en wat levert het op. Uiteraard vanuit het standpunt van EMC, maar het is een aardige animatie om naar te kijken. De voice over is van EMC’s Patricia Florissi, VP en Global Sales CTO. De animatie zet het fenomeen Big Data in perspectief. Alleen daarom is het al interessant, alhoewel niet alle aspecten aan bod komen. Zo wordt wat minder aandacht besteed aan de complexiteit van de data-representatie en het problematische van de analyse. Deze zullen nog heel wat uitdagingen bieden. Dat er nadruk gelegd wordt op betekenis en relaties is een pre. Voor de rest: er ligt wat nadruk op ‘groot’ als in ‘maat’: een petabyte is ‘big’, maar is geen ‘big data’. De moeite waard om rustig te bekijken….

 

Share This:

The secret life of Big Data

Genevieve Bell, een van de topmensen van Intel, is een Australische antropoloog. Zij is de directeur van Intel’s Interaction and Experience Research. Als keynote van Supercomputing 2013 praat ze over het fenomeen / hype van deze tijd: Big Data. Ze laat zien dat ‘we have been dealing with big data for millennia, and that approaching big data problems with the right frame of reference is the key addressing many of the problems we face today’. Ze heeft samen met Paul Dourish Divining a Digital Future: Mess and Mythology in Ubiquitous Computing geschreven in 2011, een onderzoek naar de sociale en culturele aspecten van ubiquitous computing, met nadruk op de methodologische aspecten die de onderzoeksagenda hebben bepaald daar waar het gaat om ‘ubiquitous computing’. 

 

Share This:

Taming Big Data

Er is niet zo’n groot verschil tussen big en small data. Het zijn de tools die aan het veranderen zijn. En overigens: we zijn ook nog niet zo sterk in het beheren van small data….

TamingBigData-IBM

Share This:

A very short history of Big Data….

Gil Press schreef in mei 2013 in Forbes een artikel over de geschiedenis van Big Data, die al vroeg begon. Hij startte zijn artikel met:

“The story of how data became big starts many years before the current buzz around big data. Already seventy years ago we encounter the first attempts to quantify the growth rate in the volume of data or what has popularly been known as the “information explosion” (a term first used in 1941, according to theOxford English Dictionary). The following are the major milestones in the history of sizing data volumes plus other “firsts” in the evolution of the idea of “big data” and observations pertaining to data or information explosion.”

 
History-of-Big-Data-13-615x1024

Share This:

Data Revolution: exploding data!

De wereld van de Big Data verandert veel: niet alleen de datagroei, maar ook de wijze waarop data wordt gestructureerd en gebruikt. De enorme groei in de hoeveelheid (big) data levert enorme uitdagingen op, maar ook veel mogelijkheden. De bijgaande infographic van CSC visualiseert een aantal trends in het uitbreidende data universum. Bijgevoegd is ook het CSC rapport Data rEvolution (PDF, 8 MB), wat veel informatie geeft over wat Big Data zijn en hoe we er mee om (kunnen) gaan.

CSC_Infographic_Big_Data

Share This:

Waar vind je Big Data ?

De volgende infographic van Kapow Software maakt duidelijk waar Big Data ‘gevonden’ worden.  Of, zoals Kapow zelf stelt: ‘Learn where innovative companies are leveraging critical data from a wide variety disparate internal and external sources to meet business objectives’. We zitten er dus bovenop. Maar kunnen we er nu werkelijk wel zoveel mee ? Hoe harder geroepen wordt dat Big Data ontzettend beangrijk zijn, hoe meer ik me afvraag of dat ook werkelijk wel zo is….

variety-of-big-data-sources-kapow-software-sm

Share This:

Medische Big Data

“Data geek Joel Selanikio talks through the change in collecting health data in the past decade — starting with the Palm Pilot and Hotmail, and now moving into the cloud”. Een TEDx Talk in februari 2013 in Austin: geen volledige opname, maar de meest belangrijke fragmenten in deze video. De moeite waard !
 

Share This:

What is big data ?

2012 was een belangrijk jaar coor de term ‘big data’ en maakte duidelijk dat we een nieuw tijdperk van dataconsumptie hebben bereikt. Eric Schmidt van Google maakt duidelijk hoe overweldigend onze dataconsumptie geworden is: ‘From the dawn of civilization until 2003 humankind generated five exabytes of data. Now, we produce five exabytes everyday’. Dat geeft aan hoe enorm de productie en consumptie van data is geworden.

De meeste media zijn vooral bezig met het genereren van angst voor Big Data en ze zijn genegen het vooral met het ‘Big Brother-fenomeen’ is verband te brengen. En dat is uiteraard ook niet helemaal ten onrechte, want deze data in handen van de ‘verkeerde’ persoon of organisatie kan inderdaad bedreigend zijn. Maar er zijn ook talloze voorbeelden die tonen dat we deze Big Data kunnen gebruiken om onze omgeving te verbeteren. IBM’s supercomputer Watson bijvoorbeeld gebruikt Big Data om de beste kankerbehandeling voor te stellen. Maar dat de uitdagingen voor opslag, backup, herste’, beveiliging en privacy enorm zijn kan niet ontkend worden.

De bijgaande infographic van Deloitte.nl brengt het Bi9 Data vraagstuk in kaart en legt de do’s en don’ts vast.

 

infographic_big_data_v5

Share This: