Category Archives: Big Data

Een dure les!

In OD van november 2019 publiceerde ik een reactie-column op de column van Daan van Beek aangaande het ‘data lake’. Ik noemde deze reactie Een dure les!, omdat, zoals zo vaak bij dit soort nieuwe technologie, organisaties, bang om achter te blijven, met beide voeten vooruit erin springen om er achteraf achter te komen dat dat misschien toch niet zo handig was. Ondertussen is er een hele hoop geld in gestopt, maar is er wel heel veel ‘geleerd’. Tenminste dat mag gehoopt worden. Het bijgaande bestand bevat zowel de column van Daan van Beek als mijn reactie daarop.

Citatie: G.J. van Bussel, ‘Een dure les!’, OD, november 2019, nr. 7, blz. 7.

Share This:

What is Knowledge in the Age of Big Data?

A TEDx Square Mile-Talk, door Timandra Harkness

Een zeer relevante vraag: wat is kennis eigenlijk nog als we alles hebben gedataficeerd ? Bestaat het nog ? Of is het een misvatting te denken dat data, informatie en kennis hetzelfde zijn en met een druk op de knop uit Big Data kan worden gepresenteerd ?

Het is een misvatting. En volgens Timandra Harkness is het een gevaarlijke misvatting, zoals blijkt uit de introductie bij de film:

“In the internet age, all human knowledge is only three clicks away – can that be true ? Is knowledge no more than information, or data ? What does it mean to know something, or somebody ? Can a machine know you better than you know yourself ?”

“The reduction of human knowledge, expertise, experience and understanding to stores of data is a fundamental and dangerous mistake”.

“Meaning, reasoning and understanding are not commodities but verbs. To fully benefit from the proliferation of information in the Big Data age, we must restore the human mind to the act of knowing”.

Timandra Harkness presenteert de BBC Radio 4 serie, FutureProofing, en documentaires zoals “Data, Data Everywhere”, “Personality Politics & The Singularity”. Ze is Visiting Fellow (Knowledge Exchange) in Big Data, Information Rights and Public Engagement bij het Centre for Information Rights van de Universiteit van Winchester. In 2016 publiceerde zij het boek Big Data: does size matter?

Share This:

Paradox. A Digital Analytics Documentary

Opgenomen in januari 2019, tijdens de Superweek, een bijeenkomst van digitaal analisten, wetenschappers, denkers en marketeers.

Een inspirerende maar ook verontrustende video over Big Data analyse en de verschillende paradoxen die hierdoor ontstaan. Zoals het feit dat staten volledige surveillance willen reageren op basis van dat zonder enige transparantie (denk aan China), maar dat ICT-bedrijven die analyses uitvoeren (terecht, overigens) aan allerlei beperkingen worden onderworpen.

Maar ook de paradox dat meer data niet betekent dat de uitkomsten beter worden. ‘It can be. If all that data is leading to Analysis Paralysis … or if it leads to falling in love with data analysis itself and forgetting real business outcomes (the reason why you got money for funding the collection of all that data). If no one is using this mountain of data for solving problems, then it’s better that the data not be collected at all’.

Moeten we steeds doorgaan met het verzamelen van data?

Datakwaliteit wordt steeds belangrijker. En hoewel in business analytics de kwaliteit van data over het algemeen redelijk is (niet optimaal, dat is het nooit geweest), is het in web analytics uitermate slecht.

En uiteindelijk is data net zo goed als degene die de data interpreteert. Datakwaliteit alleen zegt niet zo heel veel als de interpretatie hapert, bij de mens of bij het algoritme.

Wat absoluut nodig is, is een nieuw digitaal sociaal contract gebaseerd op wederzijdse transparantie tussen staten en hun burgers.

Genoeg voer om over na te denken en verplichte kost voor ieder data scientist.

Share This:

Amazon, Jeff Bezos and collecting data

Geen bedrijf dat meer data verzameld en opslaat dan Amazon, voorheen alleen maar een online boekverkoper. Jeff Bezos, de baas van het bedrijf, is een van de rijkste mannen ter wereld geworden. Elke tweede euro in online handel wordt besteed bij Amazon.

Over Amazon, dataverzameling en wat het bedrijf daarmee kan doen: daar gaat deze video over. Het is een documentaire van DW Documentary. Zie hier hoe de documentaire wordt geïntroduceerd:

‘Is the IT giant, with its unabated growth, about to turn our economic system upside down? Amazon is a machine that can simultaneously observe, compare and analyze more than 300 million people worldwide. The company is not just a marketplace, market supervisor and provider of more and more services and consumer items – it also controls all the data streams in this market and uses them to its own benefit. Who suspects that a single click on an Amazon page will forward information to the company that fills a printed DIN-A-4 page? A conversation with Alexa, watching a streaming offer on Amazon-Prime, ordering vegetables via Amazon-Fresh – all this put together creates a whole library of information about every customer. The group collects everything – it just won’t reveal what conclusions it draws from it. What would be possible if data from other, new business areas were added? In the USA, Amazon is also active in the health and insurance sectors, and police officers are using its facial recognition software to search for wanted persons’.

Deze documentaire van mei 2019 is dan ook een ‘must see’!

Share This:

The great leap forward

Een documentaire van DW Documentary over Artificial Intelligence en algoritmes, van 2019.

De film wordt als volgt geïntroduceerd:

‘Developments in artificial intelligence (AI) are leading to fundamental changes in the way we live. Algorithms can already detect Parkinson’s disease and cancer, and control both cars and aircraft. How will AI change our society in the future? This documentary journeys to the hot spots of AI research in Europe, the USA and China, and looks at the revolutionary developments which are currently taking place’.

‘The rapid growth of AI offers many opportunities, but also many dangers. AI can be used to create sound and video recordings which will make it more and more difficult to distinguish between fact and fiction. It will make the world of work more efficient and many professions superfluous. Algorithms can decide whether to grant loans, who is an insurance risk, and how good employees are’.

‘But there is a huge problem: humans can no longer comprehend how algorithms arrive at their decisions. And another big problem is AI’s capacity for widespread surveillance. The Chinese city of Rongcheng is already using an AI-supported ‘social credit system’ to monitor and assess its citizens. Does AI pose a danger to our personal freedoms or democracy? Which decisions can we leave to the algorithms – and which do we want to? And what are AI’s social implications?’

Het is een film van Tilman Wolff en Ranga Yogeshwar, ongeveer drie kwartier. De moeite meer dan waard!

Share This:

Data Never Sleeps

De schatting is dat in 2020 1,7 MB aan data wordt geproduceerd door iedere persoon per seconde. Dat is een gigantische hoeveelheid. De 6de editie van ‘Data Never Sleeps’ geeft een overzicht van de enorme hoeveelheden data die in 2018 iedere minuut worden geproduceerd. De infographic spreekt voor zichzelf.

Data never Sleeps

Share This:

Warped priorities in the Information Age

In de tijd van Twitter kan informatie en kennis sneller plaatsvinden dan ooit tevoren. Hoe gebruiken we echter dit communicatiekanaal? Zoals de samensteller van deze infographic aangeeft: ‘Well, we mostly use it to talk about a bunch of useless crap’. Beetje sterk uitgedrukt, maar het geeft (voor de US in ieder geval voor wat betreft 2013) enkele voorbeelden die dat wel bevestigen. Interessante infographic, die vastlegt wat wel veelal het gevoel is bij deze social media.

Share This:

Data never sleeps

Domo presenteerde voor de vijfde keer de ‘Data Never Sleeps 5.0’ infographic. De infographic geeft een visueel overzicht van het online gedrag van de internetgebruikrs. De infographic laat zien hoeveel data elke minuut online gegenereerd worden op de populaire platformen, zoals Snapchat, Instagram, Amazon, Twitter, Netflix, Spotify en anderen. Domo introduceerde deze infographic voor het eerst in 2013, als een snapshot in het volume en de snelheid waarin data online worden gegenereerd en gedeeld.

Share This:

Big Data: Biomedicine

Een korte film van ongeveer 20 minuten over de effecten van big data op de ontwikkeling van biomedisch onderzoek. Digitale data worden verzameld en geanalyseerd. De structurering, het delen en het analyseren van deze data zijn cruciaal voor de toekomst van de geneeskunde. Een snelle blik in de ontwikkelingen en de toepassing van big data analyse in biomedische gegevens.

 

Share This:

Big Data Revolution

Big Data in a nutshell! Een PBS documentaire over Big Data en wat er mee kan, wat de prijs is die daarvoor moet worden betaald en hoe niet-democratisch gecontroleerde partijen kunnen doen en laten wat ze willen. Tenminste, daar lijkt het op…..

Share This:

The Joy of Data

In deze BBC documentaire verkent de wiskundige Dr Hannah Fry de wereld van data, de wijze waarop het wordt verzameld, opgeslagen, gedeeld en van betekenis voorzien. De ‘Joy of Data’ is over het ontdekken van patronen. Fry ziet data als de brug tussen de gewone, fysieke wereld en de geordende wereld van de wiskunde, waar alles gevangen kan worden in wiskundige vergelijkingen en formules. Het gaat over de verbinding tussen Scrabble en online streaming, verklaart waarom melkkoeien stappenmeters om hebben en onthult het netwerk achter Wikipedia. Fry benadrukt de rol van Claude Shannon, die een manier bedacht om informatie te digitaliseren. Het op een voetstuk plaatsen van Shannon slaat door, maar het blijft een mooie en interessante documentaire. Fry concludeert uiteindelijk dat ondanks alles de mens nodig zal zijn om data betekenis te geven.

Share This:

National Geographic Channel’s Worlds Smart Cities: San Diego

National Geographic Channel “features San Diego as the only U.S. city in its acclaimed documentary series World’s Smart Cities. San Diego was chosen for its strong technology sector, local innovators, green practices, smart public planning and an unparalleled quality of life. Other selection factors included San Diego’s size of population, demographics/cultural diversity, livability, economy and business climate, educational institutions, leadership and strong sense of community.”
De documentaire is een verkenning van de in grootte achtste stad van de Verenigde Staten, waar technologie, talent en innovatie een nieuwe stedelijke omgeving scheppen, een die “will emerge as a leading city in the 21st century.”
De documentaire duurt ongeveer 50 minuten en geeft een goed beeld van waar met het predicaat “smart city” op gedoeld wordt.

Share This:

The Science of Surveillance

Surveillance is het monitoren van gedrag, activiteiten, of andere veranderende informatie, meestal van mensen, met het doel hen te beïnvloeden, managen, sturen en beschermen. Het kan obeservatie op afstand betreffen met behulp van camera’s, maar ook het onderscheppen van electronisch gecommuniceerde informatie. Het kan ook betrekking hebben op menselijke ‘achtervolgers’, het afluisteren van telefoongesprekken of onderscheppen van de traditionele post.
Dit programma (van ongeveer drie kwartier) introduceert het concept van de ‘surveillance society’ en laat zien hoe technologie wordt ontwikkeld om mensen en objecten te identificeren, monitoren en volgen.
De kijker komt tot de conclusie dat surveillance technologie wijst op een paradox, namelijk dat het voordelen brengt van veiligheid en gemak, maar wel ten koste van verlies aan privacy en individuele vrijheden.
Een ‘must see’!

Share This:

Big Earth Data: The Film.

Wetenschappers dienen ‘de maatschappij’ op de hoogte te stellen van wat ze doen, welke resultaten ze bereiken en wat de gevolgen en implicaties zijn daarvan. Wetenschappelijk onderzoek is vaak erg moeilijk te communiceren naar een lekenpubliek en goede simplificaties vereist grote inspanning. Daarnaast zijn de media niet altijd geïnteresseerd in wetenschappelijk onderzoek. Het maakt het dus moeilijk om het publiek te informeren wat een wetenschapper onderzoekt en het draagt ook niet echt bij aan wetenschappelijke waardering. Publicaties in belangrijle tijdschriften worden al veel belangrijker gezien.
De TV documentaire ‘Big Earth Data’ vergde lange tijd om een producer te vinden die begreep dat het niet om de aarde en de natuur zelf ging, maar over het menselijke inzicht dat verworven kan worden uit de softwareondersteunde analyse van enorme hoeveelheden data. De resulterende 53 minuten lange film werd uitgezonden in februari 2015 en maakt duidelijk welke uitdagingen er zijn in het managen, analyseren, visualiserenen gebruiken van Big Data. De film presenteert dat proces op begrijpelijke en aandachtvragende wijze. De film duurt lang, maar geeft ook een heel goed inzicht in Big Data en Big Data analysis.

Share This:

Privacy, Data, Democracy

‘We need to move beyond the Silicon Valley model’.
Aral Balkan is oprichter en beangrijkste ontwikkelaar van Ind.ie, een bedrijf dat onafhankelijke alternatieven maakt voor ‘spyware 2.0’. Aral benadrukt dat wij als individuen het eigendom en de controle over onze ‘digitale identiteiten’ moeten hebben. We zijn produkten geworden die bedrijven verkopen aan hun klanten. Dat is het business model van Silicon Valley, wat door wetgevers onvoldoende wordt bestreden. Hij wil met zijn werk fundamentele vrijheden, mensenrechten, en democratie beschermen door onafhankelijke technologie te ontwerpen die niet spioneren op hun gebruikers. Aral heeft het Ind.ie Manifesto geschreven.
Op dit moment werkt hij aan de core van het Ind.ie platform, een gedistribueerd social network: Heartbeat.
In deze video vertelt hij over Heartbeat, en allerlei aspecten inzake privacy, data en democratie. Duidelijk wordt waarom het model van Silicon Valley dient te veranderen.
Hij vertelde dit verhaal op The Conference 2015 in Malmö.

 

Share This:

Digital Data and the City

Nog net voor het sluiten van 2015 verscheen de digitale versie van een artikel over digitale data en de ‘smart city’, een hoofdstuk geschreven in samenwerking met John van de Pas, Mettina Veenstra en Frans Jorna (allen van Saxion Hogescholen). In dit hoofdstuk beschrijven we de bouwblokken van een Smart City Architectuur, waarin wij Informatiemanagement (op basis van Informatiewaardeketen en de Vier Dimensies van Informatie) de plaats geven die het verdient, namelijk als een separaat bouwblok. Het is de eerste keer dat informatiemanagement als een dergelijk fundamenteel onderdeel van een Smart City Architectuur wordt gepositioneerd. We publiceren hier een pre-press van dit hoofdstuk, die in lichte mate afwijkt van het uiteindelijk gepubliceerde. Graag naar het definitieve hoofdstuk verwijzen bij gebruik als referentie. Het boek zelf is verschenen in januari 2016.

Citatie: J. van de Pas, G.J. van Bussel, M. Veenstra, F. Jorna, ‘Digital Data and the City. An exploration of the building blocks of a Smart City Architecture’, D.P. Baker, W. Evans (eds.), Digital Information Strategies. From Applications and Content to Libraries and People (Waltham, MA USA: Chandos Publishing, 2016), Chapter 13, pp. 185-198). PDF

 

Share This:

Embedding Privacy in ICT Architectures

Van 23 – 26 oktober 2015 vond in Amsterdam de Amsterdam Privacy Conference plaats, georganiseerd door het Amsterdam Platform for Privacy Research (APPR). Dit is een samenwerkingsverband van privacy onderzoekers binnen de Universiteit van Amsterdam vanuit verschillende achtergronden en disciplines. De conferentie werd uitzonderlijk druk bezocht door rechtswetenschappers, privacy-juristen, informatici, politicologen, cryptologen, e.d. ‘from all around the world’. Samen met John van der Pas (Saxion Hogeschool) presenteerde ik daar een paper waarin we de stelling verkondigen dat de privacy van een burger (en zeker in het Big Data tijdvak!) alleen beschermd kan worden wanneer zijn belang op privacy en de bescherming van zijn persoonsgegevens meegenomen wordt in de ontwikkeling van soft- en hardware-architecturen. We beginnen deze paper als volgt:

“According to Johnson & Grandison (2007), failure to safeguard privacy of users of services provided by private and governmental organisations, leaves individuals with the risk of exposure to a number of undesirable effects of information processing. Loss of control over information about a person may lead to fraud, identity theft, reputation damage, and may cause psychosocial consequences ranging from mild irritation, unease, social exclusion, physical harm or even, in extreme cases, death. Although pooh-poohed upon by some opinion leaders from search engine and ICT industries for over a decade (Sprenger, 1999; Esguerra, 2009), the debate in the wake of events like the tragic case of Amanda Todd could be interpreted as supporting a case for proper attention to citizens’ privacy. Truth be told, for a balanced discussion on privacy in the age of Facebook one should not turn towards the social media environment that seems to hail any new development in big data analysis and profiling-based marketing as a breathtaking innovation. If the myopic view of technology pundits is put aside, a remarkably lively debate on privacy and related issues may be discerned in both media and scientific communities alike. A quick keyword search on ‘privacy’, limited to the years 2000-2015, yields huge numbers of publications: Worldcat lists 19,240; Sciencedirect 52,566, IEEE explore 71,684 and Google scholar a staggering 1,880,000. This makes clear that privacy is still a concept considered relevant by both the general public and academic and professional audiences. Quite impressive for a subject area that has been declared ‘dead’”.

Citatie: J. van de Pas, G.J. van Bussel, ‘Embedding Privacy in ICT Architectures. The citizen as public stakeholder in architecture development’, B. van der Sloot (red.), Proceedings of the Amsterdam Privacy Conference (21-26 October 2015), Amsterdam (Amsterdam: APPR, 2015), 14 pages, incl. references (only available on USB). PDF

Share This:

The Smart City

De voorspelling is dat in 2050 90 % van de bevolking wereldwijd in steden woont. Hoe houden we die steden leefbaar? Hoe zal die stad eruit zien? Ik heb hieronder twee video’s opgenomen over datgene wat ons te wachten staat, en hoe steden ‘slimmer’ worden.

De eerste video is een Australische aflevering van het programma Catalyst, waarin reporter Anja Taylor een aantal innovatieve ideeën onderzoekt om onze toekomstige steden te verbeteren. De film dateert uit 2014.

De tweede video is een samenstelling van drie afzonderlijke films over de het slimmer worden van brandstof, auto’s en gebouwen in 2050. Welke slimme technologie moeten we toepassen om de wereld leefbaar te houden? Welke rol speelt ‘smart technology’?

Op 14 september 2018 was deze tweede film niet meer beschikbaar via YouTube. De link is daarom verwijderd.

Share This:

Big Data Bla Bla

Mijn nieuwe column in IP. Vakblad voor Informatieprofessionals, 2015, nr. 4, p. 25.

“In 2008 schreef Chris Anderson, een redacteur bij Wired, dat de zondvloed aan data (later Big Data genoemd) en nieuwe analysetools de wetenschappelijke methode onnodig maakten en een nieuwe manier waren om de wereld te begrijpen. ‘Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all’.

Big Data blabla-ers (ook evangelisten genoemd) hebben deze idee met vele anekdotes ondersteund en verkondigd. Volgens hen breekt er een nieuwe tijd aan: de dataficatie van onze maatschappij maakt alles meetbaar en doet alle bestaande problemen verdwijnen. Gemakshalve wordt er aan voorbij gegaan dat (zoals onderzoeksbedrijf Gartner stelt) 55% van alle Big Data projecten mislukt, vooral omdat ze niet de optimistische resultaten leveren die vooraf zijn ingecalculeerd. Zélfs het paradepaardje van de Big Data evangelisten niet: het in 2008 gestarte Google Flu Trends (GFT). Het geprofeteerde succes bleek rafelrandjes te kennen. In 2014 werd in Science aangetoond dat de resultaten (nog steeds) niet overeenkwamen met de ‘echte’ feiten. Het voorspellen van grieptrends lukte vele malen beter met drie weken oude, op traditionele wijze verzamelde en geanalyseerde gegevens van griepcentra.”

Lees meer op mijn blog, Bevlogen Bespiegelingen.

Share This: