What is Knowledge in the Age of Big Data?

A TEDx Square Mile-Talk, door Timandra Harkness

Een zeer relevante vraag: wat is kennis eigenlijk nog als we alles hebben gedataficeerd ? Bestaat het nog ? Of is het een misvatting te denken dat data, informatie en kennis hetzelfde zijn en met een druk op de knop uit Big Data kan worden gepresenteerd ?

Het is een misvatting. En volgens Timandra Harkness is het een gevaarlijke misvatting, zoals blijkt uit de introductie bij de film:

“In the internet age, all human knowledge is only three clicks away – can that be true ? Is knowledge no more than information, or data ? What does it mean to know something, or somebody ? Can a machine know you better than you know yourself ?”

“The reduction of human knowledge, expertise, experience and understanding to stores of data is a fundamental and dangerous mistake”.

“Meaning, reasoning and understanding are not commodities but verbs. To fully benefit from the proliferation of information in the Big Data age, we must restore the human mind to the act of knowing”.

Timandra Harkness presenteert de BBC Radio 4 serie, FutureProofing, en documentaires zoals “Data, Data Everywhere”, “Personality Politics & The Singularity”. Ze is Visiting Fellow (Knowledge Exchange) in Big Data, Information Rights and Public Engagement bij het Centre for Information Rights van de Universiteit van Winchester. In 2016 publiceerde zij het boek Big Data: does size matter?

Share This:

Paradox. A Digital Analytics Documentary

Opgenomen in januari 2019, tijdens de Superweek, een bijeenkomst van digitaal analisten, wetenschappers, denkers en marketeers.

Een inspirerende maar ook verontrustende video over Big Data analyse en de verschillende paradoxen die hierdoor ontstaan. Zoals het feit dat staten volledige surveillance willen reageren op basis van dat zonder enige transparantie (denk aan China), maar dat ICT-bedrijven die analyses uitvoeren (terecht, overigens) aan allerlei beperkingen worden onderworpen.

Maar ook de paradox dat meer data niet betekent dat de uitkomsten beter worden. ‘It can be. If all that data is leading to Analysis Paralysis … or if it leads to falling in love with data analysis itself and forgetting real business outcomes (the reason why you got money for funding the collection of all that data). If no one is using this mountain of data for solving problems, then it’s better that the data not be collected at all’.

Moeten we steeds doorgaan met het verzamelen van data?

Datakwaliteit wordt steeds belangrijker. En hoewel in business analytics de kwaliteit van data over het algemeen redelijk is (niet optimaal, dat is het nooit geweest), is het in web analytics uitermate slecht.

En uiteindelijk is data net zo goed als degene die de data interpreteert. Datakwaliteit alleen zegt niet zo heel veel als de interpretatie hapert, bij de mens of bij het algoritme.

Wat absoluut nodig is, is een nieuw digitaal sociaal contract gebaseerd op wederzijdse transparantie tussen staten en hun burgers.

Genoeg voer om over na te denken en verplichte kost voor ieder data scientist.

Share This:

Amazon, Jeff Bezos and collecting data

Geen bedrijf dat meer data verzameld en opslaat dan Amazon, voorheen alleen maar een online boekverkoper. Jeff Bezos, de baas van het bedrijf, is een van de rijkste mannen ter wereld geworden. Elke tweede euro in online handel wordt besteed bij Amazon.

Over Amazon, dataverzameling en wat het bedrijf daarmee kan doen: daar gaat deze video over. Het is een documentaire van DW Documentary. Zie hier hoe de documentaire wordt geïntroduceerd:

‘Is the IT giant, with its unabated growth, about to turn our economic system upside down? Amazon is a machine that can simultaneously observe, compare and analyze more than 300 million people worldwide. The company is not just a marketplace, market supervisor and provider of more and more services and consumer items – it also controls all the data streams in this market and uses them to its own benefit. Who suspects that a single click on an Amazon page will forward information to the company that fills a printed DIN-A-4 page? A conversation with Alexa, watching a streaming offer on Amazon-Prime, ordering vegetables via Amazon-Fresh – all this put together creates a whole library of information about every customer. The group collects everything – it just won’t reveal what conclusions it draws from it. What would be possible if data from other, new business areas were added? In the USA, Amazon is also active in the health and insurance sectors, and police officers are using its facial recognition software to search for wanted persons’.

Deze documentaire van mei 2019 is dan ook een ‘must see’!

Share This:

The great leap forward

Een documentaire van DW Documentary over Artificial Intelligence en algoritmes, van 2019.

De film wordt als volgt geïntroduceerd:

‘Developments in artificial intelligence (AI) are leading to fundamental changes in the way we live. Algorithms can already detect Parkinson’s disease and cancer, and control both cars and aircraft. How will AI change our society in the future? This documentary journeys to the hot spots of AI research in Europe, the USA and China, and looks at the revolutionary developments which are currently taking place’.

‘The rapid growth of AI offers many opportunities, but also many dangers. AI can be used to create sound and video recordings which will make it more and more difficult to distinguish between fact and fiction. It will make the world of work more efficient and many professions superfluous. Algorithms can decide whether to grant loans, who is an insurance risk, and how good employees are’.

‘But there is a huge problem: humans can no longer comprehend how algorithms arrive at their decisions. And another big problem is AI’s capacity for widespread surveillance. The Chinese city of Rongcheng is already using an AI-supported ‘social credit system’ to monitor and assess its citizens. Does AI pose a danger to our personal freedoms or democracy? Which decisions can we leave to the algorithms – and which do we want to? And what are AI’s social implications?’

Het is een film van Tilman Wolff en Ranga Yogeshwar, ongeveer drie kwartier. De moeite meer dan waard!

Share This:

An interview with Michio Kaku

Michio Kaku (1947) is een van mijn idolen.

Hij is natuurkundige, een van de grondleggers van de ‘string field theory’ (een formeel onderdeel van de snaartheorie waarin het verband met de Kwantum theorie wordt gelegd) en vooral in Amerika en Engeland een gekend pleitbezorger van de natuurwetenschappen, vooral op televisie (BBC, Science Channel). Michio Kaku is geen ‘kleine jongen’ en hij durft ook buiten gebaande paden te treden (misschien wel juist daarom). We hebben al eerder video’s met hem gepubliceerd (zie hier, hier, hier en hier). Voor zijn website zie hier.

Kaku, hoogleraar aan het City College of New York, schreef vele boeken over ‘natuurkunde als science fiction’. Internationaal geldt de zoon van Japanse immigranten als pionier in het denken over ons toekomstige bestaan op deze planeet, en wellicht ook daar voorbij. Als techno-optimist schetst hij de eindeloze mogelijkheden van de wetenschap, en de boodschap van een utopische hi-tech toekomst.

In juni 2019 deed hij een drie kwartier durend interview met Tariq Qureishy, de directeur van Mad Talks, over zijn ideeën over de toekomst, robotics en de absolute angel voor de wetenschap: de Junior High School. De moeite waard om te luisteren.

Share This:

Digits, Connecting to the future

Derek Muller begeleidt ons naar het fysieke hart van het Internet, beschrijft de allereerste boodschap verzonden door Leonard Kleinrock, en laat zien hoe ‘Internet co-creators’ Vint Cerf en Bob Kahn een taal ontwierpen die het Internet zoals we dat kennen mogelijk maakte. Een video uit 2016, ongeveer 50 minuten. Een interessant overzicht. Wel heel Amerikaans, Europese ‘grootheden’ als Berners Lee en Davies ontbreken. Net alsof die geen enkele rol hebben gespeeld.

Share This:

Kantelpunten

De transformatie naar een digitale wereld, waar we allemaal mee te maken hebben, heeft mij uiteraard ingrijpend beïnvloed, zowel privé als zakelijk. Het is de grootste (en meest langdurige) overgang waar ik in mijn leven mee ben (en wordt) geconfronteerd. Opgegroeid in een tijd waarin de computer geen rol speelde leven we nu in een wereld waarin die computer (in welke vorm dan ook) niet meer weg te denken is. Dat betekent accepteren, aanpassen en vooral: laten gebeuren!

Ik herinner me goed dat tot veertig jaar geleden mijn voornaamste hulpmiddelen om een stuk als dit te schrijven een schrijfblok, een vulpen en een typemachine waren. Eind jaren 70 veranderde dat snel. Ik begon te experimenteren met de computers van toen: de Sinclair ZX Spectrum en de Commodore 64. In de jaren daarna werd ik steeds digitaler, al ging dat – ondanks (of misschien wel: dankzij) mijn geëxperimenteer – wel met kleine stapjes. De komst van de desktopcomputer, internet, de mobiele telefoon en de tablet hebben mij grotendeels ‘digitaal’ gemaakt. De komst van onbeperkte opslag (later: in de cloud) en online communicatie hebben dat alleen maar versterkt.

In de OD van mei 2019 schreef ik een stuk over de kantelpunten in mijn werkend leven (en uiteraard ook deels in mijn persoonlijk leven). Ik heb ‘mijn vak’ in de loop der jaren aanzienlijk zien veranderen en dat heeft uiteraard zijn consequenties gehad op mijn beslissingen en mijn activiteiten. Daarover gaat dit verhaal.

G.J. van Bussel, ‘Digitale transformatie en persoonlijke kantelpunten’, OD, nr. 4, mei 2019, blz. 30-32.

Lees hier:

Share This:

The Hidden Secrets Inside of Internet

The Deep Web Documentary

“The Deep Web” is een film, geregisseerd door Alex Winter, ‘chronicling events surrounding Silk Road, bitcoin and politics of the dark web’. Een lange film (plm. 2 uur!) over vooral de digitale zwarte markt Silk Road, vooral bekend als de illegale marktplaats voor de verkoop van drugs. Het gaat in op het ‘Dark Web’, en de wijze waarop Silk Road werd geïnfiltreerd en tot een eide gebracht.

Share This:

The Internet’s Dirtiest Secrets: The Cleaners – Storyville

Duizenden kilometers verwijderd van Silicon Valley, in Manilla om precies te zijn, een team van ‘content moderators’ heeft een doel gesteld gekregen voor het verwijderen van 25000 Facebook, Google en Twitter posts dagelijks. Deze ‘cleaners’ waden door enorme hoeveelheden gewelddadig, aanstootgevend en verontrustende online materiaal (terroristische video’s, kinderpornografie, politieke propaganda, e.d.). Deze ‘cleaners’ zijn individueel verantwoordelijk voor het besluit materiaal te verwijderen of te negeren.

Wie zijn deze ‘cleaners’? Welke criteria hanteren ze (of moeten ze hanteren)? Waar begint censuur? En wat gebeurt er als hun beslissingen het leven van mensen in politieke hotspots als Myanmar of Turkije beïnvloedt?

Deze BBC video toont een verontrustend beeld van social media en social media bedrijven. Het is een fikse zit, maar is het meer dan waard.

Zoals was te verwachten is de video snel offline gehaald. Ik heb hier een verwijzing naar de pagina van de BBC, waarop enkele trailers van de film te zien zijn. Ik laat hieronder een trailer van ongeveer 8 minuten zien die het onderwerp neerzet.

Share This:

Data Never Sleeps

De schatting is dat in 2020 1,7 MB aan data wordt geproduceerd door iedere persoon per seconde. Dat is een gigantische hoeveelheid. De 6de editie van ‘Data Never Sleeps’ geeft een overzicht van de enorme hoeveelheden data die in 2018 iedere minuut worden geproduceerd. De infographic spreekt voor zichzelf.

Data never Sleeps

Share This:

Archivos institucionales en el ‘Mundo 2.0’.

Eind 2018, begin 2019 verscheen in Tábula (een jaarboek van de Asociación de Archiveros de Castilla y León), in nr. 21 (2018), een artikel van mijn hand, getiteld: ‘Archivos institucionales en el ‘Mundo 2.0’. El marco de actuación para el ‘Archive-as-Is’ [Archivo-como-es]’. Dit artikel is een uitvloeisel van mijn artikelen eind 2017 in Archives in Liquid Times, die op deze site eerder zijn gepubliceerd. Voorzien van een nieuwe inleiding en door Verónica Fernández de Cabo and Luis Hernández Olivera in relatief korte tijd vertaald in het Spaans, verscheen het in een mooie uitgave net op het snijpunt van twee jaren.

Het abstract van dit hoofdstuk (zowel in het Spaans als in het Engels):

‘Este trabajo tiene como objetivo encontrar una base teórica viable para la gestión de la información empresarial (EIM) en un Mundo 2.0. El entorno “Archive-as- Is” es una teoría archivística dirigida a la organización. Es un modelo para enten- der el archivo “tal cual”, cómo se diseñó, construyó, procesó, manipuló y administró, y cómo “creció” para constituir el archivo que la organización que lo generó quería que fuera. Desde el momento de su creación, los archivos son dis- torsiones de la realidad, solo presentan imágenes sesgadas del pasado debido a la forma en que las organizaciones (y las personas) se “comportan”.

La contextualización (de los archiveros) será crucial para “corregir” la dis- torsión. El desafío es garantizar que el archivo se pueda utilizar como un recurso “confiable” y se administre de tal manera que una organización pueda sobrevivir a los desafíos de Mundo 2.0. El marco de actuación del “Archive-as-Is” podría uti- lizarse para conseguirlo.’

‘This paper has the objective of finding a viable theoretical foundation for Enterprise Information Management (EIM) in World 2.0. The framework of the “Archive-as-Is” is an organization-oriented archival theory. The framework is a declarative model for understanding the archive “as is”, how it has been designed, constructed, processed, manipulated, and managed, and how it has “grown” to be the archive that the organization that generated it, wanted it to be. From the moment of their creation, archives are distortions of reality, only presenting biased images of the past due to the way organizations (and the people) “behave”.

Contextualizing (by archivists) will be crucial to “correct” that distortion as much as is possible. The challenge in World 2.0 is to ensure that the organizational archive can be used as a “trusted” resource and be managed in such a way that an organization can survive the challenges of World 2.0. The theoretical framework of the “Archive-as-Is” may be the model that could be used to realize just that.’

Het artikel kan in gepubliceerde vorm hier worden gedownload.

Citatie:

G.J. van Bussel, ‘Archivos institucionales en el ‘Mundo 2.0’. El marco de actuación para el ‘Archive-as-Is’ [Archivo-como- es]’, L. Esteve Casellas I Serra and L. Hernández Olivera (eds.), Espacios de memoria. Estrategias y discursos para archivos históricos. Tabula. XII. Estudios Archivísticos de Castilla y Léon (Salamanca, 2018), pp. 41-79.

Share This:

Een zalig Kerstfeest en een goed begin van 2019

Share This:

IT Iconen

Bill Gates en Steve Jobs zijn twee van de meest succesvolle ICT-Iconen van het eind van de 20ste en het begin van de 21ste eeuw. Twee recente biografische films over deze twee IT grootheden laat ik hier volgen.

 

Share This:

Wat is BLOCKCHAIN? Een begrijpelijke film over blockchain technologie.

Ik heb al meerdere malen iets gezegd en geschreven over de blockchain. De bijgaande video van het Centre for International Governance Innovation legt het concept op een begrijpelijke en realistische wijze uit. Let wel: er blijven wel enkele problemen bestaan, zoals opname van informatieobjecten (documenten, video- en audiofiles, e.d.), archiefwettelijke vernietiging en het realiseren van de AVG / GDPR. Maar de video maakt op simpele wijze duidelijk wat de betekenis van de blockchain kan zijn en maakt vooral helder dat het een voortzetting is van een eeuwenoud gebruik van registers, op een nieuwe (nog niet helemaal uitgekristalliseerde) manier. Het is een makkelijk filmpje om naar te verwijzen, zodat op een simpele wijze kan worden uitgelegd wat de technologie inhoudt, zonder in jargon te hoeven vervallen.

Share This:

Symposium E-Discovery 2018: General Data Protection Regulation en het nut van E-Discovery

Het symposium E-discovery 2018 raakte noodzaak én actualiteit. Aanleiding voor dit symposium was de intreding van de Europese privacywet General Data Protection Regulation (GDPR), die t op 25 mei 2018 in werking is getreden. Volgens de Nationale Privacy Benchmark 2017 was 80% van de Nederlandse bedrijven en overheden nog niet klaar voor deze privacywet, die de bescherming van persoonsgegevens regelt. Maar liefst 60% van de bedrijven en overheden wist zelfs niet waar gegevens van burgers of klanten opgeslagen zijn.

Tijdens het symposium spraken professionals over het nut van e-discovery oplossingen en technieken, die (verder) helpen bij het in kaart brengen en verwerken van persoonsgegevens in organisaties. Ook werd er aandacht besteed aan digitaal archiveren in het kader van information governance en aan het juridische spanningsveld tussen E-Discovery en de GDPR. Uiteraard kwam de relatie tussen de GDPR en het Internet of Things aan de orde.

Een Sfeerimpressie:

Share This:

Schommel en ICT

Een niet onbekende karikatuur van ICT-Projecten.

Desalniettemin: het lijkt wel heel erg op wat ICT in overheidsland is: een woud van veelbelovende mislukkingen. Wat de klant vraagt en krijgt zijn twee verschillende dingen, maar een ding is zeker: de prijs is hoog!

Share This:

AVG, E-Discovery en Information Governance

Veel overheden en bedrijven denken dat het met de nieuwe privacy- wet (GDPR) niet zo’n vaart zal lopen. Maar weten zij waar ze alle data bewaren? En wat ermee gebeurt? Het rondslingeren van data is een groot probleem. Bedrijven en overheden hebben hun information governance en informatiewaardeketen niet onder controle.

Volgens de nationale privacy-benchmark van 30 november 2017 is 80 procent van de Nederlandse bedrijven en overheden nog niet klaar voor de nieuwe privacywet; 60 procent van de bedrijven en overheden weet zelfs niet waar de gegevens van burgers of klanten zijn opgeslagen.

In het maartnummer van AG Connect schreven Hans Henseler en Geert-Jan van Bussel over de relatie tussen GDPR (AVG), E-discovery en Information Governance. Klik hier.

Het artikel dient als een introductie voor het 9de Symposium E-Discovery in Leiden, wat dit jaar gewijd is aan GDPR en het nut van E-discovery. Geert-Jan van Bussel neemt hier de eerste presentatie voor zijn rekening over AVG, information Governance en Digital Archiving. Voor meer informatie over dit (kostenloos) te bezoeken symposium, zie hier.

Citatie:

Hans Henseler, Geert-Jan van Bussel, ‘GDPR vereist zoeken en controleren’, AG Connect, maart 2018, pp. 28-31.

Share This:

Blockchain en AVG

In januari 2016 maakte Vitalik Buterin op het blog van Ethereum duidelijk dat blockchain en privacy moeizaam samengaan. Compliance aan de AVG is van belang, vooral vanwege de hoge boetes die door de Autoriteit Persoonsgegevens opgelegd kunnen worden. In hoeverre kan de blockchain overweg met de AVG?

Lees verder op mijn blog Bevlogen Bespiegelingen.

Share This:

Herdruk

In februari 2017 (we werden wat laat op de hoogte gesteld) verscheen ‘Digital Archiving, Green IT and the Environment: Deleting Data to Manage Critical Effects of the Data Deluge’ als laatste (10de) hoofdstuk in Shaun Pather (ed.), Leading Issues in ICT Evaluation Research, Vol. II, Reading: Academic Conferences and Publishing International Ltd, 2017), pp. 200-220.

Dit boek is een compilatie van tien zorgvuldig geselecteerde artikelen (2010-1015), verschenen in The Electronic Journal for Information Systems Research (EJISE), die beschouwd worden als een reflectie van de ‘leading issues’ in de evaluatie van informatiesystemen in de genoemde periode. Als zodanig worden ze beschouwd als ‘invaluable to both the research and practitioner communities’. Het bovengenoemde artikel verscheen in EJISE, vol 18 (2015), nr. 2, pp. 187-198. Een PDF daarvan is hier te downloaden. De tekst van het hoofdstuk is ongewijzigd gebleven, maar wel voorzien van een inleiding door de redacteur. In deze inleiding werd aangegeven waarom dit artikel in de bundel is opgenomen. Ik laat deze redactionele inleiding hieronder volgen.

‘The phenomenal reach of networks in our modern inter-networked society of the 21st century suggests that we are witness to an exponential growth of data storage across both cloud and localised systems. Moore’s law (Moore, 1965) implies a massive increase in requirements for data storage (see e.g. Chip, 2005a). However, given that storage is largely dependent on energy, the inter-networked era is placing an undue premium on the judicious application of limited energy sources. Thus whilst this paper by van Bussel, Smit and van de Pas is not based on a typical IS evaluation problem, it does provide a basis for a new dimension of evaluation. Given that the cost of data storage will decrease as the demand increases, the evaluation of energy costs of IS projects will undoubtedly be necessary. This paper, then, provides a basis on which a new perspective of IS project (ex-ante) should evolve, involving an evaluation of the ‘greenness’ of the IS infrastructure. The outcomes of such evaluation should assist in ensuring that hardware architecture of IS will draw only minimally on the already constrained resources of the natural environment’.

Shaun Pather, Leading Issues, p. 200.

Het boek zelf is verkrijgbaar bij de Academic Bookshop, voor £19.00.

Share This:

Armoede

Filosofen, zoals Derrida, Lacan en Wittgenstein, hebben ons wereldbeeld ingrijpend beïnvloed, ondanks (of misschien dankzij) de tegenstrijdigheden, inconsistenties en vage ideeën die de postmodernistische filosofie karakteriseren. Het idee echter dat ieder individu een eigen belang en (dus) een eigen waarheid heeft is gemeengoed. ‘De waarheid’ en ‘het algemene belang’ bestaan niet. Het samenstel van alle individuele belangen en subjectieve waarheden komt in evenwicht in een ‘vrije markt’.

De (op zijn best: twijfelachtige) vertaling van het postmodernisme naar de praktijk leidde tot extreme ‘economisering’ van onze maatschappij. Productiviteit, efficiëntie en rendement werden de vervangers van morele ideologieën. Burgers zijn klanten, patiënten en studenten respectievelijk zorg- en onderwijsconsumenten, 60-plussers kostenposten, artiesten en kunstenaars creatieve ondernemers.

Lees verder op mijn blog Bevlogen Bespiegelingen.

Share This: