Big Data Revolution

Big Data in a nutshell! Een PBS documentaire over Big Data en wat er mee kan, wat de prijs is die daarvoor moet worden betaald en hoe niet-democratisch gecontroleerde partijen kunnen doen en laten wat ze willen. Tenminste, daar lijkt het op…..

Share This:

Onwaardig

In 2020 worden wetenschappelijke artikelen van Nederlandse universiteiten en hogescholen vrij toegankelijk. De betaalmuren die de uitgevers om hun wetenschappelijke tijdschriften optrekken zijn een belemmering voor innovatie. Daarnaast moeten universiteiten veel betalen (ongeveer veertig miljoen euro per jaar) voor artikelen die hun eigen wetenschappers geschreven en ge-reviewed hebben. Een prijs zetten op raadpleegbaarheid kan in deze Open Access niet meer. Vooral de overheid staat op het standpunt dat als onderzoek met publiek geld wordt betaald het dus gratis toegankelijk moet zijn. Een curieus argument. Rijksmusea moeten dus gratis betreden kunnen worden?

Nederland kiest als gidsland exclusief voor Open Access volgens de ‘gouden route’. Deze ‘route’ ruilt het abonnementsmodel in voor een article processing charge (APC), waarbij een onderzoeker vooraf een uitgever betaalt om een artikel te publiceren. Na publicatie is het gratis online raadpleegbaar. Deze vorm van Open Access zet een prijs op de publicatie van artikelen, waardoor de uitgeverijen hun omzet veilig kunnen stellen.

Lees verder op mijn blog Bevlogen Bespiegelingen

Share This:

Opslag van data in DNA

“DNA digital storage” verwijst naar elke mogelijkheid om digitale data op te slaan in DNA, dat is geproduceerd door gebruik te maken van “commercially available oligonucleotide synthesis machines for storage and DNA sequencing machines for retrieval”. Het opslagsysteem in DNA is veel compacter dan de huidige magnetische tape of hard drives, omdat de dichtheid van DNA vele malen groter is. Het heeft ook een erg lang leven, zodat de data in stand blijven, tenminste zolang het DNA op een koude, droge en donkere plaats wordt beheerd. Aangezien DNA een universeel en fundamenteel biologisch opslagmechanisme is, is de kans op onleesbaarheid van het medium in de toekomst niet zo heel erg groot (afhankelijk uiteraard van de bewaarcondities). Onderzoekers noemen de opslagmethode “apocalypse-proof” omdat “after a hypothetical global disaster, future generations might eventually find the stores and be able to read them.” Het is echter ook een erg langzame methode want “the DNA needs to be sequenced in order to retrieve the data”. De methode is dus vooral interessant voor data die een lage retrieval graad hebben, weinig worden gebruikt dus, zoals grote hoeveelheden wetenschappelijke data of “long-term archival data”. Over dat laatste s te discussiëren, maar een interessante opslagmethode is het in ieder geval.
Hieronder staat een korte presentatie van Nick Goldman, van het European Bioinformatics Institute, waarin het hele procede van DNA opslag uit de doeken wordt gedaan. Zeer interessant en het kijken waard. Het duurt iets langer dan een kwartier en de kijker weet dan in ieder geval meer dan dat het erg duur is.

Share This:

The Joy of Data

In deze BBC documentaire verkent de wiskundige Dr Hannah Fry de wereld van data, de wijze waarop het wordt verzameld, opgeslagen, gedeeld en van betekenis voorzien. De ‘Joy of Data’ is over het ontdekken van patronen. Fry ziet data als de brug tussen de gewone, fysieke wereld en de geordende wereld van de wiskunde, waar alles gevangen kan worden in wiskundige vergelijkingen en formules. Het gaat over de verbinding tussen Scrabble en online streaming, verklaart waarom melkkoeien stappenmeters om hebben en onthult het netwerk achter Wikipedia. Fry benadrukt de rol van Claude Shannon, die een manier bedacht om informatie te digitaliseren. Het op een voetstuk plaatsen van Shannon slaat door, maar het blijft een mooie en interessante documentaire. Fry concludeert uiteindelijk dat ondanks alles de mens nodig zal zijn om data betekenis te geven.

Share This:

National Geographic Channel’s Worlds Smart Cities: San Diego

National Geographic Channel “features San Diego as the only U.S. city in its acclaimed documentary series World’s Smart Cities. San Diego was chosen for its strong technology sector, local innovators, green practices, smart public planning and an unparalleled quality of life. Other selection factors included San Diego’s size of population, demographics/cultural diversity, livability, economy and business climate, educational institutions, leadership and strong sense of community.”
De documentaire is een verkenning van de in grootte achtste stad van de Verenigde Staten, waar technologie, talent en innovatie een nieuwe stedelijke omgeving scheppen, een die “will emerge as a leading city in the 21st century.”
De documentaire duurt ongeveer 50 minuten en geeft een goed beeld van waar met het predicaat “smart city” op gedoeld wordt.

Share This:

History of Virtual Reality

Virtual Reality is hot! Nu de smartphone een centrale rol gaat spelen in virtual reality scenario’s is het interessant eens te zien hoe de geschiedenis (hoe kort ook) van dat fenomeen er uit ziet. Een korte documentaire die dat verleden uit de doeken doet.

Share This:

The five components of Data Governance

Een infographic over de stadia van data governance (of information governance). Interessante aanpak die erg praktisch kan werken in vele overheidsorganen!

Share This:

The Science of Surveillance

Surveillance is het monitoren van gedrag, activiteiten, of andere veranderende informatie, meestal van mensen, met het doel hen te beïnvloeden, managen, sturen en beschermen. Het kan obeservatie op afstand betreffen met behulp van camera’s, maar ook het onderscheppen van electronisch gecommuniceerde informatie. Het kan ook betrekking hebben op menselijke ‘achtervolgers’, het afluisteren van telefoongesprekken of onderscheppen van de traditionele post.
Dit programma (van ongeveer drie kwartier) introduceert het concept van de ‘surveillance society’ en laat zien hoe technologie wordt ontwikkeld om mensen en objecten te identificeren, monitoren en volgen.
De kijker komt tot de conclusie dat surveillance technologie wijst op een paradox, namelijk dat het voordelen brengt van veiligheid en gemak, maar wel ten koste van verlies aan privacy en individuele vrijheden.
Een ‘must see’!

Share This:

Big Earth Data: The Film.

Wetenschappers dienen ‘de maatschappij’ op de hoogte te stellen van wat ze doen, welke resultaten ze bereiken en wat de gevolgen en implicaties zijn daarvan. Wetenschappelijk onderzoek is vaak erg moeilijk te communiceren naar een lekenpubliek en goede simplificaties vereist grote inspanning. Daarnaast zijn de media niet altijd geïnteresseerd in wetenschappelijk onderzoek. Het maakt het dus moeilijk om het publiek te informeren wat een wetenschapper onderzoekt en het draagt ook niet echt bij aan wetenschappelijke waardering. Publicaties in belangrijle tijdschriften worden al veel belangrijker gezien.
De TV documentaire ‘Big Earth Data’ vergde lange tijd om een producer te vinden die begreep dat het niet om de aarde en de natuur zelf ging, maar over het menselijke inzicht dat verworven kan worden uit de softwareondersteunde analyse van enorme hoeveelheden data. De resulterende 53 minuten lange film werd uitgezonden in februari 2015 en maakt duidelijk welke uitdagingen er zijn in het managen, analyseren, visualiserenen gebruiken van Big Data. De film presenteert dat proces op begrijpelijke en aandachtvragende wijze. De film duurt lang, maar geeft ook een heel goed inzicht in Big Data en Big Data analysis.

Share This:

‘Information Accessibility, Archiving and Organizational Accountability in a digital age

Op 26 oktober 2016 mocht ik een keynote uitspreken op het congres Trust and Transparancy in E-Government, georganiseerd door de Hogeschool van Oslo en Akershus in Oslo. Samen met Luciana Duranti, hoogleraar Archivistics aan de University of British Columbia in Vancouver, die de eerste keynote uitsprak, mocht ik het congres inleiden. Ik besteedde in mijn voordracht vooral veel aandacht aan de relatie tussen toegankelijkheid, archivering en verantwoording. Het was een interessant congres, waarop (voor zover ik weet) voor de eerste keer expliciet nadruk werd gelegd op de nauwe relatie tussen eGovernment en archivering. Een van de interessante facetten van mijn keynote was de revitalisering van Eric Ketelaar’s concept Archivalisering als een aanduiding van de sociale dynamiek binnen organisaties en de effecten die dat heeft op de omgang met informatie. Ik gebruikte dat concept als aanduiding van bewuste en onbewuste effecten van persoonlijk gedrag in organisaties. Een iets andere betekenisinhoud dan Ketelaar voor ogen stond bijna twintig jaar geleden. Het is dan ook de vraag of ik het concept hiervoor wel kan gebruiken, want het is erg moeilijk een concept van een andere betekenisinhoud te voorzien dan oorspronkelijk bedoeld.

Voor de uitgesproken keynote klik hier.

Citatie:

G.J. Van Bussel, ‘Information Accessibility, Archiving and Organizational Accountability in a digital age’, Proceedings of the International Conference Trust and Transparancy in E-Government, Oslo, October 26, Keynote 2 (only in electronic format on DVD).

Share This:

An Accountability Challenge

In september 2016 participeerde ik in de European Conference on Information Systems management in Evora (Portugal) en presenteerde ik een paper over de rol van context in Enterprise Information Systems. Het draaide daar vooral op de uitdaging die context vorm voor het afleggen van verantwoording. De belofte die Enterprise Information Systems bieden op accountability en compliance worden niet of nauwelijks ingevuld. Een van de redenen daarvoor is het feit dat het belang van archivering niet of nauwelijks wordt onderkend. Archivering zorgt er voor (hoewel ook dit niet eenvoudig is) dat informatie verbonden blijft met de context. De paper biedt een beschouwing over hoe dat in Enterprise Information Systems zou kunnen.

Voor de paper: klik hier.

Citation:

G.J. Van Bussel, ‘An Accountability Challenge. Capturing records and their context in Enterprise Information Systems’, P. Silva, A. Guerreiro and R. Quaresma (eds.), Proceedings of the 10th European Conference of Information Systems Management. ECISM 2016, Evora, Portugal, 8-9 September 2016 (Reading: ACPI, 2016), pp. 204-211.

Share This:

Filter

In 2011 publiceerde de internet activist Eli Pariser ‘The Filter Bubble: What the Internet is hiding from you’, een veelgeprezen, maar ook zeer bekritiseerd boek over de ‘informatiebubbel’. Pariser beweerde dat website-algoritmes, zoals die van Google, door middel van personalisatie selectief pro­beren te bepalen welke informatie gebruikers willen zien, waarbij ze weinig (of geen) informatie zien die eigen standpunten tegenspreekt. Het gevolg daarvan is isolatie van gebruikers in hun eigen culturele en ideologische luchtbel. In een artikel van december 2015 in Ethics and Information Technology stellen Engin Bozdag en Jeroen van de Hoven dat de ‘filter bubble’ daadwerkelijk een probleem is en dat algoritmes gemaakt om deze te bestrijden niet probleemloos werken. Een onderzoek van journalisten van het Eindhovens Dagblad begin januari van dit jaar gaf aan dat links-liberale journalisten en nieuwsmedia geen weet hebben van nieuwsinterpretaties die buiten hun eigen ideologische of politieke gedachtegoed worden geformuleerd. En omgekeerd. Maatschappelijk is zo’n informatiebubbel problematisch. Het leidt tot een nieuwe verzuiling.

Lees verder op mijn blog Bevlogen Bespiegelingen.

Share This:

Robots

In september berichtte Metro over de vrees van jongeren dat ze hun baan gaan verliezen aan robots. Die vrees is niet onterecht. De invloed van robots en datagedreven automatisering is groot, zeker in fabrieken waar routinematige werkzaamheden aan een ‘lopende band’ al grotendeels gemechaniseerd plaatsvinden. De data analytics afdeling van het management adviesbureau Deloitte voorspelde onlangs dat de komende twintig jaar tussen de twee en drie miljoen banen gaan verdwijnen. Frey en Osborne schreven in 2013 in The Economist al dat de kans uiterst groot is dat hele beroepen binnen twintig jaar verdwijnen!

Routinematig werk wordt door machines overgenomen. Niet alleen laaggeschoold productiewerk, ook werk dat door MBO’ers, HBO’ers en academici wordt uitgevoerd. Analyseren van MRI scans en röntgenfoto’s bijvoorbeeld. Het nemen van beslissingen over vergunningen. Het kopen en verkopen van aandelen. Het beheren van archieven. Het bepalen en samenstellen van een dieet. Etcetera, etcetera.

Lees verder op mijn blog Bevlogen Bespiegelingen.

Share This:

Archivalisering

Begin september was ik spreker op een conferentie over ‘information systems management’ in Evora (Portugal). Ik sprak over het belang van context voor het reconstrueren van het verleden. Die reconstructie is nodig om be­wijs en verantwoording te kunnen afleggen. Het is nodig om te laten zien dat wetten, regels en procedures daadwerkelijk zijn uitgevoerd. Compliance wordt dat genoemd.

Het was een populair onderwerp op die conferentie. Dat is niet vreemd, want veel informatiesystemen worden door organisaties gebruikt om compliance af te dwingen in bedrijfsprocessen. Denk aan SAP, PeopleSoft of zaaksystemen. Er waren presentaties over hoe bedrijfspro­cessen met informatiesystemen kunnen worden ingericht en geconfigureerd om alle benodigde wet- en regelgeving uit te voeren, alle han­delin­gen en activiteiten te besturen en, zo werd benadrukt, de ‘performance’ van het pro­ces te verbeteren.

Lees verder op mijn blog Bevlogen Bespiegelingen.

Share This:

Professie

Computerized Archival Science. Onder die noemer is Victoria Lemieux, associate professor in de onderzoeksgroep van Luciana Duranti bij de University of British Columbia in Vancouver, gestart met een nieuw project.

Op Research Gate beschrijft Lemieux dat computers archiveringsprocessen (als waardering, ordening en beschrijving, behoud en toegankelijkheid) efficiënter kunnen maken. Ze wil computers de ver­wer­king, analyse, opslag en behoud van archiefinformatie laten uitvoeren.

Lemieux’ vooronderstelling is dat traditionele werkwijzen onvoldoende zijn om gro­te massa’s digitale infomatieobjecten te verwerken. Dat is bekend, maar er be­staat huiver voor de gevolgen (houden archivarissen werk?). Lemieux schudt die huiveringen af. Wat ze wil doen bouwt voort op Duranti’s onderzoek naar digitale diplomatiek: het ontwaren van de vorm- en structuurvereisten van digitale informatieobjecten die de integriteit en authenticiteit van informatie waarborgen. Dat onderzoek heeft geleid tot al­lerlei criteria die door informatietechnologie kunnen worden gebruikt om ge­auto­matiseerd betrouwbare informatieobjecten te realiseren.

Lees verder op mijn blog Bevlogen Bespiegelingen!

Share This:

Nieuws?

Binnenlands Bestuur beschrijft de worsteling van gemeenten met floppy’s, tapes en cd-roms. ‘Oude’ informatie is moeilijk vindbaar, niet doorzoekbaar en soms geheel ontoegankelijk. Er zijn zoveel boeken, artikelen en nieuwsberichten verschenen over de wankele ‘duurzaamheid’ van digitale in­for­matie dat het verwonderlijk is dat een tijdschrift zo’n bericht nog als nieuws kan presenteren. Al in februari 2014 publiceerde ik samen met een collega een opiniestuk in datzelfde Binnenlands Bestuur, waarin we reageerden op een rapportage van de Erfgoedinspectie over de falende di­gitale archivering bin­nen de ministeries. Wij sloten af met: ‘Onze rijksoverheid wordt niet dement – zij is het al.’ Er hebben de afgelopen jaren voldoende berichten de pers gehaald om die stelling ook te betrekken op de gemeentelijke overheid.

Lees verder op mijn blog Bevlogen Bespiegelingen!

Share This:

Drijfzand

Replicatie (of herhaalbaarheid) is een wetenschappelijk dogma. Het waarborgt de controleerbaarheid van onderzoek. Directe (of: zo exact mogelijke) replicatie is echter moeilijk.

In 2005 verscheen in PLOS Medicine ‘Why most research findings are false’, van de statisticus en epidemioloog John Ioannidis. Op basis van wiskundig en statistisch onderzoek stelde Ioannidis dat de conclusies in 80% van de medisch wetenschappelijke publicaties onhoudbaar zijn. Hij onderbouwde dat, ook in 2005, in een artikel in de Journal of the American Medical Association. Het bleek dat 41% van de 49 meest geciteerde onderzoeksconclusies vanaf 1990 onjuist of ernstig overdreven waren. Bayer en Amgen, twee van ‘s werelds grootste pharmaceuticals, rapporteerden in 2011 dat zij in hun eigen la­boratoria respectievelijk slechts 11% en 25% van eerder gepubliceerd onderzoek konden repliceren. In 2012 kon Amgen resultaten uit zes van de 54 ‘land­mark cancer papers’ re­pliceren. Het geeft aan dat Ioan­nidis’ conclusies dichter bij de waarheid zijn dan lange tijd werd gehoopt.

Lees verder op mijn blog.

Share This:

Amateurs

Begin maart verscheen het rapport van de enquêtecommissie van de Amsterdamse gemeenteraad naar de financiële wantoestanden in de stad. De gemeentefinanciën schieten structureel tekort, het college van Burgemeester en Wethouders deed niets en de gemeenteraad controleerde niet. Basistaken werden niet goed uitgevoerd. Het gemeentebestuur nam besluiten op basis van onjuiste informatie, greep niet in en volgde adviezen en aanbevelingen uit eerdere rapporten niet op. De gemeenteraad volgde liever hypes en vond financiën niet ‘sexy’. De gemeentesecretaris en de ambtelijke top faalden. Wethouders van Financiën wisten niet dat ze moesten besturen. De gemeentesecretaris wist ook niet welke rol te vervullen binnen het gemeentelijke apparaat.

Lees verder op mijn blog.

Share This:

Integriteit

Het Centrum voor Ethiek en Gezondheid (CEG) publiceerde in januari Integriteit in zorgorganisaties. Hieruit blijkt dat in de praktijk van alle dag integriteit een moeilijk begrip is, gericht op gedrag en morele normen en waarden. Volgens het CEG bestaat integriteit uit vier componenten: betrouwbaarheid (handelen naar wat je zegt), deugdzaamheid (moreel het goede doen), authenticiteit (intrinsiek gemotiveerd zijn) en reflectie (je kritisch verhouden tot (de toepassing van) normen en regels). Integer handelen is moeilijk, ook omdat de publieke opinie er een beeld van heeft dat niet overeenkomt met de complexiteit ervan. Integriteit heeft te maken met persoonlijke overtuiging en ethiek, waardoor om ‘goed’ te doen ook regels aan de kant geschoven kunnen worden. Een medisch specialist laat bij een kwestie van leven en dood de ‘heilige’ protocollen voor wat ze zijn.

Lees verder op mijn blog

Share This:

We leven in een uitdagende tijd!

De hoeveelheid data neemt enorm toe. Organisaties worden bestookt met allerlei soorten informatie via een enorm aantal verschillende kanalen. Ze verzamelen zelf ook steeds meer data, over klanten en burgers. Vaak weten ze niet eens waarom, maar de mogelijkheden zijn er en het kan ‘misschien nog wel van pas komen’. Opslagservers, ‘on site’ of in de ‘cloud’, zijn dan ook erg in trek. Opslag is goedkoop, immers. Het is allang bekend dat dat niet zo is, maar struisvogels staan er ook om bekend hun kop in het zand te steken.

In de opslagprijzen per gigabyte zijn het gebruik en de terugvindbaarheid van data nooit meegenomen. Maar vanaf 2010 zijn de kosten daarvoor per jaar wereldwijd verdubbeld (tot €11 miljard, ongeveer)! Data behoren immers toegankelijk, vindbaar, betrouwbaar en duurzaam te zijn. Ze worden toch ook opgeslagen om te worden gebruikt. Het information governance regime, nodig voor vertrouwelijkheid, privacy, compliance en erfgoed, vergt met de stijging van de hoeveelheid data meer investeringen in software.

Deze column verscheen voor de eerste keer in SITED, nr. 165, de elektronische nieuwsbrief van VHIC. Lees verder op Bevlogen Bespiegelingen.

Share This: