BIG DATA VOOR GEMEENTEN

Maak een Begin. Het is Gratis
of registreren met je e-mailadres
Rocket clouds
BIG DATA VOOR GEMEENTEN Door Mind Map: BIG DATA VOOR GEMEENTEN

1. WAT ZIJN KANSEN EN RISICO'S VAN BIG DATA VOOR DE GEMEENTELIJKE ORGANISATIE?

1.1. MISMATCH TUSSEN BIG DATA EN HUIDIGE WET- EN REGELGEVING?

1.1.1. De huidige juridische kaders zijn vooral gericht op het verzamelen en delen van gegevens. Big Data daarentegen is vooral gericht op ongerichte gegevensverzameling en secundair gebruik van reeds verzamelde data. Dit botst met de principes van DOELBINDING en NOODZAKELIJKHEID

1.1.1.1. Goed gebruik van Big Data vereist een substantieële verzwaring van het toezicht. Gemeenten kunnen inzetten op een versterking van de regulering van de fases van de ANALYSE en GEBRUIK die nu niet juridisch zijn geborgd. Regulering van deze twee fasen is volgens de WRR (WRR, 2016) een conditio sine qua non voor het niet zwaarder reguleren van de fase DATAVERZAMELING.

1.2. CHILLING EFFECT

1.2.1. De inzet van Big Data heeft effect op de vrije meningsuiting van burgers. Zij voelen dat de privacy en vrije meningsuiting in gevaar zijn door Big Data toepassingen en houdt daar rekening mee. Dit geldt in het bijzonder voor beroepsgroepen als journalisten en advocaten die een vitale rol spelen in de democratische rechtsstaat.

1.3. FUNCTION CREEP

1.3.1. Big Data-oplossingen zijn gevoelig voor function creep, oftewel gebruik van data anders dan het doel waarvoor die data zijn verzameld. Function creep is een punt van zorg vanwege: (a) verschillen in bevoegdheid omtrent gegevensverzameling en (b) de ingrijpende gevolgen die aan Big Data-analyses verbonden kunnen worden.

1.4. CORRELATIE IS GEEN CAUSALITEIT

1.4.1. Een belangrijk kenmerk van Big Data is de datagedreven analyse, een heel andere benadering dan de traditionele statistische methode. Het doel van de analyse is niet het toetsen van hypotheses maar het vinden van interessante verbanden en patronen, waarvan de gedachte is dat ze relevant zijn voor commerciële doelen of doelen van de overheid. Dergelijke analyses kunnen interessante en onverwachte correlaties en inzichten opleveren. Maar de causaliteit is – zeker in eerste aanleg – niet duidelijk en het risico bestaat dat correlaties tot causaliteiten ‘verheven’ worden.

1.5. BIG DATA IS GEEN WETENSCHAPPELIJK ONDERZOEK

1.5.1. De algoritmes en methoden die bij data-analyses worden gebruikt moeten deugdelijk zijn en aan de wetenschappelijke criteria voor goed (statistisch) onderzoek voldoen. De analysefase is in het huidige regime nagenoeg ongereguleerd gebleven: ‘algorithmic accountability’ ontbreekt

1.6. TRANSPARANTIEPARADOX

1.6.1. Big Data kan tot een transparantieparadox leiden: burgers worden steeds transparanter voor de overheid, terwijl de profielen, algoritmen en methoden die overheidsorganisaties gebruiken nauwelijks transparant of navolgbaar zijn, dan wel op een of andere manier zijn gemanipuleerd. Daarmee verschuift ook het machtsevenwicht tussen staat en burger. Het soms geheime karakter van activiteiten in de overheidsdomeinen versterken deze transparantieparadox. Nu via Big Data-methoden steeds grotere groepen burgers in beeld komen – naast verdachte ook niet-verdachte burgers – gaat dat steeds meer wringen (Hildebrandt 2016).

1.7. SCHIJNEXACTHEID

1.7.1. Big Data geeft goed onderbouwde antwoorden op vage vragen. Big Data werkt goed bij hoog frequente gevallen maar niet bij individuele gevallen

1.8. GEVOELIGHEID VOOR MANIPULATIE

1.8.1. De juiste data zijn – ook in een digitale wereld – niet altijd beschikbaar. Soms zijn deze er domweg niet, soms zijn er problemen met bewaartermijnen en soms blijken verschillende dataplatformen niet interoperabel met elkaar. Ook de kwaliteit van data is geen gegeven, data kunnen verouderd, gecorrumpeerd of zelfs gemanipuleerd zijn. Vervalsingen of misleidingen kunnen doorwerken in Big Data-analyses en zo correcte besluitvorming ondermijnen.

1.9. DISCRIMINATIE EN ONGELIJKE BEHANDELING) VAN BEVOLKINGSGROEPEN.

1.9.1. Big Data-analyses kunnen leiden tot een toename van sociale stratificatie door de bias te reproduceren en te versterken die in elke dataset zit. Zonder correctie vertaalt zich dit op termijn in discriminatie en oneerlijke behandeling van bepaalde groepen in de maatschappij (Zarsky 2016: 126-127). Big Data-analyses zijn per definitie op historische data en datapatronen gebaseerd, die naar hun aard slechts een gefragmenteerd en probabilistisch beeld van de toekomst bieden. De sociale werkelijkheid kent echter weinig patronen en wetmatigheden. Bovendien is het gebruik van profielen bij opsporing lastig, omdat criminelen hun gedrag kunnen aanpassen om opsporing te ontlopen. Een risico is ook dat mensen die hun leven hebben gebeterd, tot bepaalde risicogroepen blijven behoren, omdat ze nu eenmaal zo geregistreerd staan.

1.10. GROOTSCHALIGE INMENGING IN PERSOONLIJKE LEVENSSFEER

1.10.1. In het uiterste geval resulteren Big Data-methoden in datadeterminisme. Daarbij worden individuen beoordeeld op basis van probabilistische kennis (correlaties en inferenties) over wat ze misschien zullen doen, in plaats van wat ze daadwerkelijk hebben gedaan.

1.11. OPERATIONELE EFFICIENTIE

1.11.1. Big Data kan bijdragen aan hogere operationele efficiëntie. Er is vooral winst te behalen in organisaties die zich bezighouden met de verzameling en analyse van data en informatie. Analyses die voorheen soms dagen, weken of maanden duurden, kunnen door middel van Big Data-analyses in enkele minuten of uren worden uitgevoerd of feiten aan het licht brengen die anders een onvindbare speld in een hooiberg zouden blijven. 25% productiviteitwinst bij analyse klantgegevens. 5% productiviteitwinst bij datagedreven besluitvorming (Brynjolfsson, 2011).

1.12. REAL TIME (GEAUTOMATISEERDE) ANALYSES

1.12.1. Big Data-analyses kunnen helpen bij het reconstrueren van gebeurtenissen in het verleden. Ook kunnen Big Data-analyses nuttig zijn bij het realtime volgen van ontwikkelingen in het heden. Dit kan bijvoorbeeld van grote waarde zijn na een ramp of voor crowd control bij evenementen. Het is dan belangrijk om snel een beeld te krijgen van de situatie ter plaatse, zodat hulp geboden kan worden of kan worden ingegrepen bij dreigende situaties.

1.13. VOORSPELLENDE ANALYSES EN BETERE BESLUITVORMING

1.13.1. Big Data maakt scherpere risicoanalyses mogelijk. Dit komt enerzijds door de grotere omvang en diversiteit van de gebruikte databestanden. Anderzijds zijn Big Data-analysemethoden gericht op het ‘ontdekken’ van onverwachte verbanden, die in risicoprofielen kunnen worden verwerkt. Dit resulteert onder meer in gerichtere inspecties, efficiëntere inzet van schaarse middelen en het inzettenvanpreventie. Beleidsvorming zal hierdoor grotendeels verdwijnen.

2. WELKE EFFECT HEEFT BIG DATA OP DE GEMEENTELIJKE ORGANISATIE?

2.1. LEGITIEM

2.1.1. TRANSPARANTIE EN MAATSCHAPPELIJKE AANVAARDBAARHEID VAN HET GEBRUIK VAN BIG DATA. Gegevensverwerking door overheden is voor de burger een black box.Het volgende kan bijdragen aan grotere maatschappelijk acceptatie.

2.1.1.1. Opstellen van een beleidsplan met daarin vermeld welke methoden worden gebruikt, wat de kosten zijn en wat de beoogde resultaten zijn.

2.1.1.2. Achteraf inzichtelijk maken van de frequentie waarmee bepaalde toepassingen zijn gebruikt.

2.2. ORGANISATIE

2.2.1. BIG DATA VERANDERT DE WERKING VAN ORGANISATIE Er ontstaan nieuwe functies, functies veranderen en de verhouding tussen functies - de organisatie - verandert. (Huigen & Zuurmond, 1994, p. 17).

2.2.1.1. Big Data en de daardoor ontstane toename aan maatregelen zorgt er voor dat de ambtenarij een groter mandaat krijgt van het openbaar bestuur. Politiek en ideologie krijgt minder invloed op besluitvorming.

2.2.1.2. Beleidsvorming wordt technocratischer. Beslissingen genomen worden op basis van kennis van ambtenaren of computersystemen, in plaats van ideologie van politici.

2.2.1.3. Beleidvorming wordt een rationeler proces. In alle fasen van het beleidsvormingsproces, de agendasetting, de beleidsformulering, de besluitvorming, de implementatie en de evaluatie, meer rekening wordt gehouden met de feitenkennis die opgedaan is middels Big Data. Dit zorgt ervoor dat er in alle fases een rationalisering plaatsvindt.

2.2.1.3.1. OPRICHTEN DATA-ANALYSE TEAM

2.2.2. SOCIAAL DOMEIN Urgentie: Tekort aan betrouwbare data

2.2.2.1. THEMA'S

2.2.2.1.1. RELATIE AANDOENINGEN EN OMGEVINGSFACTOREN Biobanken (voorbeeld: LifeLines)

2.2.2.1.2. PRIVATISERING ZORGDATA De aard van internet is privaat. Mensen geven hun data in ruil voor gratis diensten.

2.2.2.1.3. VOEDSELVEILIGHEID DOOR SOCIAL MEDIA

2.2.2.1.4. EPIDEMIOLOGIE Internet of Things Sensoren

2.2.2.1.5. QUANTIFIED SELF Lifestyle gadgets health platforms #Fijnstof of #radioactiviteit meten met je telefoon

2.2.2.1.6. DOELMATIGHEID Groter Inzicht in overleefkans vs Kwaliteit van leven vs Kosten

2.2.2.1.7. SYSTEMS VS PERSONALIZED MEDICINE Reductionistische en specialistische aard zorg/geneeskunde vs P4: Predictive, preventive, personalized, participatory

2.2.2.1.8. PRIVACY Peter Paul Ohm (2009): ,,Privacy is a thing of the past''.

2.2.2.2. KANSEN EN RISICO'S

2.2.2.2.1. DATAVERZAMELING met High Throughputtechnieken (next generation sequencing/IoT/Life style gadgets)

2.2.2.2.2. ANALYSE (DIAGNOSE) middels Artificial Intelligence

2.2.2.2.3. Privacygevoeligheid van zorgdata

2.2.2.2.4. Privatisering van kennis

2.2.2.2.5. Centralisatie van menselijke kennis

2.2.3. RUIMTELIJK DOMEIN Kans: CITY SENSORNET

2.2.3.1. THEMA'S

2.2.3.1.1. SMART CITY/DATAGESTUURDE STAD

2.2.3.1.2. URBAN STRATEGY Infrastructuur, milieu, duurzaamheid

2.2.3.2. KANSEN EN RISICO'S

2.2.3.2.1. VERKEERSANALYSE Monitoring verkeersstromen

2.2.3.2.2. VEILIGHEIDSANALYSE Cameratoezicht, Alarmsystemen, sociale data et cetera

2.2.3.2.3. CITY MARKETING

2.2.3.2.4. Gemeente kan - als beheerder van de publieke ruimte - gegevens leveren aan bestuur en politie

2.2.3.2.5. Privacy

2.2.4. VEILIGHEIDSDOMEIN

2.2.4.1. THEMA'S

2.2.4.1.1. Afwegingsmodel tussen collectieve veiligheid vs individuele privacy.

2.2.4.1.2. EVENEMENTEN

2.2.4.2. KANSEN EN RISICO'S

2.2.5. Zolang het onderwerp Privacy juridisch gezien nog niet is uitgekristalliseerd lijkt het een goede strategie voor gemeenten om te investeren in domeinen met minder gevoeligheden. Te denken valt aan Urban Strategy (Infrastructuur, milieu en duurzaamheid), Smart City, stedelijk sensornet, Evenementen, City Marketing, Verkeersanalyses en veiligheidsanalyses. Onderwerpen in het Sociale Domein zoals de de relatie tussen omgevingsfactoren en individuele gezondheid, personalized medicine blijven omstreden vanwege de privacy aspecten. Daarbij is nagenoeg alle medische data in handen van private partijen. Als Europese regelgeving concreter is geworden en privacy ook door technologie kan worden geborgd lijkt een beter tijdstip voor gemeenten om te investeren in deze thema's.

2.3. LEGAAL

2.3.1. JURIDISCH KADER

2.3.1.1. THEMA'S

2.3.1.1.1. Klachtprocedures, beroep en bezwaar is verbonden aan individuele schade of onrecht. Big Data toespassingen kunnen burgerrechten echter categoraal schaden

2.3.1.1.2. Big Data uitkomsten zijn slecht toepasbaar op concrete individuele en specifieke gevallen. Dit heeft te maken met de statistische aard van Big Data analyses

2.3.1.1.3. Regulering van DATA-ANALYSE en GEBRUIK. Algoritmen, categoriseringen, wegingsfactoren.

2.3.1.2. Voor gemeenten geldt voornamelijk de WBP - tot 25 mei 2018

2.3.1.2.1. JURIDISCHE PRINCIPES: DOELBINDING EN NOODZAKELIJKHEID

2.3.1.2.2. JURIDISCHE PRINCIPES: BEVEILIGING EN JUISTHEID

2.3.1.3. Algemene Verordening Gegevensbescherming (AVG) - per 25 mei 2018. Komt in plaats van de wpb

2.3.1.3.1. AVG geeft handhavende instanties Autoriteit Persoongegevens ruimere bevoegdheid om organisaties te beboeten (art. 79-79b AVG).

2.3.1.3.2. Meldplicht WBP vervalt. Daarvoor in de plaats komt de documentatieplicht (art. 28 AVG).

2.3.1.3.3. Vaststellen van gedragscodes en certificaties (art. 38-39a AVG)

2.3.1.3.4. Algemene informatieplicht wordt aangescherpt (art. 12-14a AVG). Bijvoorbeeld: Melding als onder surveillance.

2.3.1.3.5. Handhaving en kaderstelling worden middels deze verordening op Europees niveau geplaatst (art. 64-72 en 86-87 AVG). Nederlandse wetgeving is niet nodig of van toepassing

2.3.1.3.6. Aanstellen privacyfunctionarissen (art. 35-37 AVG)

2.3.1.4. TOEZICHTHOUDERS

2.3.1.4.1. European Data Protection Supervisor (EDPS)

2.3.1.4.2. Toezicht door de Autoriteit Persoonsgegevens (AP)

2.3.1.4.3. ARTIKEL 29-WERKROEP, onafhankelijk advies- en overlegorgaan van Europese privacytoezichthouders. De naam van de werkgroep is ontleend aan artikel 29 van de Europese Privacyrichtlijn 95/46/EG.

2.3.1.4.4. Commissie van Toezicht op de Inlichtingen en Veiligheidsdiensten (CTIVD)

3. WAT IS BIG DATA?

3.1. HISTORIE

3.2. DEFINITIE McKINSEY Big Data refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage and analyze (McKinsey, 2011: 1).

3.2.1. DRIE V'S: VOLUME, VELOCITY & VARIETY

3.2.2. EXTRA V's: VALUE, VARIABILITY, VERACITY, VIRTUAL

3.3. DEFINTIE WRR

3.3.1. FASE: DATAVERZAMELING

3.3.1.1. Omvang van de data: het gaat om grote hoeveelheden gegevens.

3.3.1.1.1. Big Data creëert combinatorisch nieuwe (persoons)gegevens.

3.3.1.1.2. IoT

3.3.1.1.3. Unreasonable effectiveness of data: Kwaliteit van data (algoritme) neemt toe door grotere kwantiteit.

3.3.1.1.4. NIEUWE DATABRONNEN

3.3.1.2. Structuur van de data: het kan gaan om gestructureerde of ongestructureerde gegevens of een combinatie van beide.

3.3.1.2.1. Born digital data: Data verzameld zonder vooropgezet doel.

3.3.1.3. Variëteit van de data: het gaat om de combinatie van verschillende databronnen.

3.3.1.3.1. KOPPELINGEN

3.3.1.3.2. GRENSVERVAGING DOMEINEN (PUBLIEK/PRIVAAT

3.3.2. FASE: ANALYSE

3.3.2.1. Methode van de analyse: de analyse is datagedreven, er wordt dus gezocht naar patronen in de data zonder voorafgestelde hypothesen

3.3.2.1.1. DATA DRIVEN: Zoeken naar patronen zonder hypothese

3.3.2.2. Oriëntatie van de analyse: hoewel Big Data-analyses ook inzicht kunnen geven in het verleden (retrospectieve analyse), zijn het met name de analyse van het heden (real time analyses, nowcasting) en de toekomst (predictive analyses, forecasting) die de aandacht trekken.

3.3.2.2.1. REALTIME

3.3.2.2.2. GEAUTOMATISEERD

3.3.2.2.3. ZELFLEREND

3.3.3. FASE: GEBRUIK

3.3.3.1. Ontschotting van de domeinen: data uit het ene domein worden gebruikt voor beslissingen in het andere domein

3.3.3.2. Actionable knowledge: Conclusies op geaggregeerd niveau worden toegepast voor beslissingen op groeps- of individueel niveau (persoon of object).

3.3.3.2.1. VOORSPELLENDE ANALYSES

3.3.3.2.2. BESLUITVORMINGPROCEDURES

3.3.4. Op basis van deze indeling lijkt het voor organisaties strategisch om de organisatie te ontwikkelen aan deze hand van deze fases. Bijvoorbeeld: Het heeft geen enkele zin om te investeren in geautomatiseerde besluitvorming als de data niet betrouwbaar is (fase dataverzamelings) de analyse-methode omstreden (fase Analyse) en bezwaar en beroep niet juridisch zijn ingebed