Binnen de data-driven marketingsector is het koppelen van databronnen en het centraliseren van data een belangrijke stap. Alleen op deze manier kunnen we verzamelde data optimaal benutten en klanten zo goed mogelijk van dienst zijn. Maar er waait een nieuwe wind door de markt, merkt Jimmy de Vreede (Springbok) op. Een meer open benadering waarbij de data ‘decentraal’ staat, is in aantocht. In dit artikel werpt de Vreede een blik op de toekomst, inclusief een aantal praktische voorbeelden van decentrale data toepassingen.
Jimmy de Vreede is Data Director bij Springbok en lid van de DDMA Commissie Data, Decisions & Engagement. Springbok is een van de sponsoren van de Customer Data Award 2021, die dit jaar wordt uitgereikt tijdens de DDMA Talkshow: de Beste Customer Data Cases van 2021 op donderdag 2 december. Aanmelden voor de talkshow kan nog steeds en is gratis en toegankelijk voor iedereen via customerdataaward.nl/aanmelden
Data centraal is het businessmodel van vandaag
In 2014 kocht Facebook, excuus Meta, voor $19 miljard WhatsApp. Een messaging-app met destijds 450 miljoen actieve gebruikers die nauwelijks iets opbracht. De reden voor de aankoop, naast de interessante gebruikersgroep en een concurrent minder: data. Bij de overname deed Mark Zuckerberg de belofte niets met de data te doen, echter kwam hij daar in 2016 en ook begin dit jaar, via het aanpassen van de voorwaarden, op terug. Want data, vanuit verschillende bronnen, van meer gebruikers en apps, centraal op één plek, is vele malen waardevoller.
Ook Alphabet volgt een soortgelijke datastrategie. Naast Google is Alphabet eigenaar van o.a. Nest (slimme camera’s, thermostaten en rookmelders), Waymo (zelfrijdende auto’s), Verily (gezondheid en onderzoek) en sinds dit jaar ook Fitbit (fitness trackers). Ook de Google Chromebooks, die nagenoeg gratis beschikbaar worden gesteld op inmiddels 70% van de Nederlandse basisscholen, passen binnen deze datagroei strategie. Meer gecentraliseerde data vanuit verschillende bronnen en sectoren, voor complete gebruikersprofielen, zijn interessanter, voor bijvoorbeeld adverteerders.
Eigenlijk zijn de meeste bedrijven bezig met data verzamelen, centraliseren en koppelen, voor verschillende toepassingen. Er waarde uithalen, en deze waarde kunnen bewijzen, is nog niet eens zo makkelijk. Toch klinkt het aantrekkelijk en ook ik ben van mening dat data ongekende mogelijkheden geeft inzicht op te bouwen en dit in te zetten.
Datagroei niet meer te stoppen
Datagroei is niet meer te stoppen. Naast onszelf zullen allerlei “dingen” data produceren. Van de auto en de slimme thermostaat tot het speelgoed van je kinderen. Deze factsheet van de Europese datastrategie spreekt over 175 zettabytes in 2025. Maar waar gaat die data naartoe, van wie is het of wie heeft het recht het te gebruiken?
Momenteel kan je wel stellen dat we het recht op gebruik makkelijk weggeven en de regie op data zijn verloren. Via het accepteren van veelal eenzijdige voorwaarden, bij het bezoek van een website tot het gebruiken van de app voor je smartwatch. Is hier iets mis mee? We hebben tenslotte wetgeving zoals GDPR om ons rechten te geven te beschermen tegen misbruik. Met het op de juiste manier verzamelen en gebruiken van data is op zich niets mis. Sterker nog, gezien een aantal grote uitdagingen deze tijd, van klimaatverandering tot kansongelijkheid, zullen we data met de juiste toepassing nog heel hard nodig hebben.
Waar wel een kanttekening bij geplaatst mag worden, is of de huidige situatie van het centraliseren en het creëren van datasilo’s, waar alleen een enkele partij, zoals de overheid in China of Big Tech (FAANG) in de VS, gebruik van kan maken, wenselijk is. Naast de nadelige effecten van de concentratie van macht, is het regie houden op data, wat de GDPR ons belooft, eigenlijk niet uitvoerbaar (probeer je data maar eens te porteren!) en zal het de succesvolle toepassing, van bijvoorbeeld AI, vertragen. Dit wordt ook benoemd door de WRR in een recent adviesrapport Opgave AI, want AI heeft toegang tot veel data nodig. Vandaag de dag zijn de gesloten datasilo’s van FAANG en een Chinese datadictatuur al de realiteit. Wat kan een meer democratische of publieke oplossing voor data zijn die ons minder afhankelijk maakt en tegelijkertijd ook effectiever in de toepassing van data?
Data decentraal is de toekomst
De laatste tijd is er sprake van een nieuwe tendens, sommigen noemen het zelf een verandering van paradigma in hoe we met data omgaan, van het verzamelen en het verrijken tot de toepassing. Omdat het haaks staat op wat nu gangbaar is, data centraal en in silo, wordt het ook wel aangeduid als “data decentraal.” Andere benamingen zijn “de nieuwe data-economie” en “web3”, de term voor een nieuwe “decentrale” fase van het internet. Data decentraal lijkt me voor nu een prima term omdat de data letterlijk decentraal staat, dichtbij waar de data gegenereerd wordt (bij de eigenaar) en/of zelfs gedistribueerd over een netwerk op verschillende locaties.
Data decentraal in de praktijk
Voor een beter beeld over deze nieuwe datafase volgen er drie voorbeelden van interessante initiatieven waarbij data decentraal wordt toegepast:
- Solid
Solid is een product van Inrupt. Dit is de organisatie van o.a. Tim Bernes-Lee, de uitvinder van het World Wide Web en niet de minste dus! Wat is het? Solid is een open source platform dat gebruikers via een personal data storage (POD) de mogelijkheid biedt volledige zeggenschap en controle te hebben én houden over data. Data staat decentraal, een gebruiker kan data niet “kwijtraken” door het te delen en kan het recht op gebruik door een andere partij weer intrekken. Bijvoorbeeld, om jonge gebruikers aan te trekken wil de BBC meer personaliseren en hiervoor gebruiken ze Solid om data, van Netflix, BBC en Spotify, op gebruikersniveau bij elkaar te brengen voor betere persoonlijke aanbevelingen. Via de POD blijft de data lokaal, dus decentraal, staan onder regie van de gebruiker.
Tim Bernes-Lee: “Solid changes the current model where users have to hand over personal data to digital giants in exchange for perceived value. As we’ve all discovered, this hasn’t been in our best interests. Solid is how we evolve the web in order to restore balance – by giving every one of us complete control over data, personal or not, in a revolutionary way”.6
- Ocean Protocol
Ocean Protocol is een open source protocol dat de mogelijkheid biedt aan individuen en bedrijven om data uit te wisselen, te verkopen en te gebruiken. Zo kan je op de Ocean Market voor zo’n 16K€ een dataset kopen van online (anoniem) klikgedrag van 5000 consumenten. Dat klinkt privacygevoelig alleen hebben deze consumenten hier zelf akkoord voor gegeven, zoals nu ook gebeurt alleen met het verschil dat ze er tokens (waarde) voor terugkrijgen. Iedereen kan hieraan meedoen door het installeren van een browser plugin van Swash, de eerste “Data Union”. Deze zogenaamde “data unions” bieden de mogelijkheid om als individu data delen met anderen. Individuele data is namelijk niet zo interessant. Een dataset van 5000 individuen of meer wel.
- Een Europese datastrategie
Begin vorig jaar kwam de Europese commissie met een datastrategie met als doel om te bewerkstelligen dat we in Europa niet gefragmenteerd, maar gezamenlijk sterker worden in datagedreven beslissen, voor een betere kwaliteit van leven voor iedereen in Europa. Een van de initiatieven is het faciliteren van zogenaamde gedeelde data spaces en data pools, ingericht volgens Europese waarden en richtlijnen. Het andere initiatief is Gaia-X, een Europese cloud als tegenhanger van de Amerikaanse cloud-providers, Google, Amazon, Microsoft waar we nu afhankelijk van zijn. Een zogenaamde federated cloud, opgezet door verschillende lidstaten, open source met een decentrale infrastructuur.
De voorbeelden van Solid en Ocean komen voort vanuit internationale samenwerking. Ze passen binnen het kader van de Europese datastrategie. Ocean Protocol is ook een van de partijen die bijdraagt aan het ontwikkelen van use cases voor Gaia-X. Een positief teken want de vraag rest of deze initiatieven voldoende snelheid en slagkracht gaan creëren omdat China en de VS nog flink vooruitlopen op data en toepassing.
Op naar web3: een open, community-driven decentraal internet
Hoe dan ook, het model “data decentraal” is een interessante ontwikkeling, die past bij wat ook wel een nieuwe fase van het internet genoemd wordt. Dit is niet de metaverse zoals Meta laatst heeft aangekondigd, maar een open, community-driven decentraal internet, zoals het ook ooit begonnen is vanuit de visie van Tim Bernes-Lee destijds (web1). Momenteel zitten we in de tweede “centrale” fase (van de datasilo’s, zoals Google en Facebook). Ik ben zeer benieuwd in hoeverre data in de decentrale web3-fase tractie gaat krijgen de komende jaren.