Wat is 'Differentiële privacy' en hoe houdt het mijn gegevens anoniem?
Apple doet er alles aan om ervoor te zorgen dat de gegevens die zij van u verzamelt privé blijven. Hoe? Door iets te gebruiken dat 'Differentiële privacy' wordt genoemd.
Wat is differentiële privacy?
Apple verklaart het als zodanig:
Apple gebruikt Differential Privacy-technologie om de gebruikspatronen van een groot aantal gebruikers te ontdekken zonder afbreuk te doen aan de individuele privacy. Om de identiteit van een persoon te verbergen, voegt Differential Privacy wiskundige ruis toe aan een klein voorbeeld van het gebruikspatroon van de persoon. Naarmate meer mensen hetzelfde patroon delen, komen algemene patronen naar voren die de gebruikerservaring kunnen informeren en verbeteren.
De filosofie achter differentiële privacy is deze: elke gebruiker wiens apparaat, of het nu een iPhone, iPad of Mac is, een berekening toevoegt aan een grotere verzameling verzamelde gegevens (een groot beeld gevormd door verschillende kleinere afbeeldingen), mag niet worden onthuld als de bron, laat staan welke gegevens ze hebben bijgedragen.
Apple is ook niet het enige bedrijf dat dit doet, zowel Google als Microsoft gebruikten het zelfs nog eerder. Maar Apple heeft het gepopulariseerd door er uitgebreid over te praten tijdens de 2016 WWDC-keynote.
Dus hoe verschilt dit van andere geanonimiseerde gegevens, vraagt u? Welnu, geanonimiseerde gegevens kunnen nog steeds worden gebruikt om persoonlijke informatie af te leiden als u genoeg over een persoon weet.
Laten we zeggen dat een hacker toegang heeft tot een geanonimiseerde database die de loonlijst van een bedrijf laat zien. Laten we zeggen dat ze ook weten dat Employee X naar een ander gebied verhuist. De hacker zou dan simpelweg de database kunnen ondervragen voordat en nadat werknemer X beweegt en zijn inkomen gemakkelijk kan afleiden.
Om de gevoelige informatie van Employee X te beschermen, wijzigt Differential Privacy de gegevens met wiskundige "ruis" en andere technieken, zodat als u de database bevraagt, u alleen een benadering van hoeveel (of iemand anders) werknemer X werd betaald.
Daarom is zijn privacy bewaard gebleven vanwege het "verschil" tussen de geleverde gegevens en de toegevoegde ruis, dus het is dan vaag genoeg dat het vrijwel onmogelijk is om te weten of de gegevens waar je naar kijkt eigenlijk een bepaald individu zijn.
Hoe werkt de differentiële privacy van Apple??
Differentiële privacy is een relatief nieuw concept, maar het idee is dat het bedrijf scherpe inzichten kan bieden op basis van gegevens van zijn gebruikers, zonder te weten wat precies die gegevens zeggen of van wie het afkomstig is.
Apple, bijvoorbeeld, vertrouwt op drie componenten om zijn invloed op Differential Privacy op je Mac of iOS-apparaat te laten werken: hashing, subsampling en geluidsinjectie.
Hashing neemt een reeks tekst en verandert deze in een kortere waarde met een vaste lengte en vermengt deze sleutels tot onomkeerbare willekeurige reeksen van unieke karakters of "hash". Hierdoor worden uw gegevens verborgen, zodat het apparaat niets in de oorspronkelijke vorm opslaat.
Subsampling betekent dat Apple in plaats van elk woord dat een persoon typeert, alleen een kleiner aantal van hen zal gebruiken. Laten we bijvoorbeeld zeggen dat je een lang tekstgesprek voert met een vriend die royaal emoji gebruikt. In plaats van dat hele gesprek te verzamelen, zou subsampling in plaats daarvan alleen de delen kunnen gebruiken waarin Apple geïnteresseerd is, zoals de emoji.
Ten slotte injecteert uw apparaat ruis door willekeurige gegevens toe te voegen aan de oorspronkelijke gegevensset om het vager te maken. Dit betekent dat Apple een resultaat krijgt dat enigszins is gemaskeerd en daarom niet helemaal exact is.
Dit alles gebeurt op uw apparaat, dus het is al verkort, verward, gesampled en wazig voordat het zelfs naar de cloud wordt gestuurd, zodat Apple het kan analyseren.
Waar wordt de differentiële privacy van Apple gebruikt??
Er zijn verschillende gevallen waarin Apple macht wil gegevens verzamelen om zijn apps en services te verbeteren. Maar op dit moment gebruikt Apple Differential Privacy alleen op vier specifieke gebieden.
- Wanneer genoeg mensen een woord vervangen door een bepaalde emoji, wordt dit een suggestie voor iedereen.
- Wanneer nieuwe woorden aan voldoende lokale woordenboeken worden toegevoegd om als normaal te worden beschouwd, zal Apple deze ook aan het woordenboek van iedereen toevoegen.
- U kunt een zoekterm in Spotlight gebruiken en vervolgens app-suggesties geven en die link in die app openen of toestaan om deze in de App Store te installeren. Stel bijvoorbeeld dat u zoekt naar 'Star Trek', wat de IMDB-app suggereert. Hoe meer mensen de IMDB-app openen of installeren, hoe meer deze wordt weergegeven in de zoekresultaten van iedereen.
- Het geeft meer nauwkeurige resultaten voor Lookup Hints in Notes. Stel dat u bijvoorbeeld een notitie met het woord 'appel' erin heeft staan. Je doet een zoekopdracht en geeft je resultaten, niet alleen voor de woordenboekdefinitie, maar ook voor Apple's website, locaties van Apple Stores, enzovoort. Vermoedelijk, hoe meer mensen op bepaalde resultaten tikken, hoe hoger en vaker ze verschijnen in de opzoekactie voor alle anderen.
Laten we emoji's als voorbeeld gebruiken. In iOS 10 introduceerde Apple een nieuwe emoji-vervangingsfunctie op iMessage. Typ het woord 'liefde' en je kunt het vervangen door een hartemoji. typ het woord 'hond' en, je raadt het al, je kunt het vervangen door een hondemoji.
Op dezelfde manier is het mogelijk voor je iPhone om te voorspellen welke emoji je wilt, zodat je, als je een bericht typt: "Ik ga met de hond wandelen", je iPhone de hond emoji behulpzaam kan voorstellen.
Dus, Apple neemt al die kleine stukjes iMessage-gegevens die het verzamelt, onderzoekt ze als een geheel en kan patronen afleiden uit wat mensen typen en in welke context. Dit betekent dat uw iPhone u slimmere keuzes kan geven omdat deze profiteren van al die tekstgesprekken die anderen maken en denken: 'dit is waarschijnlijk de emoji die u wilt'.
It Takes a Village (of Emoji)
Het nadeel van Differential Privacy is dat het geen nauwkeurige resultaten oplevert in kleine steekproeven. Het is de kracht om specifieke gegevens vaag te maken, zodat deze niet aan een enkele gebruiker kan worden toegeschreven. Om goed te kunnen werken en werken, moeten veel gebruikers deelnemen.
Het is een beetje alsof je een foto met een bitmaps van heel dichtbij bekijkt. Je zult niet kunnen zien wat het is als je slechts een paar bits bekijkt, maar als je een stap terug doet en naar het geheel kijkt, wordt het beeld duidelijker en meer gedefinieerd, zelfs als het niet superhoog is resolutie.
Om de emoji-vervanging en -voorspelling (onder andere) te verbeteren, moet Apple dus iPhone- en Mac-gegevens van over de hele wereld verzamelen om hem een steeds duidelijker beeld te geven van wat mensen doen en zo zijn apps en services te verbeteren. Het gaat over al deze gerandomiseerde, luidruchtige, crowdsourced-gegevens en mijnen voor patronen, zoals hoeveel gebruikers de perzikemoji gebruiken in plaats van 'butt'.
De kracht van Differential Privacy is dus afhankelijk van het feit dat Apple grote hoeveelheden verzamelde gegevens kan onderzoeken, en er tegelijkertijd voor zorgt dat het niet slimmer is wie deze gegevens verzendt.
Hoe te kiezen voor differentiële privacy in iOS en macOS
Als je er nog steeds niet van overtuigd bent dat Differential Privacy goed voor je is, heb je geluk. U kunt zich afmelden via de instellingen van uw apparaat.
Tik op je iOS-apparaat op "Instellingen" en vervolgens op "Privacy".
Tik op het scherm Privacy op "Diagnostiek en gebruik".
Klik ten slotte op het scherm Diagnostiek en gebruik op "Niet verzenden".
Open op MacOS de Systeemvoorkeuren en klik op "Beveiliging en privacy".
Klik in de voorkeuren Beveiliging en privacy op het tabblad 'Privacy' en zorg ervoor dat 'Diagnostische en gebruiksgegevens naar Apple verzenden' niet is aangevinkt. Houd er rekening mee dat u op het vergrendelingspictogram in de linkerbenedenhoek moet klikken en uw systeemwachtwoord moet invoeren voordat u deze wijziging kunt aanbrengen.
Vanzelfsprekend is er veel meer aan Differential Privacy, zowel in theorie als aan de toepassing, dan deze vereenvoudigde uitleg. Het vlees en de aardappelen ervan zijn sterk afhankelijk van een serieuze wiskunde en als zodanig kan het behoorlijk zwaar en gecompliceerd worden.
Hopelijk geeft dit u een idee van hoe het werkt en dat u meer vertrouwen heeft in bedrijven die bepaalde gegevens verzamelen zonder te hoeven worden geïdentificeerd.