VIA DEGLI OLMETTI, N 18
00060 FORMELLO (RM)
+39 06 9040661
INFO@GESCA.IT

Differential Privacy: dati disponibili, ma anonimi

differential privacy
by

Mai sentito parlare di differential privacy? Tra tutti i termini che ruotano intorno all’universo Privacy da qualche anno a questa parte, oggi abbiamo deciso di approfondire questo concetto.

Definizione

La Differential Privacy è un sistema che consente di raccogliere e condividere le informazioni degli utenti in forma aggregata, tutelando però la privacy dei singoli.

Ciò significa che l’uso di qualsiasi informazione ritenuta utile dalle aziende può essere acquisita ed utilizzata garantendone il più assoluto anonimato.
È davvero così?

Scenario

Viviamo nell’era dei big data, dei cyberattacchi e del machine learning.
Questi tre ambiti sono strettamente correlati fra loro ed hanno contribuito a porre la questione della Privacy al centro dell’attenzione non solo delle aziende, ma di intere nazioni, come testimoniato dalle più recenti disposizioni: una per tutte, il GDPR.

In cosa consiste

E’ difficile semplificare (!!): la privacy differenziale si basa su tecnologie che consentono di anonimizzare il dato già in fase di acquisizione, grazie all’uso di un algoritmo.
In questo modo, si renderebbe inapplicabile il reverse engineering, ossia la “tecnica” che, partendo da informazioni anonime correlate ad altre che non lo sono, riesce a risalire al dato completo ed all’identità dell’utente.
Come dicevamo, il differential privacy consiste nell’inserimento di “elementi di disturbo” che in maniera randomica vengono attribuiti al singolo dato.
Affinché i risultati aggregati dei dati, contenenti questi elementi, non risultino falsati è, però, necessario che la base informativa sia davvero ampia.
Ecco perché colossi come Google o Apple sono i soggetti ideali per applicare questa forma di difesa del dato.

Differential Privacy e GDPR

Il punto di forza del differential privacy è, appunto, la tecnologia che permette di ricevere il dato già anonimizzato, il che mette al riparo da qualsiasi violazione e rende il soggetto che raccoglie e tratta il dato perfettamente compliant al GDPR.
Gli algoritmi alla base di queste tecnologie permettono, quindi, la creazione di database anonimi.

Un potenziale enorme.

Potenziale che ora, grazie a Big G, è possibile sfruttare, dato che da pochi giorni Google ha reso disponibile l’algoritmo Open Source.

L’annuncio di Google

Oggi abbiamo rilasciato la prima versione open source di differential privacy, tale libreria è già presente in moltissimi dei nostri progetti. Per consentire agli sviluppatori una facile implementazione [di differential privacy] in altri progetti software per il momento ci siamo focalizzati sullo sviluppo di feature che possono essere particolarmente difficili da implementare ed eseguire partendo da zero

Certamente, usarlo non è un gioco da ragazzi, ma è stata aperta una frontiera importante.
Citando una delle nostre fonti, si tratta di un “approccio crittografico alla data science, che permette agli analisti di lavorare con i Big Data senza violare la Privacy dei proprietari”.

Fonti

Medium

Cybersecurity360

HTML.it