p2p e privacy in rete con OneSwarm

Oneswarm logoPubblico qui l’introduzione del progetto OneSwarm, un progetto software a cui ho collaborato recentemente traducendolo in italiano. Il software è disponibile qui. – Jan Reister

Privacy-preserving P2P data sharing with OneSwarm – Tomas Isdal, Michael Piatek, Arvind Krishnamurthy, Thomas Anderson – Technical report, UW-CSE. 2009. (PDF)

La privacy – la protezione delle informazioni dagli accessi non
autorizzati – è sempre più rara in Internet, eppure sta diventando
sempre più importante nel momento in cui ciascuno di noi è diventato
sia fruitore, sia produttore di contenuti.

La mancanza di privacy è particolarmente evidente per i programmi di
condivisione dati peer-to-peer più diffusi, in cui i meccanismi di
rendezvous pubblico e la partecipazione dinamica rendono molto facile
sorvegliare il comportamento degli utenti.

In questo saggio presentiamo la progettazione, la realizzazione e
l’esperienza pratica di OneSwarm, un nuovo sistema di scambio dati P2P
che fornisce agli utilizzatori un controllo esplicito e flessibile sui
loro dati: è possibile condividere i dati pubblicamente oppure in modo
anonimo, con tutti i propri amici, solo con alcuni amici e non con
altri, oppure solo tra i propri computer personali.

OneSwarm è disponibile al pubblico ed è stato scaricato da centinaia
di migliaia di utenti nei mesi trascorsi dalla sua nascita. Uno degli
obiettivi principali è ridurre il costo della privacy in termini di prestazioni;
le nostre misurazioni sul sistema dal vivo hanno infatti dimostrato che
i trasferimenti anonimi di dati hanno prestazioni competitive rispetto
al traffico non anonimo. Le nuove tecniche di ricerca e trasferimento
in OneSwarm offrono velocità di trasferimento oltre un ordine di
grandezza più veloci rispetto a Tor, un altro diffuso sistema di
anonimato.

1 Introduzione

La privacy – la protezione delle informazioni dall’accesso non
autorizzato – è un obiettivo costante nella progettazione di sistemi
informatici. La privacy è diventata particolarmente impellente con la
trasformazione degli utenti da consumatori passivi in autori di
contenuti, condivisori di materiali e di interessi con differenti e
sovrapposti gruppi di persone.

Tecnicamente la privacy sarebbe facile da ottenere nei sistemi
centralizzati. Se i dati degli utenti sono conservati in un server
all’interno di un data center, è semplice  applicare le direttive degli
utenti sulla diffusione dei dati, e si può limitare attentamente, o a
richiesta disabilitare, ogni informazione sugli interessi e sui
comportamenti degli utenti stessi. Tuttavia la realtà è assai diversa.
Molti famosi servizi web esigono che gli utenti rinuncino ai loro
diritti di proprietà e privacy come condizione per usufruire dei
servizi; molti siti in questo modo raccolgono, conservano e trasmettono
grandi quantità di informazioni personali sui loro utilizzatori, anche
se la maggioranza degli utenti è contraria a questi comportamenti.
Anche per semplici collegamenti ad Internet, gli ISP divulgano
regolarmente informazioni personali sui loro utenti a praticamente
chiunque lo richieda. Con la centralizzazione è anche più facile
applicare la censura, come difatti accade in molti paesi del mondo.

I sistemi di scambio dati peer-to-peer (P2P) possono offrire
scalabilità e privacy senza ricorrere alla centralizzazione. Con il P2P
non vi è alcun bisogno intrinseco di sacrificare la privacy, perché le
risorse sono fornite dagli utenti stessi. Tuttavia i sistemi P2P più
diffusi sacrificano la privacy alla facilità d’uso, senza offrire
quindi alternative pratiche ai sistemi di cloud computing centralizzati.

Da un lato, i sistemi come BitTorrent sono robusti ed hanno alte
prestazioni, ma le attività di tutti sono visibili a chiunque abbia
voglia di osservarli. (Il nostro gruppo di ricerca, con una dozzina di
computer all’Università di Washington, ha sorvegliato decine di milioni
di utenti BitTorrent in tutto il mondo.) D’altro lato, sistemi anonimi
come Tor e Freenet enfatizzano la privacy a costo di prestazioni
limitate e di fragilità, in parte causati da incentivi divergenti e da
scelte inefficienti di protocollo, come il routing su singolo circuito.
Ad esempio, nella nostra valutazione delle prestazioni, OneSwarm ha
fornito velocità di trasferimento oltre un ordine di grandezza
superiori rispetto a Tor.

In questo saggio descriviamo il progetto, la realizzazione ed
esperienza di un servizio di scambio dati rispettoso della privacy,
detto OneSwarm, che cerca di ridurre il "costo" della privacy
concentrandosi su obiettivi di usabilità: facilità di installazione,
supporto per differenti modelli di condivisione e fiducia,
interoperabilità con gli utenti degli altri sistemi pubblici di scambio
dati, alta efficienza e robustezza. In OneSwarm, i dati vengono
individuati e trasferiti attraverso una rete mista di nodi (peer)
fidati e non-fidati, appartenenti alle reti sociali degli utenti.
Riteniamo che la combinazione mista di nodi fidati e non-fidati offra
più privacy e robustezza rispetto al loro uso separato. La ricerca ed
il trasferimento di contenuti sono anonimi, in grado di gestire
congestioni, avvengono su percorsi multipli ed offrono buone
prestazioni ad un costo computazionale ragionevole anche per oggetti
rari e diversa larghezza di banda tra nodi.

OneSwarm fa parte di un più vasto movimento per realizzare
un’alternativa al cloud computing che non dipenda da un sistema di
fiducia centralizzato, e comprenda servizi di rendezvous, ricerca,
storage a lungo termine, calcolo remoto e simili. Ci occupiamo della
privacy come prima cosa, perché è gestita molto male nei sistemi P2P
attualmente più usati, pur essendo ai nostri occhi una delle
caratteristiche più importanti che questi sistemi dovrebbero avere.
Vogliamo sottolineare che la privacy ha un grande valore per molti
legittimi motivi. C’è chi dice: "chi non ha nulla da nascondere, non ha
nulla da temere", ma noi non siamo d’accordo. Ad esempio, molti
contenuti di Youtube sono liberamente distribuibili e l’uso di tecniche
P2P permetterebbe a Youtube di risparmiare milioni di dollari l’anno: è
probabile tuttavia che gli utenti non accetterebbero una simile scelta
se ciò permettesse a terze parti di sorvegliare con poco sforzo ogni
loro attività in Youtube.

OneSwarm è stato scaricato da centinaia di migliaia di persone ed ha
gruppi di utilizzatori attivi in molti paesi, confutando così l’idea
che "a nessuno interessa la privacy". Noi utilizziamo questa base per
le nostre valutazioni raccogliendo statistiche d’uso volontarie dagli
utenti e misurazioni di particolari client OneSwarm su PlanetLab. Dato
che le nostre misurazioni dal vivo sono limitate dalle esigenze di
privacy dei nostri utenti, completiamo il nostro studio con simulazioni
di OneSwarm su una traccia di schemi di condivisione oggetti e di
relazioni sociali di oltre un milione di utenti del servizio musicale
last.fm .

Il resto del saggio è così organizzato: La sezione 2 descrive il
modello di scambio dati e carico di lavoro di OneSwarm. Descriviamo
come gestiamo le identità e la fiducia nella sezione 3, e gli algoritmi
congestion-aware di ricerca dati e trasferimento nella sezione 4. Nella
sezione 5 effettuiamo una breve analisi di sicurezza e nella sezione 6
valutiamo le prestazioni del sistema. L’esperienza nella realizzazione
è discussa nella sezione 7, presentiamo altri lavori collegati nella
sezione 8 e le conclusioni nella sezione 9.

Traduzione italiana di Jan Reister 2009 – Gnu Free Documentation License 1.2 – Pubblicato originariamente su Nazione Indiana

http://oneswarm.cs.washington.edu/

Se ti interessa, puoi leggere il seguito del paper in inglese qui: Privacy-preserving P2P data sharing with OneSwarm (PDF).

Se invece preferisci provare di persona, puoi scaricarlo ed installarlo sul tuo computer: è scritto in java e funziona su Windows, Mac OSX e Linux.

Traduzione italiana di Jan Reister 2009 – Gnu Free Documentation License 1.2
This entry was posted in tecnologia. Bookmark the permalink.