Metadati: La storia dietro i dati.

Spesso trascurati e considerati inutili dal punto di vista della privacy, i metadati sono oggetto di numerosi dibattiti. Alcuni sostengono che la loro raccolta e divulgazione non siano un grosso problema. Al contrario, sono fermamente convinto che sia una buona pratica sanitizzare i propri file, rimuovendo i metadati prima di condividerli online.

Ogni informazione digitale, quindi ogni volta che creiamo o utilizziamo un file, vengono generati dei metadati. Questi possono essere presenti in chat, SMS, telefonate, e-mail, immagini, video, audio, PDF e in molti altri tipi di file.

Essendo un argomento davvero ampio in questo articolo mi limiterò a descrivere alcuni strumenti che consentono di manipolare e pulire determinati tipi di file. Ma prima di addentrarci, è necessario comprendere la teoria di base.

Cosa sono i metadati?

I metadati sono semplicemente dati che descrivono altri dati. Potrebbe sembrare un gioco di parole, ma non lo è. Sono informazioni che forniscono dettagli su un’informazione, a eccezione del suo contenuto effettivo.

Per esemplificare, consideriamo una conversazione digitale ipotetica tra due persone che scambiano messaggi attraverso una chat. Il contenuto dei messaggi, ovvero ciò che le due persone si scrivono, non costituisce i metadati. Al contrario, i seguenti dettagli rappresentano i metadati:

  1. Mittente e destinatario dei messaggi: chi invia a chi.
  2. Data e ora di invio dei messaggi.
  3. Posizione geografica dei partecipanti.
  4. Durata complessiva della conversazione.
  5. Intervalli di tempo in cui si è svolta la conversazione.

A seconda del contesto, la lista potrebbe essere ancora più lunga e includere informazioni come il modello dell’hardware, il sistema operativo utilizzato, il browser web, l’indirizzo IP, i dettagli sulla connessione, il numero di telefono, l’ID del dispositivo, la geolocalizzazione e così via.

Alcuni di questi concetti possono risultare familiari se pensiamo ad aspetti comuni della vita quotidiana, come i cataloghi delle biblioteche o le etichette apposte sui pacchi da spedire. Anche in quei casi, le informazioni fornite sono considerate metadati. Ad esempio, un catalogo bibliotecario contiene informazioni sul contenuto di un libro, l’autore, il genere e la posizione dello stesso. Tutte queste informazioni costituiscono metadati.

A cosa servono?

Esistono diversi tipi di metadati, tra cui quelli descrittivi, amministrativi, strutturali, statistici e legali. In breve, fanno parte integrante del corretto funzionamento di un servizio, proprio come le etichette apposte sui pacchi che assicurano la loro corretta consegna. Ad esempio, nel contesto del World Wide Web, i metadati descrivono il contenuto delle pagine e le parole chiave correlate. Più accurati sono i metadati, maggiori sono i benefici in termini di ottimizzazione per i motori di ricerca (SEO).

Un altro esempio riguarda le fotografie digitali. Nei metadati delle immagini è possibile trovare informazioni sul proprietario, il copyright, il modello della fotocamera, i dettagli sull’esposizione e molto altro. Alcune fotocamere moderne inseriscono anche metadati relativi alla velocità dell’otturatore e altri dettagli tecnici che possono agevolare il lavoro dei professionisti durante la post-produzione, attraverso l’uso di parole chiave.

Tuttavia, l’ampio universo dei metadati può anche essere sfruttato a discapito della privacy. In effetti, questi piccoli frammenti di informazioni fungono da registro delle attività, fornendo dettagli preziosi che possono valere tanto quanto il contenuto stesso, se non di più.

Immagina i metadati come i pezzi di un puzzle. In situazioni sfavorevoli, questi pezzi potrebbero essere assemblati per completare il quadro finale. Potrebbero essere raccolti, elaborati, selezionati, organizzati e incrociati con altre informazioni per ottenere un significato e uno scopo precisi. In sostanza, i metadati potrebbero raccontare una storia.

Il ruolo che i metadati svolgono nell’autodifesa digitale

“i metadati ti dicono tutto sulla vita di una persona. Se hai abbastanza metadati, non hai proprio bisogno del contenuto dell’informazione” -Stewart Baker

Come spiega anche l’Electronic Frontier Foundation (EFF), in un ipotetico scenario di sorveglianza, non è necessario conoscere il contenuto effettivo di una chiamata telefonica se, basandosi sui metadati raccolti, si sa che hai chiamato un ginecologo, hai parlato per mezz’ora e poi, nello stesso giorno, hai chiamato il numero di una clinica locale che si occupa di aborti.

Allo stesso modo, se sanno che hai ricevuto una mail da un servizio che fornisce test sull’HIV, hai chiamato il tuo medico e hai visitato il sito web di un gruppo di supporto per l’HIV nella stessa ora, non è necessario sapere cosa c’era nella mail o di cosa hai parlato al telefono. Come puoi vedere, il contenuto diventa meno rilevante quando si analizzano i metadati.

Devo obbligatoriamente rimuovere i metadati dalle mie foto e dai miei documenti?

La risposta è ovviamente “no”. La scelta spetta a te e dipende dalle tue esigenze personali. Potresti anche decidere di mantenere i metadati per motivi legati al lavoro o alla sfera privata. Tuttavia, se hai aperto questo articolo, è probabile che tu sia interessato ad altro.

Che tu sia un avvocato, uno studente, il proprietario di un’azienda, un’ente pubblico o un utente comune, la protezione dei metadati gioca un ruolo fondamentale nell’ambito dell’autodifesa digitale e del diritto alla privacy, proprio come il contenuto dei dati che essi descrivono. Fino a che punto dovresti alimentare la tua paranoia? Questo dipende dal tuo modello di rischio personale, che è unico per ognuno. In generale, indipendentemente dall’importanza del tuo modello di rischio, è sempre meglio adottare la giusta dose di attenzione.

Come già anticipato nell’introduzione, questo articolo copre soltanto una piccola parte degli strumenti di base che consentono la manipolazione e la pulizia dei metadati per immagini, video, audio, documenti e pdf. Al momento, non andremo oltre. Purtroppo, non è possibile avere il controllo di ogni singolo metadato nell’universo infinito di Internet, considerando la moltitudine di protocolli e servizi utilizzati quotidianamente. La tutela dei metadati, così come la protezione dei contenuti stessi, dovrebbe essere una priorità per multinazionali, aziende e comunità, a seconda del software o del servizio che utilizziamo.

Strumenti di base per la pulizia dei metadati

Exif Cleaner

Exif cleaner è un software gratuito e open source specializzato nella pulizia dei metadati da PDF, immagini e video in vari formati. É disponibile per i principali sistemi operativi desktop, come Windows, Linux e MacOS. Si basa su exif tool, una potente libreria per la manipolazione dei metadati.

L’utilizzo è estremamente semplice: basta trascinare i file di interesse all’interno dell’interfaccia del programma. Una volta scaricato e installato, l’interfaccia è autoesplicativa.

Schermata iniziale del software Exif cleaner

exif cleaner

Il tool si occuperà automaticamente di sovrascrivere le immagini con le versioni pulite dai metadati. Nella tabella sottostante è possibile visualizzare il numero di metadati prima e dopo la pulizia. Passando il mouse sul numero, verrà mostrata una lista di tutti i metadati individuati.

Prima e dopo

Exif tool

Exif tool è il mio preferito in assoluto ed è rivolto a utenti più esperti e smanettoni. Si tratta di una potente libreria su cui si basano la maggior parte degli altri software simili. Fornisce uno strumento a riga di comando che consente sia la manipolazione che la cancellazione dei metadati di immagini, audio, video e PDF. Supporta un’ampia gamma di formati, la lista completa è disponibile qui.

Come già anticipato, exif tool viene usato principalmente da linea di comando, soprattutto in ambiente linux. Per quest’ultimo è reperibile direttamente dai principali repository delle varie distribuzioni. Ovviamente è disponibile anche per Windows e macOS. Essendo un progetto open source, non mancano volontari che sviluppano delle GUI di terze parti. Se ti interessa e vuoi approfondire,trova maggiori info qui.

Exiftool da terminale

Mat

Mat2 è un fantastico strumento open source a linea di comando scritto in Python che supporta una vasta gamma di file comunemente utilizzati dagli utenti. Come Exif Tool, è adatto a utenti più esperti che sanno cosa stanno facendo. Esiste anche una GUI sviluppata solo per Linux. Inoltre, gli sviluppatori mettono a disposizione Mat2-Web per coloro che desiderano creare la propria istanza sul web, compresa di un’interfaccia grafica intuitiva:

Schermata mat2-web

Android e iOS

Con l’aumento dell’uso degli smartphone, le persone condividono una quantità enorme di foto senza rimuovere i metadati. In alcuni casi, se la geolocalizzazione è attivata, queste foto possono involontariamente condividere anche le coordinate di latitudine e longitudine.

Come risolvere questo problema? Esistono app molto interessanti anche in questo ambito.

Scrambled exif (open source) è specificamente progettata per file di immagini. Una volta installata, è molto facile da utilizzare. Basta selezionare le immagini interessate dalla galleria, toccare l’icona di condivisione e selezionare Scrambled Exif dall’elenco delle app. Questa app rimuoverà automaticamente i metadati, consentendoti di condividere le immagini sul web senza preoccupazioni.

Photo Exif Editor è disponibile per Android, ma a differenza di Scrambled Exif, non è open source e include anche una versione a pagamento.

Per iOS c’è Exif Metadata, che consente anche di modificare alcuni metadati, oltre che eliminarli.

Conclusioni

Qualche consiglio finale.

Fai sempre attenzione quando scrivi documenti o produci altri tipi di contenuti. Spesso i software utilizzati per la creazione di documenti, l’editing di video, audio o foto includono funzionalità integrate per modificare i metadati direttamente nel file prima di esportarlo secondo le tue preferenze.

Ricorda sempre che non esiste una soluzione magica o un software che sia efficace al 100%. La sicurezza è un processo.