Quello che i dati non sono in grado di spiegare

In un periodo nel quale la crescita esponenziale dei dati e l’accresciuta capacità di analisi attraverso nuovi strumenti sta suscitando l’entusiasmo di molti, l’editorialista del New York Times David Brooks ritiene che tale entusiasmo contrasti con l’effettiva capacità di prendere decisioni corrette che tali informazioni dovrebbero assicurare. Tra i limiti dei Big Data, Brooks evidenzia alcuni punti:

  • I dati si collocano all’opposto della dimensione naturalmente sociale dell’uomo: ciò in cui le persone sono veramente brave, non è tanto la matematica (provate a calcolare al volo la radice di 437), quanto invece la capacità di comprendere gli stati d’animo e le emozioni altrui.
  • I dati non descrivono il contesto: le decisioni umane non sono eventi discreti, si collocano in sequenze e contesti. Mentre i dati non sono in grado di fornire una narrazione, le persone consentono di intrecciare molteplici cause e contesti diversi.
  • I dati creano grandi pagliai: sebbene l’analisi dei dati consenta di creare correlazioni statisticamente significative, la maggior parte di queste correlazioni secondo il matematico e filosofo Nassim Taleb sono false o rischiano di ingannare nell’interpretazione di una situazione. Tali falsità crescono esponenzialmente al crescere dei dati che si raccolgono e il pagliaio diventa sempre più grande, ma l’ago che cerchiamo resta sepolto nel profondo.
  • Eccetera, eccetera.

Personalmente condivido solo in parte le riflessioni di Brooks: non ritengo per esempio che la questione sia legata all’assenza di una dimensione “spirituale” dei dati. Dal suo punto di vista, i dati non spiegherebbero. Falso. I dati spiegano moltissimo. Non a caso le questioni relative alla capacità di analisi, alla privacy e all’asimmetria informativa sono temi sempre più pregnanti, che coinvolgono attori importanti del mondo della rete, e s’intrecciano con due aspetti fondamentali: l’organizzazione dell’informazione e il controllo. Sebbene quando si parli di Linked Open Data questo tema venga spesso trascurato, non dobbiamo dimenticarci che hub di informazioni come DBpedia sono in grado offrire non solo i contenuti di Wikipedia in forma strutturata, ma forniscono una specifica visione del mondo.

Una visione del mondo che ha origine a partire dalla comunità di Internet, e non viene imposta dall’alto. DBpedia ci dice cos’è il razzismo, come si è svolta la II Guerra Mondiale, da quali scrittori o da quali ideologie è stato influenzato un certo autore di romanzi sulla base delle discussioni e del confronto tra utenti. Pensate a cosa accadrebbe se fosse qualcun altro a imporre tale visione. Qualcuno che ha interesse, e in questi giorni l’esempio potrebbe calzare, che un certo personaggio politico non venga associato a un altro: un tool automatico potrebbe, in mancanza delle relazioni tra i dati, ignorare questo aspetto e fornirci risultati erronei, deviati dalla volontà di chi vorrebbe impedire l’emergere di certe informazioni.

Il modo in cui le informazioni vengono organizzate, dunque, è strettamente legato al controllo. Ma esiste un livello più basso, forse più semplice da intuire. Non si tratta solo di chi organizza le informazioni, ma di chi le detiene. Oggi molti servizi ci raccontano che possiamo impacchettare e scaricare tutti i nostri dati, tutte le attività che abbiamo compiuto all’interno di un social network e disporne liberamente. Tuttavia, chi possedeva non solo i miei, ma i dati di tutti, continua a possederli (e dunque l’asimmetria informativa resta e si amplifica) e può combinare e analizzare tali informazioni. Traendo una nuova conoscenza che il buon Brooks ritiene accessoria, poiché non rispecchia la spiritualità dell’uomo.

- David Brooks, “What Data Can’t Do“, The New York Times, 18 febbraio 2013

Article written by

Giuseppe Futia è responsabile per la comunicazione del Centro Nexa su Internet & Società del Politecnico di Torino. Collabora con la redazione web de La Stampa per articoli su Internet e nuovi media, ed i suoi interessi di ricerca spaziano dalle nuove forme di giornalismo in Rete a tecniche avanzate di visualizzazione di dati.

Please comment with your real name using good manners.

Leave a Reply