Sul sito di gadget nerd Thinkgeek vendono una t-shirt con scritto “ Go away or I will replace you with a very small shell script” , ovvero “ Vattene prima che ti sostituisca con un minuscolo programmino”. Una minaccia ironica rivolta alle occasioni in cui il monotono lavoro di qualche rompiscatole potrebbe essere svolto (con meno spese e lamentele) da un semplice software. Stavolta però a sudare freddo ci siamo noi, qui, dietro le tastiere. Tentazioni luddiste a Wired? Sì, perché ci sono algoritmi che stanno diventando capaci di sostituire un giornalista. Due compagnie americane, la Narrative Science a Chicago e la Automated Insights a Durham, North Carolina, hanno sviluppato dei programmi che scrivono automaticamente articoli giornalistici a partire da dati grezzi.
La storia parte da Kristian Hammond, un informatico che vanta un dottorato a Yale. Nel 2009, Hammond e un collega, Larry Birnbaum, si trovano a insegnare a un corso per una scuola di giornalismo della Northwestern University. Gli studenti, un inusitato mix di giornalisti e informatici, se ne escono con un programmino chiamato Stats Monkey. Gli davi in pasto una scheda tecnica di una partita di baseball, e in pochi secondi generava un articolo sportivo completo di immagini, titoli, didascalie e perfino rimandi corretti alla storia del baseball. Niente che possa finire sul New Yorker, ma più che sufficiente per riempire le pagine dei quotidiani locali con le partitelle dei dilettanti.
Era solo baseball, ma uno dei presenti alla presentazione di Stats Monkey, Stuart Frankel, capì che era l'inizio di una miniera d'oro. Chiese a Hammond e Birnbaum se era possibile andare oltre: scrivere un programma che generasse storie da qualsiasi insieme di dati, storie che si potessero vendere. I tre fondarono Narrative Science e costruirono un team composto sì da programmatori - per affinare il software e renderlo adatto a qualsiasi tipo di dati - ma anche da giornalisti professionisti che fanno da meta-scrittori. Questi scrivono gli innumerevoli template linguistici: schemi di frasi prefabbricati, che poi il software riempie coi dati e incolla insieme. Basta poi dire al software di sfruttare più un certo tipo di frasi rispetto a un altro, ed ecco che cambia il taglio dell'articolo. Narrative Science dichiara che “ non è più difficile, per noi, creare un articolo irriverente e scanzonato rispetto a un asettico lancio d'agenzia”. Come il cliente preferisce, e il risultato è inquietantemente umano.
All'inizio Narrative Science (e la concorrente Automated Insights) si è focalizzata sulla scrittura di report automatici di sport e finanza. Il motivo è semplice: quasi tutto quello che c'è da dire al riguardo ha a che fare con un bel po' di dati grezzi (gol segnati, azioni che crollano, eccetera) che un computer può condensare e raccontare. Ma a mille ce n'è di dati da narrar. Le aziende hanno imparato da tempo che raccogliere dati è fondamentale per comprendere e migliorare il proprio business: peccato che poi vi affoghino, incapaci di dare un senso a migliaia di monotone tabelle e grafici. I software invece possono leggere i dati senza annoiarsi e analizzare i trend chiave. Gli algoritmi di scrittura automatica poi compilano automaticamente un report tanto leggibile quanto impeccabilmente corretto, che restituisce significato ai dati raccolti, e che i manager possono comprendere. Questo tipo di reporting automatico, ancora più del giornalismo, potrebbe diventare in futuro il core business di aziende come Narrative Science.
E non ci sono solo dati numerici da raccontare. Per esempio, il software di Narrative Science è in grado di leggere milioni di tweet che riguardano un personaggio, di analizzare automaticamente se sono di plauso o critica (quella che i linguisti computazionali chiamano sentiment analysis, analisi del sentimento: qualcosa che si fa anche in Italia) e di generare un conciso, leggibile report su cosa dice di un dato personaggio la twittersfera. Basato su una mole di dati che un giornalista umano non potrebbe neanche iniziare a raccogliere: in questo i software di scrittura automatica hanno un vantaggio decisivo.
Anche le guide gastronomiche sono a rischio obsolescenza: sfruttando la flessibilità del software di Narrative Science, uno dei meta-scrittori del loro team ha creato un bot capace di leggere varie recensioni di ristoranti sul Web, carpirne gli aspetti chiave, e macinare dozzine di articoletti del tipo “ Dove mangiare italiano ad Atlanta”.
Automated Insights, ritornando allo sport, ha lanciato invece il sito Stat.us. Anche questo sfrutta Twitter, ma all'opposto: aggrega dati sportivi da varie fonti, li analizza e li smista, creando account Twitter automatici (uno per ogni squadra di football, basket etc.) che aggiornano i fan su ogni battito d'ali della squadra preferita. È addirittura possibile generare una lista di account Twitter personalizzata per la propria squadra di fantacalcio. Stat.us è il figlio naturale dello Statsheet Network, sempre di Automated Insights, una collezione di 345 siti di news, uno per ogni squadra del campionato di basket NCAA, tutti generati in modo interamente automatico.
E per i geek che non guardano partite, ma giocano avventure attaccati a sedia e cuffie? Narrative Science sta per lanciare articoli personalizzati basati su session di World of Warcraft. Immaginate di partecipare a un'epica battaglia su WoW e di poter leggere (e condividere con gli amici) un bell'articolo che racconta la vostra avventura, come se aveste avuto un giornalista di guerra embedded tra le vostre file.
L'obiettivo a breve termine del giornalismo automatico è infatti un mondo in cui ognuno di noi è accompagnato da un reporter invisibile, che ci aiuti a dare senso ai dati a cui veniamo incontro. Ricevere un'analisi del sangue che, invece di essere un'oscura serie di numeri interpretabile solo da uno specialista, sia un rapporto leggibile e chiaro sulla vostra salute, completo di indicazioni su cosa fare per migliorare. O un articolo sull'andamento del vostro conto in banca, limpido e ricco di consigli.
Dal punto di vista del giornalismo vero e proprio, i report automatici per ora sono al massimo il punto di partenza per il data journalism, in cui poi il giornalista umano deve infilare la necessaria interpretazione. Ma Kristian Hammond non si accontenta, e vuole rendere Narrative Science capace di interpretare i dati con intelligenza. Idealmente il software dovrebbe leggere i dati, scovare correlazioni o pattern interessanti, ponderarli e infine scrivere un articolo su quello che ha scoperto. E visto che esistono già software capaci di ragionare e raggiungere conclusioni profonde dai dati, è solo questione di tempo prima che accada.
È davvero il caso di mandare a casa i giornalisti in carne, ossa e taccuino? Per ora gli algoritmi vengono usati per raccontare cose che altrimenti nessun essere umano o quasi prenderebbe in considerazione. Vivacizzare dati aziendali, aggiornare amici e parenti sulle partitelle delle squadre dei ragazzi, scrivere tonnellate di report su dati che altrimenti nessuno frugherebbe. Scott Frederick, il Ceo di Automated Insights, ha dichiarato che “non ci interessa togliere il lavoro ai giornalisti umani. Semmai, vogliamo che possano lavorare sulle cose che veramente vogliono. A nessuno interessa scrivere ogni settimana un aggiornamento sul mercato immobiliare in tutte le 42mila contee degli Stati Uniti, ma questo è quello che il nostro software può fare”. Kristian Hammond e i suoi colleghi a Narrative Science invece non vedono nessun motivo per non competere direttamente. “ Gli esseri umani sono incredibilmente complessi, ma alla fine anche loro sono macchine. Nel giro di 20 anni, non ci sarà nessun'area in cui Narrative Science non potrà scrivere articoli [...] Fra 15 anni, il 90% delle news sarà scritto da un computer”. Quando gli hanno chiesto se un algoritmo avrebbe vinto il Pulitzer fra 20 anni, Kristian però non era d'accordo. Perché secondo lui accadrà già fra cinque anni.
Ma il vero rischio per i lettori è paradossalmente nella capacità del giornalismo automatico di seguire il loro gusto fin troppo bene. Immaginate di avere news personalizzate a seconda delle vostre opinioni politiche, o dei vostri gusti estetici: un quotidiano che adatta la scrittura dei suoi articoli a ciascun lettore, sfruttando i dati che disseminate su motori di ricerca e social network. Questo ovviamente cullerebbe il nostro cervello, dandoci in pasto cose sicuramente gradevoli, ma lasciandoci in una bolla ovattata dove non riceveremmo mai opinioni e giudizi discordi da quelli che ci aspettiamo già. Alla fine potremmo ridurci a leggere uno specchio automatico di noi stessi, incapace di espandere davvero la nostra mente. Questo, forse, è un motivo per continuare a tenere le nostre dita umane sulla tastiera. Quelle di ciascun cittadino.
Nessun commento:
Posta un commento