Sondare l’opinione pubblica in rete? Con Oasys (Opinion Analysis System) si può. Oasys è un programma nato dalla collaborazione tra il Dipartimento di Informatica e Sistemistica dell’Università degli Studi di Napoli Federico II e l’ UMIACS, l’Institute for Advanced Computer Studiesdell’Università del Maryland.
Il programma consente la gestione semantica dei documenti, fungendo da vero e proprio strumento di controllo della Rete. L’idea di creare un software in grado di ‘monitorare’ l’opinione pubblica è nata da una semplice chiacchierata del prof. V. S. Subrahmanian, direttore dell’UMIACS, con il capo del dipartimento della Difesa americano. Lo spunto è stato offerto dallo scandalo della prigione di Abu Ghraib e dalla sempre crescente necessità di tenere d’occhio il web in relazione alla sicurezza nazionale. Internet, luogo deputato alla conoscenza, offre la possibilità di reperire una miriade di informazioni e allora perchè non studiare un sistema per analizzare le opinioni della stampa?
Il software setaccia la rete tramite un crawler che gira continuamente per analizzare le notizie rilasciate nei siti di fonti di informazione indicati e identifica gli argomenti richiesti, interpretando il significato del testo grazie alla capacità di riconoscere aggettivi ed avverbi. In questo modo, assegna un punteggio all’intensità di opinioni sugli argomenti ricercati.
V.S. Subrahmanian
Il sistema riconosce aggettivi ed avverbi e - tramite algoritmi - legge automaticamente i testi e rintraccia le parole chiave. Quando si imbatte in aggettivi con significato positivo, gli algoritmi assegnano un valore tra 0 e 1, in caso contrario, assegnano un punteggio tra -1 e 0 e si crea una rappresentazione grafica con ascisse e ordinate, offrendo un risultato con un margine di errore davvero basso.
La nuova versione di Oasys, la 2.0, contiene versioni estese e migliorate degli algoritmi definiti che permettono di identificare le intensità delle opinioni su una scala da -1 a + 1 su qualunque argomento di interesse dell’utente, mostrando anche come l’intensità cambia rispetto al tempo, rispetto ai diversi paesi de alle sorgenti di news.
«Oasys – spiega Subrahmanian - può ricercare milioni di feed RSS in più lingue, è uno strumento unico ed innovativo per l’analisi delle opinioni sul web, in grado di offrire una risposta all’utente sull’opinione della rete su un dato argomento, studia il grado di opinione e può riconoscere le opinioni negative».
OASYS 2.0, può identificare le intensità delle opinioni espresse dalle news in 8 lingue, tra cui l’inglese, il cinese, il russo, il coreano e l’arabo e ha analizzato più di 4 milioni di news da 109 sorgenti diverse e da 19 paesi.
Un esempio di applicazione di Oasys. La parola 'Bush', ritrovata nei discorsi della rete la scorsa estate ha fatto registrare una concentrazione di opinioni negative soprattutto nel mese di luglio.
La precedente versione, la 1.5, si è aggiudicato lo scorso agosto il Computerworld Magazine’s 2006 Horizon Awards competition per il software più innovativo pre-commerciale del 2006. Già funzionava in più lingue, in inglese, italiano e spagnolo e aveva già effettuato l’analisi di più di 3 milioni di articoli, ma OASYS 2.0 vanta un addizionale di 1.360.000 articoli.
L’utente può avviare una ricerca secondo l’intervallo di tempo di interesse, selezionando dalla lista di sorgenti di news che Oasys può tracciare, quelle che gli interessano. L’utente può inserire una parola di ricerca e selezionare i paesi d’interesse. Dopo aver avviato la ricerca, i risultati vengono forniti tramite un grafico, in cui il parametro temporale è rappresentato dalla coordinata x e l’intensità delle opinioni è disegnata sull’asse delle y.
«Rendere comprensibili i significati contenuti nei siti web alle macchine, il machine understandable, e non solo agli esseri umani. E’questa una delle grandi sfide della ricerca attuale nell'ottica del nuovo Web, il Web Semantico – spiega il prof. Antonio Picariello del Dipartimento di Informatica e Sistemistica dell’Università degli Studi di Napoli Federico II -. Più modestamente, Oasys si inserisce nei sistemi che effettuano analisi semantica di un testo esistente. E direi con ottimi risultati rispetto a quanto già esistente. Un passo ulteriore consisterà in ciò che noi abbiamo chiamato anche sentiment analysis, considerando come gli aggettivi, oltre che sostantivi, rafforzano il giudizio su un evento, al fine di migliorare l’analisi di tendenza».
La nuova frontiera è rappresentata dal poter analizzare le informazioni contenute nei blog, oltre che negli articoli e le news.
«Oasys sonda la rete analizzando le news, ora stiamo potenziando il sistema per effettuare anche analisi di blog, è un sistema con una forte caratterizzazione sociologica, un vero social media - spiegano il professor Picariello e Diego Reforgiato Recupero, ora ricercatore dell’Umiacs, dopo aver conseguito il dottorato presso l’Università degli Studi di Napoli Federico II – è importante valutare come vengono espresse le opinioni, andare alla ricerca del linguaggio di una data community, visto il continuo evolversi di blog e forum, scoprire le community nascoste e sondare qual è il sentimento comune. Conoscere l’opinione delle persone relativamente a certi argomenti apre nuove prospettive per analisi di tipo sociologico e di mercato, per le aziende è importante conoscere le tendenze e le opinioni del proprio pubblico, anche semplicemente sui temi dell’attualità, come l’andamento delle elezioni. Oasys è uno strumento che ha in sé un grosso potenziale per il futuro, è costato 200 mila dollari, ma una nota compagnia ha già chiesto la licenza per commercializzarlo».
Mediante l’analisi del testo è possibile studiare anche nuovi prodotti per la ricerca di informazioni, «non solo per i sondaggi in rete, ad esempio tramite il topic detection. È fondamentale – continua Picariello con il neo dottorato Carmine Cesarano del Dipartimento di Informatica e Sistemistica dell’Università degli Studi di Napoli Federico II - considerare tutti i sistemi all’interno dell’architettura del web semantico per poter sfruttare tutte le potenzialità già a disposizione in modo standard». Oasys si pone, dunque, come punto di partenza per lo sviluppo futuro di nuovi sistemi.