Il software per l’analisi qualitativa si è molto evoluto negli ultimi dieci anni. Da elemento di aiuto alla lettura
del testo diviene sempre più strumento per l’analisi
“automatica” del testo e ciò quasi a prescindere dalle
scelte epistemologiche del ricercatore. Oggi si avverte
infatti come preminente l’esigenza di scavare nella
molteplicità e vastità di testi a disposizione, alla ricerca
dell’informazione utile.
In questo senso, la misurazione quantitativa di un materiale
così sfumato (senza soluzione di continuità) come
il linguaggio, aiuta a rendere più rigorosa ogni rappresentazione
che si dà della informazione estratta dai
dati testuali. Sia la Text analysis che il Text mining si
servono sempre più di piattaforme in grado di discernere
in maniera automatica il contenuto delle collezioni
di documenti, oggetto d’interesse.
Questo contributo testimonia l’evoluzione di TaLTaC
– software del «Trattamento automatico lessicale e
testuale per l’analisi di contenuto di un corpus» – ideato
dall’autore dieci anni or sono, nella prospettiva di stabilizzare
il risultato dell’analisi su dati non strutturati.
Il lavoro è suddiviso in due parti: la prima ricostruisce
la storia di questa evoluzione attraverso le esperienze
e i contributi delle ricerche svolte, la seconda mette in
luce i caratteri essenziali che distinguono TaLTaC da
altre piattaforme.
Sergio Bolasco, ordinario di Statistica, insegna Metodi
esplorativi per l’analisi dei dati alla facoltà di Economia
dell’Università di Roma «La Sapienza» e svolge un corso
di Text mining e analisi automatica dei dati testuali
nel Master in Fonti strumenti e metodi per la ricerca
sociale presso la facoltà di Statistica della stessa università.
Fra le sue pubblicazioni recenti: Analisi multidimensionale
dei dati (Carocci), Ricerca qualitativa
e computer (Angeli), Text mining (Cisu), Parole in
libertà. Un’analisi statistica e linguistica dei discorsi di
Berlusconi (Manifestolibri, in collaborazione con Nora
Galli de’ Paratesi e Luca Giuliano).
|