cover


Sergio Bolasco

TaLTaC2.10
SVILUPPI, ESPERIENZE ED ELEMENTI ESSENZIALI
DI ANALISI AUTOMATICA DEI TESTI



On line da Giugno 2010
ISBN 978-88-7916-459-7 - 15,5 x 22 cm - 2010


pp. 56 – € 17,00
Prezzo on line € 14,45 - Sconto 15%  Acquisto il volume



Il software per l’analisi qualitativa si è molto evoluto negli ultimi dieci anni. Da elemento di aiuto alla lettura del testo diviene sempre più strumento per l’analisi “automatica” del testo e ciò quasi a prescindere dalle scelte epistemologiche del ricercatore. Oggi si avverte infatti come preminente l’esigenza di scavare nella molteplicità e vastità di testi a disposizione, alla ricerca dell’informazione utile. In questo senso, la misurazione quantitativa di un materiale così sfumato (senza soluzione di continuità) come il linguaggio, aiuta a rendere più rigorosa ogni rappresentazione che si dà della informazione estratta dai dati testuali. Sia la Text analysis che il Text mining si servono sempre più di piattaforme in grado di discernere in maniera automatica il contenuto delle collezioni di documenti, oggetto d’interesse. Questo contributo testimonia l’evoluzione di TaLTaC – software del «Trattamento automatico lessicale e testuale per l’analisi di contenuto di un corpus» – ideato dall’autore dieci anni or sono, nella prospettiva di stabilizzare il risultato dell’analisi su dati non strutturati. Il lavoro è suddiviso in due parti: la prima ricostruisce la storia di questa evoluzione attraverso le esperienze e i contributi delle ricerche svolte, la seconda mette in luce i caratteri essenziali che distinguono TaLTaC da altre piattaforme.

Sergio Bolasco
, ordinario di Statistica, insegna Metodi esplorativi per l’analisi dei dati alla facoltà di Economia dell’Università di Roma «La Sapienza» e svolge un corso di Text mining e analisi automatica dei dati testuali nel Master in Fonti strumenti e metodi per la ricerca sociale presso la facoltà di Statistica della stessa università. Fra le sue pubblicazioni recenti: Analisi multidimensionale dei dati (Carocci), Ricerca qualitativa e computer (Angeli), Text mining (Cisu), Parole in libertà. Un’analisi statistica e linguistica dei discorsi di Berlusconi (Manifestolibri, in collaborazione con Nora Galli de’ Paratesi e Luca Giuliano).


Il testo è di 56 pagine ed è contenuto in un unico file PDF
Per leggere o scaricare il file cliccare sul sommario


pdf


INTRODUZIONE


1. ELEMENTI DI QUADRO GENERALE

1.1. Un po’ di storia: sviluppi ed esperienze - 1.2. Le principali funzionalità di TaLTaC2 in sintesi - 1.3. Una strategia per l’analisi del testo - 1.4. Gli ambienti di TaLTaC2 - 1.5. Il modello generale di corpus: collezione dei testi e variabili associate


2. ALCUNI ELEMENTI ESSENZIALI DI TaLTaC2

2.1. Predisposizione del lavoro - 2.1.1. Sessione di lavoro - 2.1.2. Acquisizione del corpus - 2.1.3. Tabelle del DataBase di Sessione - 2.2. Operazioni di import ed export - 2.2.1. Importa lista - 2.2.2. Ricostruire un corpus - 2.3. Pre-trattamento - 2.3.1. Sezioni - 2.3.2. Normalizzazione - 2.3.3. Sub-occorrenze - 2.4. Analisi lessicale - 2.4.1. Tagging grammaticale - 2.4.2. Tagging semantico - 2.4.3. Query elementari e complesse - 2.4.4. Sull’analisi delle specificità - 2.5. Analisi testuale - 2.5.1. Il text mining in TaLTaC2: la ricerca di entità - 2.6. Strumenti avanzati di ricerca ed estrazione di informazione - 2.6.1. Creazione/modifica di una query predefinita - 2.6.2. Meta-lista - 2.6.3. Meta-query - 2.7. Per concludere


3. RIFERIMENTI BIBLIOGRAFICI

3.1. Bibliografia intorno a TaLTaC e JADT - 3.2. Altri riferimenti