Jadt 2010-Statistical Analysis of Textual Data - Proceedings of the 10th International Conference - 9-11 June 2010 Sapienza University of Rome-

Statistical Analysis
of Textual Data
Proceedings of 10th International Conference
Journées d’Analyse statistique des Données Textuelles
9-11 June 2010 - Sapienza University of Rome

Sergio Bolasco
Isabella Chiari
Luca Giuliano
editors

Collana "Colloquium"

ISBN 978-88-7916-450-9 - 16 x 24 cm - 2010

Paperback - pp. 1330 – 2 vols. – € 124,00
On-line price € 105,40 - Save 15%

CD version - € 47,40
On-line price € 40,29 - Save 15%

Committees
Credits
Authors

PDF   Contents
          Part I
          Part II
          Part III

Committees Credits Authors Contents

Credits

Committees Credits Authors Contents

Authors

Contents - Preface

Part I. METHODS AND EXPLORATORY TEXTUAL DATA ANALYSIS Part II Part III

Automatic Classification and Indexing

Inge Alberts, Dominic Forest, Suzanne Bertrand-Gastaldy
Catégorisation automatique du courriel en fonction de catégories pragmatiques

Simona Balbi, Raffaele Miele, Germana Scepi
Clustering of documents from a two-way viewpoint

Jean-François Chartier, Jean-Guy Meunier, Choukri Djellali
Analyse des variations entre partitions générées par différentes techniques de classification automatique de textes

Jean Danis, Jean Guy Meunier, Jean-François Chartier, Motassem Alrahabi, Jean-Pierre Desclés
Classification automatique et stratégie d’annotation appliquées à un concept philosophique: la dimension psychologique du concept de LANGAGE dans l’œuvre de Bergson

Luca Giuliano, Gevisa La Rocca
Validity and reliability of the automatic classification of texts according to the negative-positive criterion

Rosita Guido, Michelangelo Misuraca, Francesca Vocaturo
An automatic SVM-based strategy for Digital Protocol

Férihane Kboubi, Anja Habacha Chabi, Mohamed BenAhmed
L’exploitation des relations d’association de termes pour l’enrichissement de l’indexation de documents textuels

Mauro La Torre, Susanna Pallini
Classificazione automatica di narrazioni autobiografiche

Laurent Kevers, Amin Mantrach, Cédrick Fairon, Hugues Bersini, Marco Saerens
Classification supervisée hybride par motifs lexicaux étendus et classificateurs SVM

Mario A. Maggioni, Francesca Gambarotto, T. Erika Uberti
Mapping the evolution of industrial *clusters*: a meta-analysis

Pasquale Pavone
Sintagmazione del testo: una scelta per disambiguare la terminologia e ridurre le variabili di un’analisi del contenuto di un corpus

Dominique Peyrat-Guillard, Daniel Dufresne
L’analyse exploratoire de référentiels de compétences avec Alceste : une aide à la lecture de l’analyste

Text Mining

Carlo Amati, Fabio De Angelis, Francesca Romani
Textual data classification for a sectoral categorisation of public investments

Vanessa Andreani, Thomas Lebarbe
Named entity normalization for termino-ontological resource design: mixing approaches for optimality

Ismail Biskri, Hassane Hillali, Louis Rompré
Extraction de relations d’associations maximales dans les textes

Martine Cadot, Michel Zitt, Gabriel Meurin, Alain Lelu
Robustesse des partitions de textes : une exploration autour de l’apport des motifs de mots

Francesca della Ratta Rinaldi, Barbara Lorè
Il lavoro e i suoi contenuti. Un’applicazione di Text Mining per categorizzare le attività dettagliate di lavoro nell’indagine campionaria sulle professioni Istat

Hemant Misra, François Yvon
Modèles thématiques pour la segmentation de documents

Juan-Manuel Torres-Moreno, Alejandro Molina, Gerardo Sierra
La energía textual como medida de distancia en agrupamiento de definiciones

Stylometry and Textometry

Delphine Amstutz, Philippe Gambette
Utilisation de la visualisation en nuage arboré pour l’analyse littéraire

Anne Bandry-Scubbi
Du vocabulaire spécifique à l’analyse stylistique : l’exemple de Roderick Random

Julien Bonneau, Anne Dister
Logométrie et modélisation des interactions discursives. L’exemple des entretiens semi-directifs

Aurore Boulard, Jean-Marie Gauthier
Le complément sujet : Etude de l’utilisation des pronoms moi et je dans le discours d’enfants grâce à l’analyse statistique discursive

Etienne Brunet
L’allitération. Hasard et observation

Robert Byrnes
A statistical analysis of the «Eumaeus» phrasemes in James Joyce’s Ulysses.

Cyril Labbé, Dominique Labbé
Ce que disent leurs phrases

Marc Le Pouliquen, Marc Csernel
Stemma codicum et relation d’intermédiarité, utilisation de la méthode de Don Quentin

Xuan Luong, Etienne Brunet, Dominique Longrée, Damon Mayaffre, Sylvie Mellet, Céline Poudat
La cooccurrence, une relation asymétrique?

Véronique Magri-Mourgues
Distance intertextuelle et connexion lexicale : outils de catégorisation générique ou stylistique ? Approche expérimentale d’un corpus inédit : le corpus aragonien

Bénédicte Pincemin, Serge Heiden, Marie-Hélène Lay, Jean-Marc Leblanc, Jean-Marie Viprey
Fonctionnalités textométriques : Proposition de typologie selon un point de vue utilisateur

Takafumi Suzuki, Shuntaro Kawamura, Akiko Aizawa
Exploratory analysis of stylistic characteristics in Japanese Q&A communities

Takafumi Suzuki, Shuntaro Kawamura, Fuyuki Yoshikane, Kyo Kageura, Akiko Aizawa
Co-occurrence-based indicators for investigating authors’ styles

Xavier-Laurent Salvador, Fabrice Issac
Modèles théoriques inductifs et propositions d’applications aux donnés textuelles de l’ancien français

Lexical and Semantic Analysis

Yves Bestgen, Guy Lories, Jennifer Thewissen
Using latent semantic analysis to measure coherence in essays by foreign language learners?

Jean-Pierre Colson
Automatic extraction of collocations: a new Web-based method

Marie Pierre Escoubas-Benveniste
Le Monde et le “Grenelle de l'Environnement” : pistes pour l'analyse sémantique assistée par ordinateur d’un corpus de presse

Margareta Kastberg Sjöblom
Costellazioni tematiche in un corpus letterario italiano

Dominique Longrée, Caroline Philippart de Foy, Gérald Purnelle
Structures phrastiques et analyse automatique des données morphosyntaxiques : le projet LatSynt

Fionn Murtagh, Adam Ganz
Semantics from Narrative

Laure Pairet
Vocabulaire de la gestion: usage et sémantique

Coralie Reutenauer, Evelyne Jacquey, Michelle Lecolle, Mathieu Valette
Sémème au macroscope : genèse et variation sémiques d’une unité lexicale

Irene Russo
Indicatori sintagmatici di bifunzionalità per gli aggettivi relazionali

Jean-Marie Viprey, Philippe Schepens
Dérivation lexicale et dérive du discours : « mutualisation, mutualiser »

Amal Zouaq, Michel Gagnon, Benoit Ozell
Grammaire de dépendances et ontologies de haut niveau : vers un processus modulaire pour l’analyse sémantique

Part II. DOMAIN SPECIFIC ANALYSIS Part I Part III

Newspaper Analysis

Alessandra Areni, Gilda Sensales, Alessandra Dal Secco
Le rappresentazioni del movimento del Sessantotto nella stampa italiana di quel periodo. Indagine lessicografica sui titoli di quotidiani di diverso orientamento ideologico-culturale

Manuela Bussola, Federica Pellizzaro, Silvia Montecolle, Nicola Vallo, Ludovica Ioppolo, Fabio Marcodoppido, Federica Mancini, Paola Muccitelli, Manuela Nieddu, Francesca Proia
Le parole della disoccupazione nelle storie inviate a “La Repubblica”. Un’integrazione tra gli approcci lessicometrico ed ermeneutico

Joceline Chabot, Sylvia Kasparian, Philippe Desjardins
Massacres, atrocités et génocide. Analyse comparée d’un corpus de presse canadienne-française sur les atrocités allemandes et le génocide arménien (1914-1919)

Alessandra Dal Secco, Gilda Sensales, Alessandra Areni
Representations of March 8 and feminine identities. A pilot study on communication in the Italian press (2000-2009)

Alexandre Delanoë
Statistique textuelle et séries chronologiques sur un corpus de presse écrite. Le cas de la mise en application du principe de précaution

Stefano Ondelli, Matteo Viale
Evidenze quantitative sull’italiano tradotto in un corpus giornalistico

Cornelia Zuell
Using computer-assisted text analysis to identify media reported events

New Media and Social Networks

Adil El Ghali, Yann Vigile Hoareau
Analysing the blogosphere using a random walk through its semantic spaces

Cristina Cenci, Enrico Pozzi, Matteo Borsacchi
Autopsia semantica di un corpo mistico: la morte di Michael Jackson nella stampa italiana e su YouTube

Louise-Amélie Cougnon, Thomas François
Quelques contributions des statistiques à l’analyse sociolinguistique d’un corpus de SMS

Anna Gigante, Elisabetta Pelliccia
L’immagine delle parole in rete. Applicazione di Network Text Analysis sui gruppi di Facebook dedicati alla politica

Daniel Hromada
Quantitative intercultural comparison by means of parallel pageranking of diverse wikipedias

Jacques Savoy, Olena Zubareyva
Classification automatique d’opinions dans la blogosphère

Legal, Scientific and Political Discourse

Lorenzo Bernardi, Arjuna Tuzzi
L’autografo del Presidente della Repubblica: un archetipo del discorso di fine anno mediante ADT

Stefano Castelli, Alessandro Pepe, Loredana Addimando
Qualitatively mapping a research front through word-correspondence textual analysis: a case study

Michele Cortelazzo, Francesca Gambarotto
I discorsi dei Presidenti di Confindustria

Serge de Sousa
Parentages et proximités segmentales dans le discours révolutionnaire en Amérique latine de Bolivar à la Révolution bolivarienne (1811-2009)

Silvia Fernandez, Pierre Jourlin, Eric SanJuan
Unsupervised mining of knowledge gaps in scientific literature

Domenica Fioredistella Iezzi
Topic connections and clustering in text mining: an analysis of the JADT network

Graeme Hirst, Yaroslav Riabinin, Jory Graham
Party status as a confound in the automatic classification of political speech by ideology

Ersilia Incelli
Investigating keyword extraction for identifying units of stance in legislative texts

Bill Louw, Carmela Chateau
Semantic prosody for the 21st Century: Are prosodies smoothed in academic contexts? A contextual prosodic theoretical perspective

Erin MacMurray
Trois débats et une élection : Débats à l’occasion de l’élection présidentielle américaine de 2008 [Obama-McCain]

Anne-Lyse Minard, Anne-Laure Ligozat, Brigitte Grau
Extraction de résultats expérimentaux d’articles scientifiques pour le peuplement d’une base de données

Isabella Mingo, Cristina Panattoni
Il lessico e i temi della statistica ufficiale in Italia. Un’analisi lessicometrica del Programma Statistico Nazionale degli ultimi dieci anni

Denis Monière, Dominique Labbé
Segmentation des corpus chronologiques : 143 ans de discours gouvernemental au Québec

Maxime Sainte-Marie, Jean-Guy Meunier, Nicolas Payette, Jean-François Chartier
Reading Darwin between the lines: a computer-assisted analysis of the concept of evolution in the Origins of species

Jacques Savoy
Discours électoral et discours présidentiel : Une étude lexicale comparative de B. Obama

Ines Testoni, Marisa Cemin, Elisa Dakin, Arjuna Tuzzi
The bioethical debate between Laicism and Catholicism on the self-determination of death and dying. Gathering of logical substratum over and above opposites

Society and Psycho-/Socio-Linguistics

Priscille Baldit-Schneller, Catherine Domingues
La carte de randonnée vue par les randonneurs

Valérie Beaudouin, Julia Velkovska
Dialogues vocaux entre clients et automates ou comment l’homme et la machine s’entendent dans la réalisation d’un service

Marcello Bidoli, Gevisa La Rocca, Chiara Mapelli
Erogare formazione in F.A.D. e in Blended. Individuazione delle problematiche dei tutor attraverso l’analisi dei segmenti

Mathieu Brugidou, Michèle Moine
Normes émergentes et stigmatisation. Une analyse comparative à partir des deux questions ouvertes sur les raisons de ne pas trier les déchets et de ne pas faire d’économie d’énergie

Pascual Cantos-Gómez
Analyzing the oral speech of an Alzheimer affected person: A case study

Grazia De Maio, Fiorenza Deriu
L’emergenza abitativa a Roma: dalla vulnerabilità all’esclusione sociale. Percorsi esistenziali

Francesca della Ratta Rinaldi
Se pensa al suo futuro, di cosa ha più paura?

Francesca della Ratta Rinaldi, Marianna De Luca
Le parole dei contratti. Quarant’anni di contrattazione in Enel: un’analisi sulle “premesse” e i “protocolli”

Annette Gerstenberg
Analyse sociolinguistique d’un corpus oral par regroupement hiérarchique

Eleonora Mussino, Laura Bernardi
Parlando di figli: analisi testuale delle aspettative di fecondità….

Amélie Ngatsi-Imafouo
Analyse exploratoire d’un corpus d’apprentissage collaboratif : détection de reformulations multimodales lors des échanges enseignant-étudiant

Julie Séguéla, Gilber Saporta, Stéphane Le Viet
e-Recrutement : recherche de mots-clés pertinents dans le titre des annonces d’emploi

Gian Piero Turchi, Elena Celleghin, Martina Sarasin, Eleonora Pinto
Rappresentazione della realtà “sport” e della realtà “doping” attraverso un’analisi comparativa dei processi discorsivi praticati dalla categoria sportiva e dal “senso comune”

Gian Piero Turchi, Luisa Orrù, Maria Sperotto, Sara Francato
La valutazione dell’efficacia di un intervento di mediazione attraverso la raccolta delle produzioni discorsive

Part III. APPLICATIONS AND TOOLS Part I Part II

Software Applications and Tools

Fernande Dupuis, Robert Kapitan, François Daoust
Expérience d’entrainement de TreeTagger et d’intégration à l’interface Web de SATO

Serge Heiden, Jean-Philippe Magué, Bénédicte Pincemin
TXM : Une plateforme logicielle open-source pour la textométrie – conception et développement

Nouha Chaâben Kammoun, Lamia Hadrich Belguith, Abdelmajid Ben Hamadou
The MORPH2 new version: A robust morphological analyzer for Arabic texts

Marie-Hélène Lay, Bénédicte Pincemin
Pour une exploration humaniste des textes : AnaLog

Jean-Marc Leblanc
Nouvelles fonctionnalités pour la visualisation des données textuelles et de résultats : Pour une approche plus ergonomique des dispositifs lexicométriques

Stefania Macchia, Manuela Murgia, Paola Vicari
Integration between automatic coding and statistical analysis of textual data systems

William Martinez, François Daoust, Jules Duchastel
Un service Web pour l’analyse de la cooccurrence

Mahsa Mohaghegh, Abdolhossein Sarrafzadeh
Performance evaluation of various training data in English-Persian Statistical Machine Translation

Mohammad Taher Pilevar, Heshaam Faili
PersianSMT: A first attempt to English-Persian statistical machine translation

Juan-Manuel Torres-Moreno, Javier Ramirez Rodriguez
REG : Un algorithme glouton appliqué au résumé automatique de texte. Une approche exploratoire

Aris Xanthos, François Bavaud
Unsupervised learning of word separators with MDL

Xing Zhang, Alex Chengyu Fang
An ATE system based on probabilistic relations between terms and syntactic function

Text Corpora Encoding

François Daoust, Yves Marcoux, Jean-Marie Viprey
L’annotation structurelle

Anne Dister, Gérald Purnelle, Richard Beaufort
Grands ou petits attentats ? Mesure de l’impact des réformes orthographiques sur la physionomie des textes

Annibale Elia, Fabiola Bocchino, Alberto Maria Langella, Mario Monteleone, Daniela Vellutino
Grammatiche locali per il riconoscimento automatico e la classificazione delle FAQ sull’Informazione Comunitaria Europea

Iris Eskhol, Isabelle Tellier, Samer Taalab, Sylvie Billot
Etiqueter un corpus oral par apprentissage automatique à l’aide de connaissances linguistiques

Annamaria Landolfi, Carmela Sammarco, Miriam Voghera
Verbless clauses in Italian, Spanish and English: a Treebank annotation

Dominique Longrée, Sylvie Mellet, Céline Poudat
Les taggers, auxiliaires heuristiques en ADT ?

Maria Parascandolo, Francesco Cutugno
A protocol to unify annotative standards on Italian treebanks

Monolingual and Multilingual Lexical Resources

Steffen Eger, Ineta Sejane
Computing semantic similarity from bilingual dictionaries

Annibale Elia, Federica Marano, Mario Monteleone, Simona Sabatino, Daniela Vellutino
Strutture lessicali delle informazioni comunitarie all’interno di domini specialistici

Fabrice Issac
Outils et méthode de constitution de dictionnaire de formes figées

Mathieu Lafourcade, Alain Joubert
Construction de l’arbre des usages nommés d’un terme dans un réseau lexical évolutif

Gaël Lejeune, Nadine Lucas, Antoine Doucet
Tentative d’approche multilingue en extraction d’information

Ryo Nagata, Junichi Kakegawa, Takafumi Kutsuwa
Detecting missing sentence boundaries in learner English

Sophie Piron, Nadine Vincent
Un demi-siècle d’évolution des classements verbaux dans le Petit Larousse illustré

Gudrun Rawoens
Multilingual corpora in cross-linguistic research. Focus on the compilation of a Dutch-Swedish parallel corpus

Liliane Rodriguez
Le rôle du marquage lexicométrique des anglicismes dans un corpus franco-canadien

Fatiha Sadat
Using co-occurrence tendencies to improve Cross-Language Information Retrieval

Stefania Spina
AIWL: una lista di frequenza dell’italiano accademico

Authors index

__________

Committees Credits Authors Contents