Accueil du site > Membres > Direction > Thierry Poibeau
Directeur de recherche au CNRS ; Directeur du laboratoire
Je suis Directeur de Recherche au CNRS, affecté au laboratoire LaTTiCe depuis début 2010. Je suis aussi un Affiliated Lecturer au Research Centre for English and Applied Linguistics (RCEAL) de l’Université de Cambridge. En 2008-2009, j’ai fait un séjour à Cambridge en tant que Visiting Research Fellow à Corpus Christi College.
De 2003 à 2009, j’ai travaillé au Laboratoire d’Informatique de Paris-Nord. En 2002-2003, j’étais professeur Associé (PAST) au Centre de Recherche en Ingénierie Multilingue (CRIM) de l’Institut National des Langues et Civilisations Orientales (INaLCO) et j’ai jadis été chercheur chez Thales Recherche et Technologie (1998−2002).
Je travaille principalement dans le domaine duTraitement Automatique des Langues (TAL), plus précisément au niveau sémantique. Mes recherches portent sur des questions de linguistique générale (analyse de la métonymie, de structures prédicatives, analyse rhétorique de textes scientifiques) et visent la réalisations de systèmes opérationnels (reconnaissance d’entités nommées, systèmes d’extraction d’information, de question-réponse, de résumé automatique, d’analyse d’opinion). Ces systèmes demandent des bases de connaissances importantes qui sont difficiles et coûteuses à constituer manuellement. Les méthodes fondées sur l’analyse de gros corpus permettent de recueillir des informations pertinentes de façon semi-automatique.
Mes autres centres d’intérêt concernent l’acquisition du langage, les sciences cognitives, l’épistémologie et l’histoire de la linguistique.
Vous pouvez trouver plus d’informations me concernant sur mon site personnel
Principales publications réentes
2011
Yufan Guo, Anna Korhonen and Thierry Poibeau (2011). "A Weakly-supervised Approach to Argumentative Zoning of Scientific Documents". Proceedings of Empirical Methods in Narural Language Processing (EMNLP). Edinburgh.
Tim van de Cruys, Thierry Poibeau and Anna Korhonen (2011). "Latent Vector Weighting for Word Meaning in Context ". Proceedings of Empirical Methods in Narural Language Processing (EMNLP). Edinburgh.
Thierry Poibeau (2011). Traitement automatique du contenu textuel. Lavoisier, Paris, ISBN 978−2−7462−3191−7. 230 pages.

Michel Généreux, Thierry Poibeau and Moshe Koppel (2011). "Sentiment analysis using automatically labelled financial news". In Affective Computing and Sentiment Analysis : Metaphor, Ontology, Affect and Terminology (Khurshid Ahmad, ed.). Springer., Series : Text, Speech and Language Technology, Vol. 45. ISBN 978−94−007−1756−5. pp. 111-126.
Mani Ezzat and Thierry Poibeau (2011). "A New framework for Annotating Semantic Relations in Corpora". Proceedings of Recent Advances in Natural Language Processing (RANLP). Hissar (Bulgaria).
Thierry Poibeau (2011). "Controversies and Misunderstandings about Meaning On the reception of Odgen and Richards’ book, The Meaning of Meaning". Nodus Publikationen, to be published (extended version of my ICHoLS XI publication).
2010
Barry Devereux, Nicholas Pilkington, Thierry Poibeau and Anna Korhonen (2010). "Towards unrestricted, large-scale acquisition of feature-based conceptual representations from corpus data". Research on Language and Computation 7(2-4). pp. 137-170.
Cédric Messiant, Kata Gábor, et Thierry Poibeau (2010). « Acquisition de connaissances lexicales à partir de corpus : la sous-catégorisation verbale en français ». Traitement Automatique des Langues, 51/1, 2010.
Cédric Messiant et Thierry Poibeau (2010). "Automatic Lexical Acquisition from Corpora, some Limitations and some Tentative Solutions". Cahiers du Cental (special issue on eLexicography in the 21st Century : New Challenges, New Applications), Presses Universitaires de Louvain, 2010.
Lin Sun, Thierry Poibeau, Anna Korhonen and Cedric Messiant (2010). "Investigating the cross-linguistic potential of VerbNet-style classification". Proceedings of COLING. Beijing, China.
Barry Devereux, Nicholas Pilkington, Thierry Poibeau and Anna Korhonen (2010). "Large-Scale Acquisition of Feature-Based Conceptual Representations from Textual Corpora". Proceedings of the Annual Meeting of the Cognitive Science Society, Portland.
Barry Devereux, Nicholas Pilkington, Thierry Poibeau and Anna Korhonen (2010). "The Acquisition of Unconstrained Feature-Based Conceptual Representations from Corpora". Proceedings of the Workshop on Concepts, Actions, and Objects : Functional and Neural Perspective, Rovereto, Italie.
2009
Thierry Poibeau et Dominique Dutoit (2009). “Automatic extraction of paraphrastic phrases from small size corpora”. In Linguisticae Investigationes. John Benjamins. Amsterdam. Vol. 32 n°1. ISSN 0378-4169. pp. 77 – 98 (hal-00436303).
Thierry Poibeau (2009). “Boosting the Robustness of a Named Entity Recognizer”. International Journal of Semantic Computing. World Scientific. Vol. 3, n°1. ISSN : 1793-351X. pp. 91 – 104 (hal-00436301).
Adeline Nazarenko, Thierry Poibeau et Laurent Audibert (2009). Actes de la conférence Traitement Automatique des Langues Naturelles. Association pour le Traitement Automatique des Langues (ATALA). Senlis, France. 550 pages (hal-00436263).
Afra Alishahi, Thierry Poibeau et Aline Villavicencio (2009). Proceedings of the second Cognitive Aspects of Computational Language Learning Workshop. Association for Computational Linguistics. Athènes, Grèce. 90 pages (hal-00437371).
Aurélien Bossard et Thierry Poibeau (2009) “Integrating Document Structure into a Multi-Document Summarizer”. Proceedings of Recent Advances in Natural Language Processing (RANLP 2009). Borovets. Poster (hal-00437982).
Aurélien Bossard, Michel Généreux et Thierry Poibeau (2009) “CBSEAS, a Summarization System - Integration of Opinion Mining Techniques to Summarize Blogs”. Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2009), Demonstrations Session, Grèce (hal-00397036).
Amanda Bouffier et Thierry Poibeau (2009). “Analyzing the Scope of Conditions in Texts : A Discourse-Based Approach”. Proceedings of the 11th Conference of the Pacific Association for Computational Linguistics (PACLING 2009), Sapporo (hal-00436258).
Erwan Moreau, Isabelle Tellier, Antonio Balvet, Grégoire Laurence, Antoine Rozenknop et Thierry Poibeau (2009). « Annotation fonctionnelle de corpus arboré avec des Champs Aléatoires Conditionnels ». Actes de la conférence Traitement Automatique des Langues Naturelles (TALN 2009), Senlis, France (hal-00436330).
Cours en 2010--2011
Introduction to Computational Corpus Linguistics, MA in Applied Lingusitics, Université de Cambridge, automne 2010
Représentation des connaissances, M2 INaLCO (Institut National de Langues et Civilisation Orientales), Printemps 2011
Projets en cours
Projet européen FP7 STREP PANACEA (en collaboration avec l’Université de Cambridge)
Projet BlogSem (appel à idées 2010 du Réseau National des Systèmes Complexes) : analyse des dynamiques thématiques au sein des communautés en ligne
Doctorants
en cours
Zorana Ratkovic (2010- ; financement : Allocation INRA) : méthodes interactives d’acquisition de connaissances à partir de textes
Pierre Marchal (2010- ; financement : Contrat doctoral INaLCO) : acquisition lexicale à partir de corpus bilingue (français/anglais-japonais)
Mani Ezzat (2009- ; financement : Cifre chez Arisem) : acquisition automatique de grammaires de relations entre entités nommées
Yufan Guo (2009- ; financement sur projet — co-tutelle avec l’Université de Cambridge) : segmentation et analyse automatique du discours scientifique
thèses soutenues
Cédric Messiant (2006−2010 ; financement : allocataire DGA) : acquisition automatique d’informations lexicales à partir de textes
Aurélien Bossard (2006−2010 ; financement : allocataire MESR) : résumé automatique multi-documents (aujourd’hui en post-doc chez Orange Labs)
Amanda Bouffier (2004−−2008 ; allocataire MESR) : analyse discursive automatique de texte médicaux (aujourd’hui ingénieure de recherche chez Temis)