Recherche
Thème
Ma passion et ma spécialité depuis mon DEA en 1992 (à Toulouse), c'est
le traitement automatique des langues (TAL). Je suis informaticienne
de formation mais j'ai toujours eu du goût pour les lettres et les
sciences humaines et ce domaine me permet d'associer ces divers
centres d'intérêt.
Depuis mon passage
au GRAppA
de Lille 3, je me suis
spécialisée dans l'apprentissage automatique (que je définirais comme
l'art de transformer automatiquement des données en programme)
appliqué au TAL. J'ai abordé ce thème par plusieurs
versants :
- théorique : inférence grammaticale, étude de
l'apprenabilité de familles de grammaires formelles à
partir de données syntaxico-sémantiques. L'idée que j'ai
particulièrement développée est qu'il est possible d'apprendre
automatiquement une grammaire formelle si on dispose de phrases
produites par cette grammaire accompagnées de leur interprétation
logique obtenue de manière
compositionnelle. Cette condition de compositionnalité
contraint les structures syntaxiques sous-jacentes possibles et permet
donc de reconstituer la grammaire initiale. Ces travaux relèvent du
TAL et de l'apprentissage automatique "symboliques", c'est-à-dire
fondés sur des modèles formels (automates, grammaires, formules
logiques, règles...).
- empirique : utilisation de techniques d'apprentissage automatique
pour la classification de textes, l'annotation de corpus, la recherche
et l'extraction d'informations, la recommandation. Dans ce cas, on
cherche plutôt à enrichir des données textuelles, en général en leur
associant des étiquettes, en s'appuyant dans le cas de l'apprentissage
supervisé sur des exemples de données déjà annotées. Ce domaine
relève, lui, du TAL et de l'apprentissage automatique "statistiques",
c'est-à-dire fondés sur des comptes de grandes quantités de données.
Dans les deux cas, ce qui m'intéresse est le lien syntaxe-sémantique :
peut-on apprendre la syntaxe à partir de données sémantiques ou, au
contraire, induire des informations de nature sémantique à partir de données
"brutes" ? J'ai aussi travaillé sur ces sujets au sein de l'équipe CA
du LIFO,
et je continue à le faire désormais en tant que membre
du LaTTiCe.
Encadrement de thèses
Je contribue actuellement à l'encadrement des thèses suivantes :
- Mathilde Regnault (avec Sophie Prévost et Eric de la Clergerie) sur l'exploitation d'un Treebank et de ressources de l'ancien français pour rendre compte de l'évolution de la langue
- Loïc Grobol (avec Eric de la Clergerie et Marco Dinarelli) : inscrit en sciences du langage à Paris 3 depuis 2016, financcé par le Labex EFL (axe 5), sur la reconnaissance automatique de chaînes de coréférences, par combinaison d'apprentissage automatique et de ressources linguistiques ;
- Marie Marcia : inscrite en sciences du langage à Paris 3 depuis 2016, titulaire d'une allocation de l'école doctorale, sur la modélisation de l'acquisition de la syntaxe de leur langue maternelle par les enfants par un protocole de "jeu de langage" ;
- Tian Tian (avec Marco Dinarelli) : inscrite en sciences du langage à Paris 3 depuis 2013, en contrat Cifre dans la société Synthesio, sur l'adaptation des modèles d'apprentissage automatique pour l'annotation et l'extraction des entités nomméses en changeant de domaine, de style de texte et de langue ;
J'ai contribué à encadrer six thèses
d'informatique ou de sciences du langage soutenues :
- Yohan Dupont : Structuration dans les entités nommées (contrat Cifre dans la société Expert-System, ex-Temis, soutenue en 2017)
- Ilaine Wang : Syntactic Similarity Measures in Annotated Corpora for Language Learning: Application to Corean Grammar (soutenue en 2017)
- Damien
Poirier : Des textes communautaires à la recommandation
(contrat Cifre avec France Telecom, soutenue en 2011)
- Florent
Jousse : Transformations d'arbres XML avec des modèles
probabilistes pour l'annotation (soutenue en 2007).
- Laurent
Candillier : Contextualisation, visualisation et
évaluation en apprentissage non supervisé (contrat
Cifre avec la société Pertinence à Paris,
soutenue en 2006)
- Daniela
Dudau-Sofronie : Apprentissage de Grammaires
Catégorielles pour simuler l'acquisition du langage naturel
à l'aide d'informations sémantiques (soutenue en
2004)
J'ai aussi encadré de nombreux DEA ou M2 recherche (actuellement 3 ou 4 par an).
Projets et collaborations (passés ou présents)
- projet ANR Profiterole, début en 2017
- projet ANR Naija, début en 2017
- projet européen CHIST-ERA ATLANTIS (Artificial Language understanding In Robots) avec SONY
- projet ANR Democrat, sur les chaines de co-référence en discours (début en automne 2015)
- Labex EFL (Empirical Foundation of Linguistics)
- AIM-West : projet franco-brésilien soutenu par le CNRS sur les unités multimots dans la traduction automatique
- ARESOS : projet CNRS du défi Mastodons
- PEPS Humain (2013-2014) : projet franco-japonais "Langage, logique et informatique"
- Orfeo (2012-2016), Outils et Ressources pour le Français
écrit et oral, projet de l'ANR "Corpus et outils de la recherche en
SHS" mené par Jeanne-Marie Debaisieux, auquel je suis
associée
- Nomage
(2008-2011) : projet ANR-07 "jeune chercheur" mené par Rafael
Marín, de Lille3, sur la sémantique des nominalisations
(d'un point de vue surtout linguistique) auquel j'ai participé.
- CRoTAL
(2008-2010) : CRF (Conditional RandOm fields) pour le TAL, projet
ANR-07 MDCO, dont j'étais la responsable
- ARC Inria Mosaique
(2006-2008) : Modèles syntaxiques de haut niveau (invitation
à titre personnel)
- Apprentissage
naturel et artificiel de langages naturels et artificiels
(2005-2007) : projet de la Maison des sciences de l'Homme de Lille3
dont j'étais la responsable
- Mostrare (2004-2008)
: Modeling Tree Structures, Machine Learning, and Information
Extraction, projet Inria-Lille Nord Europe dont j'étais membre quand
j'étais à Lille3
- RIP Web, Recherche d'information précise sur le Web
(2003-2004) : projet CNRS sur les systèmes
question/réponse
- ARC
Inria Gracq (2002-2004) : Acquisition de grammaires catégorielles,
dont j'étais responsable locale à Lille
- Procope : projet de collaboration Lille-Sarrebruck (plusieurs fois
renouvelé dans les années 90) auquel j'ai
participé.
Logiciel
Je propose en téléchargement libre :
- SEM,
un Segmenteur-Etiqueteur Markovien pour le français, appris
automatiquement à partir de données extraites du corpus arboré
(ou French
Treebank) de Paris 7. Il est également utilisable directement en ligne.
Publications
Responsabilité de numéro spécial de revue :
Articles de revue avec comité de lecture :
- Desoyer, Landragin, Tellier, Lefeuvre, Antoine 15 : Les coréférences à l'oral : une expérience d'apprentissage automatique sur le corpus ANCOR, revue TAL 55.2 sur le "Traitement automatique du langage parlé", p. 97-121, 2014 (paru en 2015).
- Eshkol-Taravella, Baude, Maurel, Hriba, Dugua, Tellier 12
: Un grand corpus oral
"disponible" : le corpus d'Orléans 1968-2012, revue TAL
52.3 sur les "Ressources Linguistiques Libres", p. 17-46, 2011 (paru en 2012).
- Poirier, Fessant, Tellier 11
: De la classification
d'opinion à la recommandation : l'apport des textes
communautaires, revue TAL 51.3, sur "Opinions, sentiments et
jugements d'évaluation", p. 19-46, 2010 (paru en 2011).
- Tellier, Eshkol, Taalab, Prost 10
: POS-tagging for Oral
Texts with CRF and Category Decomposition, in Research
in Computing Science, special issue "Natural Language Processing
and its Applications", vol 46, p.79-90, 2010.
- Béchet, Foret, Tellier 07
: Learnability of Pregroup
Grammars, Studia Logica, n°87 p.225-252, 2007.
- Béchet, Bonato, Dikovsky, Foret, Le Nir, Moreau,
Retoré, Tellier 07
: Modèles
algorithmiques de l'acquisition de la syntaxe ; concepts et
méthodes, résultats et problèmes, Revue
Linguistique de Vincennes, numéro spécial "Le
tournant inductif en linguistique", p.123-152, 2007.
- Tellier 06 : Learning Recursive
Automata from Positive Examples, RIA, Revue d'Intelligence
Artificielle, special number "New methods in Machine Learning,
theory and Appplication", vol 20-n°6, p.775-804, 2006.
- Finkel and Tellier 96 : A polynomial algorithm for the membership
problem with categorial grammars, TCS : Theoretical Computer
Science 164:1-2, p.207-221, 1996.
Articles de revue sur invitation :
- Léon, Tellier 14 : Le data turn ; Des premiers traitements statistiques du langage (1950-60) à la fouille de textes, paru dans Information Grammaticale, Peeters Publishers, 2014, pp.30-39.
- Tellier 11
: note de
lecture de l'ouvrage "Semantic Role Labeling", de Palmer M.,
Gildea D. et Xue N., Morgan & Claypool Publishers, 2010,
revue TAL numéro 51-1, p.119-121, 2010 (paru en 2011).
- Tellier 10
: Préface au
numéro 50-3 "Apprentissage automatique pour le TAL",
revue TAL, p.7-21, 2009 (paru en 2010).
- Tellier 96
: Les
sciences cognitives : (se) creuser la tête pour trouver
l'esprit : article d'épistémologie et de
vulgarisation sur les sciences cognitives, revue Terminal,
numéro 70, p. 41-58, Hermès, 1996.
Chapitres de livres :
- Meyer, Poirier, Tellier, Fessant 11 : REPERIO, a Flexible
Architecture for Recommendation in an Industrial Context, in Intelligent
Techniques in Recommandation Systems: Contextual Advancements and New
Methods, IGI Global Snippet 63, 2012.
- Tellier, Tommasi 11 : Champs Markoviens Conditionnels pour
l'extraction d'information, chapitre 6 du livre Modèles
probabilistes pour l'accès à l'information textuelle
édité par E. Gaussier et F. Yvon, p. 223-267, Hermès 2011,
traduction anglaise (Textual Information Access: Statistical Models) parue en 2012 chez Wiley.
- Tellier, Dudau-Sofronie 11 : Good Types are useful for Learning, dans
Grammar and logic : essays in honour of Alain Lecomte, LNCS,
Logic and Information Series, p.118-137, Springer, 2011.
- Tellier (en attente depuis 2002...) : Meaning-based syntax learning, à
paraître peut-être un jour...
- Tellier, Finkel 95 : Cognitive style of decision making
narrations, dans The Cognitive Level, Endres-Niggemeyer (Ed.),
Duisburg LAUD series of Cognitive Linguistics (version étendue de
Tellier & Finkel 95), p41-59.
Conférence/workshops internationaux sur invitation :
- Tellier 12 : A Linguistic Look on Programming Languages, workshop franco-japonais sur langage, logique et informatique, Tokyo, 2012.
- Béchet, Foret, Tellier, 05 : Parsing pregroup grammars
using partial composition, Workshop on Pregroups and Linear Logic,
Chieti (Italie), 2005.
Communications (orale ou par poster) avec actes dans un congrès international :
- Gábor, Zargayouna, Tellier, Buscaldi, Charnois 17 : Exploring Vector Spaces for Semantic Relations, EMNLP 2017, Copenhagen, Denmark.
- Lechevrel, Gábor, Tellier, Charnois, Zargayouna, Buscaldi 17 : Combining Syntactic and Sequential Patterns for Unsupervised Semantic Relation Extraction, DMNLP-PKDD workshop (Interactions between Data Mining and Natural Language Processing), Skopje (Macedonia), short paper, to appear, 2017
- Dupont, Dinarelli, Tellier, Lautier 17 : Structured Named Entity Recognition by Cascading CRFs, Intelligent Text Processing and Computational Linguistics (CICling), to appear in LNCS, Budapest (Hungary), 2017.
- Dupont, Dinarelli, Tellier 17 : Label-Dependencies Aware Recurrent Neural Networks,Intelligent Text Processing and Computational Linguistics (CICling), to appear in LNCS, Budapest (Hubgary), 2017.
- Wang, Kahane, Tellier 16: From built examples to attested examples: a syntax-based query system for non-specialists. In Proceedings of the 30th Pacific Asia Conference on Language Information Computation – PACLIC’16, Seoul (South Korea).
- Gábor, Zargayouna, Buscaldi, Tellier, Charnois 16b : Unsupervised Relation Extraction in Specialized Corpora Using Sequence Mining, Advances in Intelligent Data Analysis XV (IDA 2016), LNCS 9897, p.237-248, Stokholm (Sweden)
- Dinarelli, Tellier 16 : New Recurrent Neural Network Variants for Sequence Labeling, International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2016), to be published in LNCS, Konya (Turkey).
- Desoyer, Landragin, Tellier, Lefeuvre, Antoine, Dinarelli 16 : Coreference Resolution for French Oral Data: Machine Learning Experiments with ANCOR, International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2016), to be published in LNCS, Konya (Turkey).
- Tian, Dinarelli, Tellier, Cardoso 16 : Domain Adaptation for Named Entity Recognition Using CRFs, LREC, Portoroz (Slovenia).
- Gábor, Zargayouna, Buscaldi, Tellier, Charnois 16a : Semantic Annotation of the ACL Anthology Corpus for the Automatic Analysis of Scientific Literature, LREC, Portoroz (Slovenia).
- Gábor, Zargayouna, Tellier, Buscaldi, Charnois 16a : A Typology of Semantic Relations Dedicated to Scientific Literature Analysis, workshop "Semantics, Analitics, Visualisation: Enhancing Scholarly Data" (SAVE-SD 2016), to be published in LNCS, Montreal (Canada).
- Guibon, Tellier, Constant, Prevost, Gerdes 15 : Searchig for Discriminative Metadata on Heterogenous Corpora, 14th Treebank and Language Theory (TLT), Varsovie (Poland), 2015.
- Tian, Dinarelli, Tellier 15 : Lattice: Data Adaptation for Named Entity Recognition on Tweets wit Features-Rich CRF, Shared task on the 2015 Workshop on Noisy User-generated Text: Twitter Lexical Normalization and Named Entity Recognition, ACL Workshop, Beijing (China), 2015.
- Guibon, Tellier, Constant, Prevost, Gerdes 14 : Parsing Poorly Standardized Language Dependency on Old French, 13th Treebank and Language Theory (TLT), Tubingen (Germay), 2014.
- Tellier, Makhlouf, Dupont 14 : Sequential Patterns of POS Labels Help to Characterize Language Acquisition, ECML/PKDD wokshop on Interactions between Data Mining and Natural Language Processing (DMNLP 2014), Nancy.
- Makhlouf, Dupont, Tellier 14 : Caractériser l'acquisition d'une langue avec des patrons d'étiquettes morpho-syntaxiques, Journées d'Analyses de Données Textuelles (JADT 2014), Paris.
- Wang, Kahane, Tellier 14 : Macrosyntactic Segmenter of a spoken French Corpora, LREC 2014, papier court (poster), Reykjavic (Island).
- Tellier, Dupont, Eshkol, Wang 13 : Adapt a Text-Oriented Chunker for Oral Data: How Much Manual Effort is Necessary?, The 14th
International Conference on Intelligent Data Engineering and Automated
Learning (IDEAL'2013), Special Session on Text Data Learning, LNAI, Hefei
(China), 2013.
- Tellier, Dupont 13 : How Symbolic Learning Can Help Statistical Learning (and vice versa), Recent Advances in Natural Language Processing (RANLP 2013), Hissar (Bulgaria).
- Constant, Tellier 12
: Evaluating the
Impact of External Lexical Resources unto a CRF-based Multiword
Segmenter and Part-of-Speech Tagger, LREC, papier court (poster),
Istambul (Turkey), 2012.
- Poirier, Fessant, Tellier 10
: Reducing the Cold-Start Problem in
Content Recommendation Through Opinion Classification, IEEE/WI/ACM
International Conference on Web Intelligence, Toronto (Canada), 2010.
- Eshkol, Tellier, Taalab, Billot 10
: Etiqueter
un corpus oral par apprentissage automatique à l'aide de
connaissances linguistiques, Journées Internationales
d'Analyses Statistiques des Données Textuelles (JADT 2010),
Roma (Italy).
- Poirier, Tellier, Fessant, Schluth 10
: Towards Text-Based
recommendations, 9th international conference on Adaptivity,
Personalization and Fusion of Heterogeneous Information (RIAO 2010),
Paris, 2010.
- Moreau, Tellier 09 : The Crotal
SRL System : a Generic Tool based on Tree-structured CRF,
Computational Natural Language Learning (CoNLL 2009), shared task,
p.91-96, Boulder (USA).
- Tellier 08 : How to Split Recursive
Automata, 9th International Colloquium on Grammatical Inference
(ICGI 2008), St Malo, LNAI 5278,
p.200-212, vidéo
de l'exposé.
- Tellier 07 : Grammatical inference
by specialization as a state splitting strategy, 16th Amsterdam
Colloquium 2007, p.223-228.
- Gilleron, Jousse, Tellier, Tommasi 06 : XML Document
Transformation with Conditional Random Fields, 5th International
Workshop of the Initiative for the Evaluation of XML Retrieval (INEX
2006), Dagstuhl (Germany), in "Comparative Evaluation of XML
Information Retrieval Systems", LNCS 4518, p.525-539.
- Gilleron, Jousse, Tellier, Tommasi 06
: Conditional Random Fields for
XML Trees 17th European Conference on Machine Learning and
Principles ans Practice of Knowledge Discovery (ECML/PKDD 2006),
Workshop on Mining and Learning in Graphs (MLG 2006), Berlin, 2006,
p.141-148.
- Candillier, Tellier, Torre, Bousquet 06
: Cascade evaluation of clustering
algorithms, 17th European Conference on Machine Learning (ECML
2006), Berlin (Germany), LNCS 4212, p.574-581.
.
- Tellier 06 : Various Types of
Learning with Types, Grammatical Inference Workshop, St Etienne,
p.15-16.
- Tellier 05 : Automata and
AB-Categorial Grammars, 10th International Conference on
Implementation and Application of Automata (CIAA 2005), poster
session, Sophia Antipolis, LNCS 3845, p.353-355.
- Candillier, Tellier, Torre, 05
: Transforming XML trees for efficient
classification and clustering, 4th International Workshop of the
Initiative for the Evaluation of XML Retrieval (INEX 2005), Dagstuhl
(Germany), Document Mining Track, in "Advances in XML Information
Retrieval and Evaluation", LNCS 3977, p.469-480.
- Candillier, Tellier, Torre, Bousquet, 05
: SSC : Cascade evaluation, 19th
Annual Conference on Neural Information Processing Systems (NIPS
2005), Workshop on Theoretical Foundations of Clustering, Vancouver
(Canada).
- Candillier, Tellier, Torre, Bousquet 05
: SSC : Statistical Subspace
Clustering, 4th International Conference on Machine Learning and
Data Mining in Pattern Recognition (MLDM 2005), Leipzig (Allemagne),
LNAI 3587, p.100-109.
- Tellier 05 : When Categorial
Grammars meet Regular Grammatical Inference, conference on
Logical Aspects of Computational Linguistics (LACL 2005), Bordeaux LNAI 3492,
p.301-316.
- Béchet, Foret, Tellier 04
: Learnability of Pregroup Grammars,
7th International Colloquium on Grammatical
Inference (ICGI 2004), Athena (Greece), LNAI 3264, p.65-76.
- Dudau-Sofronie, Tellier 04 : A Study
of Learnability of Lambek Grammars from Typed Examples,
Categorial Grammars Conference, Montpellier, p.133-147.
- Dudau-Sofronie, Tellier, Tommasi 03
: A Learnable Class of CCG from Typed
Examples, 8th conférence Formal Grammars, Vienna, p.77-88.
- Dudau-Sofronie, Tellier, Tommasi 02
: A Tool for Language Learning Based on
Categorial Grammars and Semantic Information, 6th
International Colloquium on Grammatical Inference (ICGI 2002), demo session,
Amsterdam, LNAI 2484, p.303-305.
- Dudau-Sofronie, Tellier, Tommasi 01
: Learning Categorial Grammars from
Semantic Types, 13rd Amsterdam Colloquium (Holland), p.79-84.
- Dudau-Sofronie, Tellier, Tommasi 01 : From
Logic to Grammars via Types,3rd Learning
Language in Logic (LLL 2001) Workshop, Strasbourg, p.35-46.
- Tellier 00 : Semantic-Driven
Emergence of Syntax : the Pinciple of Compositionality
upside-down, International Conference on the Evolution of Language
(Evolang 2000), poster session, Paris, p.220-224.
- Tellier 99 : Towards a Semantic-based
Theory of Language Learning, 12th Amsterdam
Colloquium (Holland), p.217-222.
- Tellier 98 : Meaning
Helps Learning syntax, 4th International
Colloquium on Grammatical Inference (ICGI 1998), Ames (USA), 1998,
LNAI 1433, Springer, p.25-36.
- Tellier 98 : Syntactico-Semantic
Learning of Categorial Grammars, Joint Conferences on New Methods
in Language Processing and Computational Natural Language Learning
(NeMLaP3/CoNLL 1998), Workshop on Paradigms and Grounding in Language
Learning, Adélaïde (Australia), p.311-314.
Communications dans un congrès international sans actes :
- Wang, Kahane, Tellier 16: Syntax-based queries for non-specialists: a new perspective on similarity research, American Association for Corpus Linguistics (AACL) and Technology for Second Language Learning (TSLL) Conference, Iowa State University. Ames, USA.
- Tian, Tellier, Dinarelli 16 : Understanding Social Media Texts with Minimum Human Effort on #Twitter, PLIN Linguistic Day, Louvain-la-Neuve (Belgium).
- Tellier, Eshkol, Taalab, Prost 10 : POS-tagging for Oral Texts
with CRF and Category Decomposition, 11th International Conference on
Intelligent Text porcessing and Computational Linguistics (CICLing
2010), poster session, Iasi (Roumanie).
- Balvet, Evert, Haas, Huyghe, Marín, McNally, Tellier 07 :
NOMAGE: Coding the Semantic Features of French Nominalizations,
Workshop "Nominalizations across languages", Stuttgart University,
2007
- Tellier 02 : Workshop "Gracq", ESSLI, Trento, 2002.
- Tellier, Finkel 95 : From natural language to cognitive style, Fourth
International Colloquium on Cognitive Science (ICCS 1995), Donostia-San
Sebastian (Espagne).
- Finkel, Tellier 94 : An algorithmic overview on categorial grammars, Fifth
Symposium on Logic and Language (LL5), Noszvaj (Hongrie).
Communication avec actes/tutoriel dans un congès national/école sur invitation :
- Tellier 17 : Bien choisir ses données d'apprentissage pour le TAL en contexte multi-hétérogène : exemple de l'ancien français, conférence invitée aux journées Madics (GDR Masse de données), Lyon, 2017.
- Tellier 16 : Du TAL à l'analyse diachronique colloque "De l'archive aux données massives : enjeux et pratiques universitaires en humanités numériques", Sorbonne Paris cité, mars 2016.
- Tellier 15 : Machine Learning for Coreference Resolution, cours sur invitation au Master Erasmus Mundus de Blois.
- Tellier 14 : TAL et extraction d'information, tutoriel invité à l'EARIA (Ecole d'Automne en Recherche d'INformation), près de Grenoble.
- Tellier 98 :
Apprentissage syntaxico-sémantique du langage naturel,
actes des 13ièmes Journées Francophones sur
l'Apprentissage (JFA 1998), Arras, p.13-25.
Communications avec actes dans un congès national :
- Grobol, Tellier, De La Clergerie, Dinarelli, Landragin 17 : Apports des analyses syntaxiques pour la détection automatique de mentions dans un corpus de français oral, Actes de la 24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), papier court (poster), Orléans.
- Dupont, Dinarelli, Tellier 17: Réseaux neuronaux profonds pour l'étiquetage de séquences, Traitement Automatique des Langues Naturelles (TALN 2017), papier court (poster), Orléans.
- Gábor, Tellier, Charnois, Zargayouna, Buscaldi 16 : Détection et classification non supervisées de relations sémantiques dans des articles scientifiques, Traitement Automatique des Langues Naturelles (TALN 2016), Paris.
- Dinarelli, Tellier 16 : Étude des réseaux de neurones récurrents pour étiquetage de séquences, Traitement Automatique des Langues Naturelles (TALN 2016), Paris.
- Dupont, Tellier, Lautier, Dinarelli 16 : Extraction automatique d'affixes pour la reconnaissance d'entités nommées chimiques, Conférence Internationale Francophe sur l'Extraction et Gestion des Connaissances (EGC 2016, poster), Strasbourg.
- Tian, Dinarelli, Tellier, Cardoso 15 : Etiquetage morpho-syntaxique de tweets avec des CRF, Traitement Automatique des Langues Naturelles (TALN 2015, papier court, poster), Caen.
- Guibon, Tellier, Prévost, Constant, Gerdes 15 : Analyse syntaxique de l'ancien français : quelles propriévtévs de la langue influent le plus sur la qualitév de l'apprentissage ?, Traitement Automatique des Langues Naturelles (TALN 2015), Caen.
- Dupont, Tellier 14 : Un reconnaisseur d'entités nommées du Français, Traitement Automatique des Langues Naturelles (TALN 2014), session démo, Marseille.
- Tellier, Eshkol, Dupont, Wang 14 : Peut-on bien chunker avec de mauvaises étiquettes POS, Traitement Automatique des Langues Naturelles (TALN 2014), Marseille.
- Marty, Tian, Tellier 14 : Extraction de propriétés de produits, Conférence en Recherche d'Information et Applications (CoRIA 2014), Nancy.
- Constant, Tellier 13: Intégrer des ressources lexicales et grammaticales externes dans des analyseurs partiels probabilistes, atelier "mixeur" (Modèles mixtes pour l'analyse syntaxique et sémantique du français), Traitement Automatique des Langues Naturelles (TALN 2013), les Sables-d'Olonne.
- Tellier, Dupont 13 : Apprentissage
symbolique et statistique pour le chunkig : comparaison et
combinaisons, Traitement Automatique des Langues Naturelles (TALN
2013), les Sables-d'Olonne.
- Tellier, Dupont, Courmet 12
: Un segmenteur-étiqueteur et un
chunker pour le français, Traitement Automatique des Langues
Naturelles (TALN 2012), session démo, Grenoble.
- Tellier, Duchier, Eshkol, Courmet, Martinet 12
: Apprentissage automatique d'un
chunker pour le français, Traitement Automatique des Langues
Naturelles, (TALN 2012, papier court, poster), Grenoble.
- Constant, Tellier, Duchier, Dupont, Sigogne, Billot 11
: Intégrer des connaissances
linguistiques dans un CRF : application à l'apprentissage d'un
segmenteur-étiqueteur du français, Traitement Automatique des
Langues Naturelles (TALN 2011), Montpellier.
- Moreau, Tellier, Balvet, Laurence, Rozenknop, Poibeau 09
: Annotation
fonctionnelle de corpus arborés avec des Champs Aléatoires
Conditionnels, Traitement Automatique des Langues Naturelles (TALN
2009), Senlis (actes électroniques).
- Candillier, Tellier, Torre, Bousquet 06
: SuSE: Subspace Selection embedded
in an EM algorithm, 8ème Conférence francophone sur
l'Apprentissage automatique (CAP 2006), Trégastel, p.331-345.
- Candillier, Tellier, Torre, Bousquet 06
: Evaluation en cascade d'algorithmes
de clustering, 8ème Conférence francophone sur
l'Apprentissage automatique (CAP 2006), Trégastel, p.109-124.
- Jousse, Gilleron, Tellier, Tommasi 06
: Champs conditionnels
aléatoires pour l'annotation d'arbres, 8ème
Conférence francophone sur l'Apprentissage automatique
(CAP 2006), Trégastel, p.171-186.
- Tellier 05 : Inférence
grammaticale et grammaires catégorielles : vers la Grande
Unification !, 7ème Conférence sur l'Apprentissage
(CAP 2005), Nice, Presses Universitaires de Grenoble, p.63-78.
- Candillier, Tellier, Torre, Bousquet 05
: Statistical Subsspace Clustering,
conférence Extraction et Gestion des Connaissances (EGC 2005),
Paris, Cépaduès éditions, p.177-182.
- Jousse, Tellier, Tommasi, Marty 05 : Learning
to Extract Answers in Question Answering: Experimental Studies,
2ème Conférence en Recherche d'Information et Applications
(CoRIA 2005), Grenoble, p85-99.
- Candillier, Tellier, Torre 04 :
Tuareg: classification non supervisée contextualisée,
6ème Conférence sur l'APprentissage (CAP 2004),
Montpellier, Presses Universitaires de Grenoble, p.159-174.
- Dudau-Sofronie, Tellier 04 : Un
modèle d'acquisition de la syntaxe à partir
d'informations sémantiques, Traitement Automatique du
Langage Naturel (TALN 2004), Fes (Maroc), p.137-146.
- Dudau-Sofronie, Tellier, Tommasi 03
: Une classe de grammaires
catégorielles apprenable à partir d'exemples
typés, actes de la 5ème conférence sur
l'APprentissage (CAP 2003), Laval, Presses Universitaires de Grenoble,
p.169-184.
- Tellier 99 : Rôle
de la Compositionnalité dans l'acquisition d'une langue,
1ère Conférence sur l'APprentissage (CAP 1999,
successeur des JFA), Palaiseau, p107-114.
- Tellier 96 : Un
modèle pour l'analyse de l'énonciation,
deuxième colloque des jeunes chercheurs en Sciences
Cognitives (RJCSC 1996), Presqu'île de Giens, juin 96, p.210-221.
- Rozier, Tellier 92 : Système de Lambek étendu pour
la traduction logique de phrases en langage naturel, première
rencontre nationale des jeunes chercheurs en Intelligence Artificielle (RJCIA 1992),
Rennes, septembre 92, p.308-324.
Workshops nationaux
- Wang, Kahane, Tellier 16 : De l'exemple construit à l'exemple attesté : un système de requêtes syntaxiques pour non-spécialistes, atelier Enseignement des Langues et TAL (ELTAL), atelier TALN 2016, Paris.
- Tellier 14 : Apprentissage automatique symbolique pour le TAL : intérêts et limites, journée ATALA-AFIA, mars 2014, Paris.
- Machen, Tellier 11 : Reconnaissance des Entités Nommées par apprentissage automatique avec un coprus d'apprentissge bruité, journée ATALA "reconnaissance des entités nommées" (poster), 2011.
- Eshkol, Maurel, Tellier, Friburger, Taalab 11 : Annoter ESLO1 par des
cascades de transducteurs et par apprentissage automatique, journée
ATALA "annoter les corpus oraux", 2011.
- Tellier, Eshkol, Taalab, Billot 10
: Morpho-syntactic labelling of an
oral corpus by decomposing labels, journées ATALA "CRF pour le
TAL", 2010.
- Tellier, Eshkol, Taalab 10 : Annotation morpho-syntaxique d'un
corpus oral par enchainements de CRF, journée PPF "Fouille de
Données en région Centre", 2009.
- Tellier 08 : Inroduction à l'inférence grammaticale,
Journées Informatique de la région Centre (JIRC 2008).
- Candillier, Tellier, Torre, Bousquet 06
: Evaluation en cascade d'algorithmes
de clustering, 2èmes Rencontres Inter-Associations (RIAs 2006) sur
la classification et ses applications, 2006.
- Candillier, Tellier, Torre, Bousquet 06
: SuSE: Subspace Selection embedded
in an EM algorithm, 2èmes Rencontres Inter-Associations (RIAs
2006) sur la classification et ses applications, 2006.
Rapports de recherche :
- Gilleron, Jousse, Tommasi, Tellier 08
: Conditional
Random Fields for XML Applications, rapport de recherche Inria 6738.
- Candillier, Tellier, Torre, Bousquet 05 : SSC
: Statistical Subspace Clustering, GRAppA Report 0105.
- Tellier 99 : Learning
to Understand, rapport de recherche IT-320 du LIFL.
- Tellier 97 : A Framework for the Syntactico-Semantic Learning of
Natural Language, rapport de recherche IT-305 du LIFL, juin 1997
(première version des autres Tellier 98).
- Finkel, Tellier 96 : Cognitive automata, rapport
interne 96-2 du LIFAC.
- Tellier 93 : How to reconcile Lambek, Montague and discourses, rapport 93-4
du LIFAC.
Mémoires, thèse, HDR
- Tellier 05 : Modéliser l'acquisition de la
syntaxe du langage via l'hypothèse de la primauté du sens, HDR
d'informatique de l'université Charles de Gaulle-Lille3
- Tellier 96 : Définition et implémentation par les grammaires
catégorielles d'un modèle cognitif formel de l'énonciation, thèse
d'informatique de l'ENS de Cachan, mention très honorable avec les
félicitations du jury.
- Tellier 92 : Modélisation du discours, mémoire de diplôme
d'ingénieur en informatique, ENSEEIHT, Toulouse.
- Tellier 92 : Système de Lambek étendu pour la traduction logique
de phrases en langage naturel, mémoire de DEA "Représentation des
connaissances et Formalisation du raisonnement", Toulouse, IRIT.
Travaux de linguistique déconnante pour la revue Speculative Grammarian :
Autres (pédagogie, vulgarisation) :
- Tellier 17 : L'humain, le réplicant, les machines et les souvenirs dans les deux Blade Runner, Interstices, revue de vulgarisation en ligne d'INRIA.
- Tellier 15 : Enseigner l'informatique à des linguistes (filières TAL), 1024, bulletin de la SIF (Société Informatique de France), suite à une journée détude sur l'enseignement de l'informatique en sciences humaines et sociales.
- Cassin, Tellier 14 : Je parle donc je suis, le mystère de la diversité des langues, Conférence-débat au CNAM (le 27 mars 2014) et Pourquoi une telle diversité des langues ?, Emission de radio Autour de la question animée par Caroline Lachowsky (diffusée le 27 mars 2014 sur RFI), tous les deux avec Barbara Cassin.
- Tellier 07
: Introduction
au TALN et à l'ingénierie linguistique, polycopié de
cours, 108 pages, disponible en ligne.
- Tellier 00
: Introduction
à l'informatique, polycopié de cours, 80 pages, disponible
en ligne.