Laboratoire Lattice - UMR 8094
ENS-CNRS
1 rue Maurice Arnoux, 92120 Montrouge

Tian Tian

Docteure
Lattice

Encadrant⋅e :

Sujet de thèse

Adaptation et combinaison des modèles pour l’annotation de textes multi-source multi-domaine;
Postagging et extraction d’entités nommées de textes avec les CRFs;
Normalisation des textes avec les réseaux de neurones.

Directeur de thèse

Thierry Poibeau

Co-encadrant de thèse

Marco Dinarelli

Publications

Communications avec actes dans un congrès national

Tian, Dinarelli, Cardoso, Tellier: Détection des mots non-standards dans les tweets avec des réseaux de neurones,  Traitement Automatique des Langues Naturelles (TALN 2017, papier court, poster), Orléans.

Tian, Dinarelli, Tellier, Cardoso 2015 : Etiquetage morpho-syntaxique de tweets avec des CRF, Traitement Automatique des Langues Naturelles (TALN 2015, papier court, poster), Caen.

Marty, Tian, Tellier 2014 : Extraction de propriétés de produits, Conférence en Recherche d’Information et Applications (CoRIA 2014), Nancy.

Communications dans un congrès international sans actes

Tian, Tellier, Dinarelli 2016 : Understanding Social Media Texts with Minimum Human Effort on #Twitter, PLIN Linguistic Day, Louvain-la-Neuve (Belgium).

Communications (orale ou par poster) avec actes dans un congrès international

Tian, Dinarelli, Tellier, Cardoso 2016 : Domain Adaptation for Named Entity Recognition Using CRFs, LREC, Portoroz (Slovenia).

Tian, Dinarelli, Tellier 2015 : Lattice: Data Adaptation for Named Entity Recognition on Tweets with Features-Rich CRF, Shared task on the 2015 Workshop on Noisy User-generated Text: Twitter Lexical Normalization and Named Entity Recognition, ACL Workshop, Beijing (China), 2015.

Enseignement

2018-2019: Poste ATER, Université Paris-Sorbonne. Programmation en Java; Langage Python; Certificat informatique et internet

2013- 2014: Chargée de cours, Université Paris Sorbonne Nouvelle. Initiation à la programmation; Langage Python; shell Unix