Accueil > Postes disponibles > Stages

Stages en cours

par Clément Plancq - publié le , mis à jour le

Stages 2019

Générateur d’exercices à trous pour apprenants en langue

  • Descriptif
    Le ou la stagiaire participera au développement d’un outil en ligne destiné aux professeurs et aux apprenants en langue (français et espagnol). L’outil permettra aux enseignants de générer un exercice à trous à partir d’un texte de leur choix. Le scénario d’utilisation est le suivant :
    - L’enseignant ajoute un texte à partir d’un document ou d’une URL,
    - L’enseignant choisit de supprimer des mots du texte en fonction de leurs catégories morpho-syntaxiques (préposition, adjectif, …) ou de remplacer les formes verbales fléchies par leur forme infinitive,
    - L’outil génère alors un exercice en ligne accessible aux étudiants qui devront compléter les trous et pourront vérifier si leurs soumissions sont conformes ou non à l’original.
  • Stagiaire
    Robert Hall, Master 1 TAL, Paris 3
  • Encadrants
    Frédérique Mélanie, Clément Plancq, Laure Sarda

Réalisation d’un outil d’apprentissage des constructions verbales pour les apprenants du français

  • Descriptif

L’objectif de ce stage est de proposer une interface, destinée aux apprenants du français, sur une question réputée difficile : le choix de la ‘bonne’ préposition dans les constructions verbales. Cette aide à l’apprentissage des constructions [verbe + préposition] associera des données de corpus et des informations grammaticales.

Le travail réalisé pendant le stage aura deux volets :

1- Travail sur corpus

Les travaux sur corpus annotés permettront de :
- relever des attestations de construction verbe + préposition,
- distinguer les prépositions non régies par le verbe de celles qui sont régies,
- révéler des motifs de surface afin de classer les attestations
- identifier l’existence de clusters sémantiques (i.e. traitement paradigmatique des Noms pour aider à classer le sens des motifs identifiés).

2- Développement de l’interface web
Le ou la stagiaire participera à l’élaboration et au développement du site web à destination des étudiants de français.
L’interface devra fournir à l’étudiant, pour un verbe donné (ex. penser), un accès aux prépositions en usage (ex. à/ de) ainsi qu’aux attestations réparties selon les patrons identifiés dans les corpus (ex. vous pensez à une approche probabiliste, que pensez-vous de l’approche probabiliste ?). Les exemples seront assortis de commentaires grammaticaux.

  • Stagiaire
    Clémence Laurent, Master 1 TAL, Paris 3
  • Encadrants
    Frédérique Mélanie, Clément Plancq, Laure Sarda

Génération de poésie à partir d’une base de poèmes classiques

  • Descriptif

Le projet vise à mettre en ligne un programme de génération de poésie à partir des poème existants, en s’inspirant du livre "100.000 milliards de poèmes" de Queneau (mais, dans notre cas, le projet porte sur la poésie du 19e siècle). Un premier générateur a été mis au point : il est fondé sur un corpus de plus de 800 sonnets : des vers sont tirés au sort au hasard au début, puis de façon à ce qu’ils forment un poème de type classique (c’est-à-dire en respectant les contraintes de rimes notamment).

Le stage vise à reprendre le premier prototype réalisé, à le mettre en ligne en collaboration avec l’équipe chargée de la partie site Web du projet, et à proposer et implémenter diverses extensions sur cette base (générer des poèmes avec des contraintes de contenu, de manière interactive, etc.).

Le stage est organisé dans le cadre du projet Oupoco ("L’Ouvroir de Poésie Combinatoire", http://transfers.ens.fr/l-oupoco-l-ouvroir-de-poesie-combinatoire).

  • Stagiaire
    Mathilde Saurat, M2 Humanité Numérique, Lyon 3
  • Encadrant
    Thierry Poibeau

Modélisation de l’évolution linguistique par des méthodes informatiques appliquées à de grandes bases de données ; application aux langues fenniques.

  • Descriptif

L’objet du stage est de modéliser l’évolution linguistique par des méthodes informatiques appliquées à de grandes bases de données linguistiques. Les modèles seront appliqués aux langues fenniques.

Le stage vise à explorer les techniques de modélisation de l’évolution des langues en tirant parti des grandes bases de données existantes. Il s’agit de voir comment les données permettent de reconstituer les liens entre langues, de manière hiérarchique (modélisation de type ‘arbre généalogique’) et/ou par repérage d’isoglosses n’entrant pas directement dans le cadre d’une représentation arborescente (modélisation par ‘ondes linguistiques’).

  • Stagiaire
    Arthur Lapraye, INaLCO
  • Encadrant
    Thierry Poibeau