Traitements automatiques et applications

L’autre opération de recherche concerne l’application des techniques développées en matière de traitement automatique dans le cadre des Humanités numériques. Il s’agit d’un domaine d’investigation particulièrement prometteur au sein de PSL comme de USPC, et le laboratoire a déjà largement investi ce domaine d’application.

Les enjeux concernent l’extraction d’informations pertinentes pour des besoins à chaque fois particuliers à partir de grands corpus, la mise en relation des données extraites et l’élaboration d’interfaces de visualisation pertinentes pour les utilisateurs. Face à ces défis, le Lattice développe des outils génériques mais adaptables au contexte, et travaille en collaboration avec des équipes partenaires pour ce qui concerne notamment les besoins en matière de visualisation. Jusqu’ici le laboratoire a surtout travaillé sur des cas liés aux sciences sociales (négociations climatiques, corpus PoliInformatics) et au domaine philosophie (projet Mapping Bentham). Un lien est fait avec l’analyse du lexique et du discours : représentation des normes, des communautés, etc.

En outre, un effort particulier est fait pour proposer des techniques avancées en matière d’analyse (semi-) automatique du discours littéraire, un domaine quelque peu délaissé jusqu’ici au laboratoire. La présence de grands fonds documentaires (Gallica à la BNF, projet Gutenberg, etc.) offre de nouvelles perspectives en matière de traitement, d’analyse et de visualisation. Les recherches portent sur la mise au point d’outils, de techniques et de méthodes pour l’analyse de grandes de masses de textes : analyse de motifs, repérage automatique de tournures de style, analyse contrastive et/ou diachronique de corpus, etc. L’offre de formation dans le domaine a considérablement évolué ces dernières années tant à l’ENS (formation e-philologie, Master Humanités numériques en préparation) qu’à l’Université Sorbonne nouvelle (ouverture prochaine d’une mineure associée aux licences de sciences du langage et de lettres, préparation d’un Master) il s’agit d’une opportunité dont le laboratoire doit se saisir, d’autant que celle-ci entre parfaitement dans ses projets.

Collaborations nationales et internationales, universitaires et industrielles :

Le laboratoire a noué des relations avec plusieurs institutions et laboratoires parmi les plus actifs dans le domaine (le médialab de SciencesPo et l’Institut des Systèmes Complexes de Paris-IdF, le Digital Humanities Centre de University College London, le laboratoire DH de UNED à Madrid, etc.). Un partenariat a aussi été noué avec la Bibliothèque nationale de France (thèse de J.-B. Pautre sur l’amélioration du moteur de recherche de Gallica). Rappelons enfin le lien très direct entre ce thème de recherche et les perspectives en matière de formation, tant à l’École normale supérieure / PSL (tronc commun de première année, création d’un Master) qu’à l’Université Sorbonne nouvelle / USPC. (mise en place d’une mineure HN).