À propos de moi
J’ai obtenu une licence d’informatique à l’Université d’Orléans en 2010 et un master d’informatique à l’Université d’Orléans en 2012. J’ai ensuite effectué une thèse CIFRE à l’Université Sorbonne Nouvelle Paris 3 financée par Expert System France (ex TEMIS) dirigée par Isabelle Tellier et co-encadrée par Christian Lautier et Marco Dinarelli. Je suis à présent docteur en Sciences du Langage.
Curriculum Vitae: anglais (bientôt) | français
Sujets de recherche
Je m’intéresse principalement aux tâches liées aux entités nommées : reconnaissance, structuration, liage à une base de données et extraction des relations qui les lient. J’utilise pour cela des méthodes par apprentissage, principalement des CRF et des réseaux de neurones.
Mes recherches m’ont mené à m’intéresser de plus en plus à la question de la création de corpus annotés et de leur évaluation, tâches pour lesquelles je m’oriente vers des solutions à base d’apprentissage actif.
Je suis actuellement le développeur de Segmenteur étiqueteur makovien (SEM), un outil d’annotation syntaxique à base d’apprentissage automatique.
Ma thèse
Les informations principales de ma thèse sont disponibles ici. Elle est disponible sur TEL archives.
Projets libres et open source
- Segmenteur étiqueteur makovien (SEM) : segmentation et annotation de textes écrits en français (PoS, chunking, NER).