Experience
– Since 2017: Associate Professor in Computer Science (Sorbonne University), STIH group
– 2016-2017: Post-doctoral Fellow (LIPN, Sorbonne Paris Nord), “Neologism Detection”
– 2015-2016: Post-doctoral Fellow (GREYC, Normandy University), “Event prediction for dialogue modelling”
– 2014-2015: Assistant Professor in Computer Science (University of Nantes)
– 2013-2014: Assistant Professor in Computer Science (Normandy University)
– 2010-2013: PhD Student (GREYC, Normandy University) « Multilingual Epidemic Surveillance »
– 2009-2010: Research Engineer (GREYC, Normandy University), “Multilingual Surveillance”
– 2009: Research Engineer (Computer Science Dpt. Helsinki), “PULS Project”
Bibliography
2020
– Dating Ancient texts: an Approach for Noisy French Documents, Anaëlle Baledent, Nicolas Hiebel and Gaël Lejeune, à paraître dans “Language Technologies for Historical and Ancient Langues (LT4HLA), LREC 2020, Marseille
– A Dataset for Multi-lingual Epidemiological Event Extraction, Stephen Mutuvi, Antoine Doucet, Gaël Lejeune and Moses Odeo, LREC 2020 (Marseille)
– Automatic Stylistic Analysis: a search for efficient and interpretable descriptors to characterize individual writing style, Anaëlle Baledent et Gaël Lejeune, à paraître dans les actes de Phraseorom 2019
– Caractérisation de Marqueurs de Relation par Classification non Supervisée, Luce Lefeuvre et Gaël Lejeune, à paraître dans les actes de Lexique Terminologie et Traduction
2019
– Digital ou Numérique : un phénomène d’emprunt au cœur de la start-up nation ?, Lichao Zhu et Gaël Lejeune, Poster aux Journées de Linguistique de Corpus, Grenoble
– [email protected] Shared Task : TOC Extraction and Title Detection Emmanuel Giguet et Gaël Lejeune, Proceedings of the FNP Workshop @NODALIDA2019,pp 63-68
– MICHAEL: Mining Character-level Patterns for Arabic Dialect Identification (MADAR Challenge) Dhaou Ghoul et Gaël Lejeune, Arabic NLP workshop @ACL2019
– Indexation et appariements de documents cliniques pour le Deft 2019 Davide Buscaldi, Dhaou Ghoul, Joseph Le Roux et Gaël Lejeune, DEFT 2019, Workshop de TALN/PFIA 2019, pp 49-56
– Evaluating Lightweight text classification and Information Extraction for Arabic texts” Dhaou Ghoul, Lichao Zhu et Gaël Lejeune, Cicling 2019, La Rochelle
– Analyse automatique de documents anciens : tirer parti d’un corpus incomplet, hétérogène et bruité Karine Abiven et Gaël Lejeune, RIDoWS (Recherche d’Information, Document, Web sémantique)
2018
– Analyse Diachronique de Corpus: le cas du poker Gaël Lejeune et Lichao Zhu, Journées d’Analyse statistique des Données Textuelles (JADT 2018), Rome, pages 444-451
Modèles en Caractères pour la Détection de Polarité dans les Tweets Davide Buscaldi, Joseph Le Roux et Gaël Lejeune, DEfi Fouille de Textes, TALN 2018 Rennes
– A new proposal for evaluating Web page Cleaning Tools Gaël Lejeune et Lichao Zhu, 19th International Conference on Computational Linguistics and Intelligent Text Processing (Cicling) 2018, Hanoï
2017
– Character Based Pattern Mining for Neology Detection Gaël Lejeune et Emmanuel Cartier, Subword and Character Level Models in NLP (SCLeM) , EMNLP 2017 Copenhague
– Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du DEFT 2017 Davide Buscaldi, Aude Grezka et Gaël Lejeune,DEfi Fouille de Textes, TALN 2017 Orléans p.65-76
– A System for Multilingual Online Neologism Tracking Emmanuel Cartier, Gaël Lejeune, Kata Kabor et Thierry Charnois, 18th International Conference on Computational Linguistics and Intelligent Text Processing (Cicling) 2017, Budapest
2016
– Highlighting Psychological Features for Predicting Child Interventions During Story Telling Gaël Lejeune, François Rioult et Bruno Crémilleux. International Conference on Speech Processing (Interspeech) 2016 p. 2056-2059
– Ambiguity Diagnosis for Terms in Digital Humanities Béatrice Daille, Evelyne Jacquey, Gaël Lejeune, Luis Felipe Melo et Yannick Toussaint. Language and Resources Conference (LREC) 2016
2015
– Multilingual Event Extraction for Early Epidemic Detection Gaël Lejeune, Romain Brixtel, Antoine Doucet et Nadine Lucas. Artificial Intelligence in Medicine p. 131-143
– Vers un diagnostic d’ambiguïté des termes candidats d’un texte Gaël Lejeune et Béatrice Daille. Traitement Automatique des Langues Naturelles (TALN) 2015, p. 446-452
– Évaluation intrinsèque et extrinsèque du nettoyage de pages Web Gaël Lejeune, Romain Brixtel et Charlotte Lecluze. Traitement Automatique des Langues Naturelles (TALN) 2015, p. 411-417
– Une approche stylométrique pour la fouille d’opinion Gaël Lejeune et Frédéric Dumonceaux, DEfi Fouille de Textes, TALN 2015, p. 12-15
-Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales Romain Brixtel, Charlotte Lecluze et Gaël Lejeune. Traitement Automatique des Langues Naturelles (TALN) 2015, p. 208-219