X1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X17
 
text

Péristyle

  • I
    Année d'intégration au réseau DIM STCN : 2020
  • R
    Domaines de recherche : Traitement automatique des langues, intelligence artificielle

Le projet

Péristyle vise à concevoir et développer une méthode originale d’analyse du style dans les
médias numériques. Le défi est à la fois de nature instrumentale et conceptuelle. En matière
de développement, nous réaliserons un outil générique de description du style rédactionnel
d’un article que nous mettrons à disposition des communautés de recherche ou de praticiens
intéressées. Nous appliquerons notre analyseur stylométrique (consultable en
ligne :  https://github.com/jphcoi/peristyle) à un corpus original composé de près de 400
médias francophones collectés en ligne. Nous étudierons ainsi comment la distribution des
styles dans cet espace hétéroclite participe à son organisation.

Nous faisons l’hypothèse que la caractérisation stylistique des articles et des sources de ce
corpus nous permettra de dresser une cartographie unique de la sphère médiatique française
qui permette d’interpréter les différences stylistiques entre quotidiens régionaux et nationaux,
posts de blog et médias pure players, etc. Quels styles s’identifient préférentiellement à des
faits d’actualité relevant d’une rubrique donnée (politique intérieure, analyse financière) ?
Existe-t-il une valence stylistique particulière aux médias orientées politiquement ? Quels
motifs stylistiques se répètent au sein d’un fil d’actualité ?

Une fois ces propriétés calculées sur l’ensemble des articles du corpus, nous avons fait appel à
des outils de réduction de dimensionnalité (PCA sur variables centrées et normalisées) pour
tenter de représenter nos données originales dans un espace réduit. La structure de l’espace
ainsi obtenue est liée à l’interprétation que l’on peut faire de ses axes. Les axes de variance
maximale principaux révèlent ainsi des tensions de natures différentes, parmi lesquelles le
caractère narratif versus factuel des publications (axe 1). On observe également un contraste fort entre les articles dans lesquels s’expriment des opinions et des articles plus objectifs (axe 2).

La seconde phase du projet Péristyle nous a amené à approfondir notre travail de modélisation des textes médiatiques publiés en ligne sur des sujets de controverses socio-techniques. Notre idée a consisté à construire une grammaire de codage des textes qui épouse un modèle actantiel de l’action publique. Ces recherches ont déjà donné lieu au développements de différentes “briques” logicielles pour résoudre un certain nombre de problème techniques (https://github.com/sally14/embeddings ;  https://github.com/sally14/html-cleaner), et
permettront à terme de construire un analyseur de texte actantiel. Ce niveau d’analyse, plus
narratif que stylistique à proprement parler, nous semble essentiel pour comprendre la
structure de la production médiatique en ligne.

Les membres

Responsable scientifique
Jean-Philippe Cointet
Sciences Po
Autres membres
Oubine Perrin
Sciences Po
Salomé Do
Sciences Po - LATTICE (ENS)
Guillaume Plique
Sciences Po
Andreï Mogoutov
Sciences Po
text
Tous droits réservés © DIM_STCN 2021
Conception graphique & développement : Julienne Richard & Simon Bouchard