X1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X17
 
text

Péristyle

  • I
    Année d'intégration au réseau DIM STCN : 2021
  • N
    Médias numériques

Le projet

Péristyle vise à concevoir et développer une méthode originale d’analyse du style dans les
médias numériques. Le défi est à la fois de nature instrumentale et conceptuelle. En matière
de développement, nous réaliserons un outil générique de description du style rédactionnel
d’un article que nous mettrons à disposition des communautés de recherche ou de praticiens
intéressées. Nous appliquerons notre analyseur stylométrique (consultable en
ligne:  https://github.com/jphcoi/peristyle ) à un corpus original composé de près de 400
médias francophones collectés en ligne. Nous étudierons ainsi comment la distribution des
styles dans cet espace hétéroclite participe à son organisation.

Nous faisons l’hypothèse que la caractérisation stylistique des articles et des sources de ce
corpus nous permettra de dresser une cartographie unique de la sphère médiatique française
qui permette d’interpréter les différences stylistiques entre quotidiens régionaux et nationaux,
posts de blog et médias pure players, etc. Quels styles s’identifient préférentiellement à des
faits d’actualité relevant d’une rubrique donnée (politique intérieure, analyse financière) ?
Existe-t-il une valence stylistique particulière aux médias orientées politiquement ? Quels
motifs stylistiques se répètent au sein d’un fil d’actualité ?
Une fois ces propriétés calculées sur l’ensemble des articles du corpus, nous avons fait appel à
des outils de réduction de dimensionnalité (PCA sur variables centrées et normalisées) pour
tenter de représenter nos données originales dans un espace réduit. La structure de l’espace
ainsi obtenue est liée à l’interprétation que l’on peut faire de ses axes. Les axes de variance
maximale principaux révèlent ainsi des tensions de natures différentes, parmi lesquelles le
caractère narratif versus factuel des publications (axe 1). On observe également un contraste
fort entre les articles dans lesquels s’expriment des opinions et des articles plus objectifs (axe
2)

La seconde phase du projet Péristyle nous a amené à approfondir notre travail de modélisation
des textes médiatiques publiés en ligne sur des sujets de controverses socio-techniques. Notre
idée a consisté à construire une grammaire de codage des textes qui épouse un modèle
actantiel de l’action publique. Ces recherches ont déjà donné lieu au développements de
différentes "briques" logicielles pour résoudre un certain nombre de problème techniques
( https://github.com/sally14/embeddings ,  https://github.com/sally14/html-cleaner ), et
permettront à terme de construire un analyseur de texte actantiel. Ce niveau d’analyse, plus
narratif que stylistique à proprement parler, nous semble essentiel pour comprendre la
structure de la production médiatique en ligne.
Participants du projet: Oubine Perrin (stagiaire UTC), Salomé Do (doctorante), Guillaume
Plique (IR), Andreï Mogoutov (post-doc)

Les membres

Porteurs de projets
Oubine Perrin
text
Tous droits réservés © DIM_STCN 2022
Conception graphique & développement : Julienne Richard & Simon Bouchard