L’objectif de ce cours est d’initier les étudiants au traitement statistique des données non pas numériques mais textuelles. Ces données sont accessibles de manière massive (plus que les données numériques) ;  Internet accélère le phénomène avec les réseaux sociaux et la numérisation de documents en tout genre.  L’hypothèse est que l’analyse des textes produits par les individus, les organisations ou les États permet d’étudier aussi bien les mouvements sociaux, la diffusion des idées, l'intérêt de certains clients pour un produit ou encore la renommée d’une enseigne ou d’une personnalité politique.

Le traitement statistique des données textuelles a son propre vocabulaire et ses propres méthodes et outils qui seront présentés dans le cours. Dans la partie appliquée, les étudiants seront formés aux outils d’analyse textuelle développés sous R.