Histoire & mesure, n° 18-3-4. Mesurer le texte

Les historiens ont de tous temps utilisé les textes. Mais leur approche du texte a longtemps
été purement empirique. Les développements de la linguistique structurale les ont incités
à franchir le pas dans les années soixante, à se lancer dans la création de corpus et dans
leur exploitation systématique. C'était aussi le moment où se mettait en place le Trésor de
la Langue Française , où Pierre Guiraud, Charles Muller et Étienne Brunet faisaient décoller
la statistique lexicale. En 1973, Régine Robin pouvait dresser un premier bilan encourageant
de ce démarrage dans son Histoire et linguistique. Les méthodes de lexicologie
quantitative appliquées à des corpus de textes politiques (Révolution française,
Constitution américaine, Congrès de Tours, etc.) ont livré une belle moisson de résultats,
Pierre Lafon, André Salem et bien d'autres ont continué à développer l'arsenal méthodologique,
les politologues se sont à leur tour lancés dans la carrière, les traitements sont
devenus plus faciles, grâce aux logiciels récents et aux progrès de l'informatique.
Et pourtant les historiens semblent avoir de moins en moins recours à la statistique lexicale.
Ce numéro a donc pour objet de leur rappeler les méthodes existantes, de faire le
point sur leur utilisation, et de leur proposer à la fois quelques exemples de traitements et
quelques outils de travail. Les méthodes factorielles sont largement représentées, mais
l'utilisation des spécificités et l'analyse arborée ont aussi leur place. Les corpus utilisés
sont variés, des polyptiques carolingiens aux discours de Jacques Chirac. Dans tous les
cas, les phases de préparation et de mise en forme des corpus (degrés de lemmatisation
etc.) sont évoqués, et les outils informatiques précisément situés afin qu'il soit possible de
suivre pas à pas la démarche des auteurs. C'est que dans le domaine du texte comme dans
tous les autres, la mesure est une qualité indispensable dimension nécessaire à toute bonne
recherche historique : aussi ce numéro a-t-il pour seule ambition de susciter la curiosité
et, pourquoi pas, l'émulation ...