Séminaire ENS 2005-2006

L’histoire et l’historien face au quantitatif (ENS)

Pistes bibliographiques - Histoire des mots, histoire des textes

  • Régine Robin, Histoire et linguistique, Paris, Armand Colin, 1973 [cela reste un très beau manuel avec une vraie réflexion de fond, trop souvent oubliée depuis et toujours d’actualité, et il inclut quelques études de cas ; Régine Robin a l’air d’avoir une personnalité étonnante, cf. son site personnel : http://www.er.uqam.ca/nobel/r24136/index.htm].

  • Jacques Guilhaumou, Denise Maldidier, Antoine Prost, Régine Robin, Langage et idéologies. Le Discours comme objet de l’Histoire, Paris, Éditions ouvrières, 1974 [reprint d’un dossier du Mouvement social, recueil encore très recommandable, en particulier l’introduction et l’article sur les débats sur les corporations en 1776 (analyse d’énoncés) ; contient aussi des textes sur le Père Duchesne et sur les anciens combattants : des études faites avec les moyens du bord mais avec de vraies problématiques…]

  • Antoine Prost, Louis Girard et Rémi Gossez, Vocabulaire des proclamations électorales de 1881, 1885 et 1889, Paris, PUF-Publications de la Sorbonne, 1974 [vraie réflexion sur la source et études fines, dont des analyses factorielles, axées sur la polarisation partisane et l’évolution des discours dans le temps : impressionnant, surtout pour l’époque !].

  • Charles Muller, Principes et méthodes de statistique lexicale, Paris, H. Champion, 1977/1993 [grand classique réédité car « sans successeur »…, clair et effiace sur les définitions de linguistique].

  • Étienne Brunet, Le vocabulaire français de 1789 à nos jours, Genève/Paris, Slatkine/H. Champion, 1981 [3 tomes constitués à partir du TLF. Dans le tome 1, tout sur les fréquences changeantes des lettres de l’alphabet, de la ponctuation, ou encore des suffixes ; dans le tome 2 des tableaux par genre littéraire (vers, dialogue…) et dans le tome 3 des graphes par mot].

  • Ludovic Lebart et André Salem, Analyse statistique des données textuelles : questions ouvertes et lexicométrie, Paris, Dunod, 1988 [axé sur l’analyse de questions ouvertes en sociologie, classique et clair : analyses factorielles, classifications, segments répétés… y sont définis].

  • À noter une longue partie sur l’analyse textuelle dans le manuel en ligne d’Alain Guerreau, Statistiques pour historiens : http://elec.enc.sorbonne.fr/statistiques/stat2004.pdf. Comme toujours, un texte très personnel, parfois polémique, mais aussi très clair dans les définitions et riche en informations sur l’histoire de la méthode.

  • Pierre-Paul Zalio, « Territoires et activités économiques. Une approche par la sociologie des entrepreneurs », Genèses, n° 56, 2004, p. 4-27. [c’est de la sociologie mais l’auteur fait aussi de la sociologie historique… étude avec Alceste d’entretiens biographiques, très riche].

  • Dominique Labbé et Denis Monière, Le discours gouvernemental. Canada, Québec, France (1945-2000), Paris, H. Champion, 2003 [court, avec une vraie problématique, des techniques fines (arbres…) et clairement présentées].

  • Damon Mayaffre, Le poids des mots : le discours de gauche et de droite dans l'entre-deux-guerres : Maurice Thorez, Léon Blum, Pierre-Etienne Flandin et André Tardieu (1928-1939), Paris, H. Champion, 2000 [trop purement descriptif à mon goût] et Damon Mayaffre, Paroles de président : Jacques Chirac, 1995-2003, et le discours présidentiel sous la Ve République, Paris, H. Champion, 2004 [je ne l’ai pas encore lu, mais son article d’Histoire & Mesure 2003 l’annonce plus alléchant].

  • Pour voir beaucoup d’études plutôt littéraires, aller voir sur le rayon de la bibliothèque d’Ulm correspondant à la cote LP fr 321 G/GA 8° la collection « Travaux de linguistique quantitative », puis « Lettres numériques » de l’éditeur H. Champion.

  • La revue Mots s’est créée autour de l’étude du vocabulaire politique, consulter ses sommaires vaut la peine (il y en a un ici sur les discours gouvernementaux : http://www.cavi.univ-paris3.fr/lexicometrica/thema/thema3.htm ; la revue doit bientôt être en ligne ici : http://test.cens.cnrs.fr/revue/mlp/) ; dans les numéros récents, on trouve peu d’études quantifiées (on parle plus en général des médias ou encore de la rhétorique politique) ; il y a toutefois deux études intéressantes sur la question du genre – noms de métiers féminisés, discours de ministres femmes – dans le numéro 78 de juillet 2005.

  • Beaucoup de textes accessibles sur le site des Journées internationales d'analyse statistique des données textuelles (JADT) et de la revue Lexicometrica. On ne peut pas dire que le site est bien indexé, mais il y a des articles sur données historiques par-ci par-là… et c’est du texte intégral gratuit : http://tal.univ-paris3.fr/jadt/

  • Faites votre étude de cas vous-mêmes ! Un site avec tout Balzac (ou presque) numérisé, pour des recherches « classiques » en plein texte (il m’a bien servi pendant ma thèse), mais aussi des graphes de « spécificités », dictionnaires de fréquences etc. : http://lolita.unice.fr/~brunet/BALZAC/balzac.htm

  • XVIII-3/4, 2003, numéro spécial « Mesurer le texte » [à mon goût, plusieurs des articles sont trop descriptifs et manquent de problématiques… un d’eux est à la fois riche techniquement et savoureux politiquement, sur les discours de Chirac et de Jospin ; et l’introduction est bien intéressante ; les autres articles portent sur des discours de présidents mexicains, des poèmes médiévaux anglais, des polyptyques, une autobiographie médiévale et l’histoire de quelques termes dans Frantext]

  • André Salem, « Segments répétés et analyse statistique des données textuelles », I-2, 1986, p. 5-28 [à partir du corpus du Père Duchesne, présentation très claire de cette méthode et bibliographie sur l’étude des discours jacobins].

  • Jacques Guilhaumou, « L’historien du discours et la lexicométrie », I-3/4, 1986, p. 27-46 [encore le Père Duchesne ! surtout une étude de concordances, une vraie étude de cas et pas un prétexte méthodologique].

  • Marie-Anne Polo de Beaulieu, « Étude statistique de la structure de l’exemplum médiéval », I-3/4, 1986, p. 47-80 [statistiques plus « macro » : structure d’ensemble des textes, types de mots… ; très riche bibliographie sur les méthodes].

  • Corinne Gobin et Jean-Claude Deroubaix, « Les temps sociaux et le discours politique. Repérages de la notion de temps dans les déclarations gouvernementales belges », IV-1/2, 1989, p. 147-171 [véritable étude de cas ; prise en compte du temps externe (dates des discours) et interne (vocabulaire du temps].

  • Mark Olsen, « Gender representation and histoire des mentalités: Language and Power in the Trésor de la langue française », VI-3/4, 1991, p. 349-373 [étude très fine des contextes les plus fréquents de mots comme « femme », « sexe » ou « efféminé » au fil des siècles].

  • Philippe Dautrey, « Écrire sa guerre. Analyse d’un carnet de guerre », VII-3/4, 1992, p. 249-280 [à propos de la Première Guerre mondiale, un bon exemple d’étude surtout qualitative mais s’appuyant à bon escient sur des comptages : pronoms personnels, usages de « mais », expression du temps…].

  • Jean-Pierre Courtial et Léna Kerneur, « La méthode des mots associés, outil d’analyse du changement social », XII-3/4, 1997, p. 251-270 [étude sous forme de réseaux d’associations de mots-clés décrivant des articles scientifiques – cela suppose donc un pré-codage du corpus ; présentation très claire sur le logiciel Leximappe].

  • Carmen Beatriz Loza, « De la classification des Indiens à sa réfutation en justice (Yucay, Andes péruviennes, circa 1493-1574) », XII-3/4, 1997, p. 361-386 [réflexion sur la stratification sociale à partir d’une analyse quantifiée des discours]

  • Elsa Carrillo-Blouin, « Les discours présidentiels mexicains, 1877-1976. Une application de l’analyse factorielle », XIII-3/4, 1998, p. 377-410 [plus intéressant que son article de 2003 à mon sens, celui-ci propose une étude claire des changements chronologiques majeurs au sein du corpus].

  • Et des articles de pure discussion de méthode (plus difficiles à lire !) : Alain Guerreau, « Pourquoi (et comment) l’historien doit-il compter les mots ? » [à propos d’un colloque, riche bibliographie de méthode], IV-1/2, 1989, p. 81-105 ; Marc Barbut, « Note sur l’ajustement des distributions de Zipf-Mandelbrot en statistique textuelle », IV-1/2, 1989, p. 107-119 ; André Salem, « Les séries textuelles chronologiques », VI-1/2, 1991, p. 149-175.

  • Le logiciel Arcane, dédié en particulier aux « ego-documents » (correspondances, journaux intimes…), présenté par l’exemple dans les actes d’un intéressant colloque (inclut des formes simples d’analyse de réseaux) : Pierre-Yves Beaurepaire et Dominique Taurisson (éd.), Les ego-documents à l’heure de l’électronique. Nouvelles approches des espaces et des réseaux relationnels, Montpellier, Presses universitaires de Montpellier, 2003 et www.egodoc.revues.org/octobre2002/

  • Applications de l’analyse de réseaux « plus classique » à l’étude de textes transformés en énoncés transformés en relations : des exemples réussis sont Charles Tilly, “Parliamentarization of Popular Contention in Great Britain, 1758-1834”, Theory and Society, 26, 1997, p. 245-273 ; Charles Tilly and Lesley J. Wood, “Contentious Connections in Great Britain, 1828-34”, in Mario Diani and Doug McAdam (eds.), Social Movements and Networks. Relational Approaches to Collective Action, Oxford/New York, Oxford University Press, 2003, chap. 7 ; John W. Mohr and Vincent Duquenne, “The Duality of Culture and Practice: Poverty Relief in New York City, 1888-1917”, Theory and Society, vol. 26, n° 2/3, avril-juin 1997, p. 305-356. Sans parler des études de citations entre scientifiques…