Autour des méthodes quantitatives

Attention : la partie de ce site consacrée aux méthodes quantitatives n'est plus régulièrement mise à jour depuis 2007. Merci de vous référer maintenant sur ce sujet au site plus ergonomique et plus riche Méthodes quantitatives pour l'historien
.

Utiliser Excel pour gérer des bases de données historiques : quelques « trucs »

Cette page ne prétend pas au statut de tutoriel, ce qui serait d'ailleurs rendu vain par les différences entre versions. Il ne s'agit pas non plus d'une publicité pour Microsoft, mais il faut bien « faire avec » l'équipement de la plupart des historiens. En outre je ne suis pas encore assez habituée au tableur d'Openoffice.org pour donner des conseils du même ordre (mais la plupart y sont transposables).

Je veux donc juste pointer quelques fonctions utiles et souvent peu connues de l'outil. Peu connues notamment parce qu'elles ont des noms bizarres. Reste, pour vous, à chercher où elles sont dans les menus ou à aller voir dans l'aide comment les utiliser...

  • Une case d’un tableau Excel s’appelle « Cellule » pour le logiciel.

  • Le bon endroit pour voir ce qui est écrit dans une cellule et pour le modifier, ce n’est pas la cellule elle-même (simple lieu de sélection et d’affichage des résultats), c’est la barre horizontale située au-dessus du tableau et sous les boutons (avec fx écrit à gauche). C’est crucial si vous voulez utiliser des formules, mais c’est de bonne méthode dans tous les cas.

  • Pour sélectionner une ligne ou une colonne entière, cliquer sur la case à gauche du début de la ligne ou au-dessus du début de la colonne, cases qui portent des chiffres ou des lettres. Pour sélectionner une feuille de calcul entière, cliquer sur la case tout en haut à gauche du tableau, entre la case « 1 » et la case « A ».

  • Penser très souvent aux menus contextuels, adaptés à l’objet sélectionner (clic droit sur PC, Ctrl+clic sur Mac récent).

  • À connaître, les fonctions de copie automatique/incrémentation. Sélectionner une cellule, se placer au coin en bas à droite (le pointeur change de forme) et draguer vers le bas ou la droite (draguer = cliquer, garder appuyé, déplacer, lâcher). Selon les cas, Excel remplit les cellules avec le même contenu ou il utilise la fonction Incrémenter (1, 2, 3, 4, voire 1, 3, 5, 7 ou 1, 10, 100, 1000 si vous avez judicieusement rempli et sélectionné deux cellules au départ et non pas une). Pour passer de l’une à l’autre de ces deux fonctions si Excel a mal anticipé vos intentions, voir le menu contextuel obtenu quand on est sur ce fameux coin en bas à droite.

  • Penser à utiliser la fonction « Commentaire » (probablement dans le menu Insertion) qui permet d’ajouter une petite bulle indiquant par exemple la source d’une information, ou encore vos choix de codage ou de saisie.

  • Pour ajouter des colonnes ou des lignes au milieu de colonnes ou de lignes existantes, sélectionner le nombre de colonnes/lignes correspondant au nombre que vous voulez ajouter, à droite ou en dessous de l’endroit où vous voulez les ajouter. Puis agir sur le menu contextuel (Insertion) ou aller chercher la fonction dans les menus déroulants. Cela fonctionne aussi pour ajouter des cellules (= moins qu’une ligne ou une colonne entières). Dans ce cas, on vous demande dans quel sens décaler les cellules existantes.

  • Quand on a trop de colonnes et/ou de lignes : penser à « Figer les volets » (menu Fenêtre, a priori). Cela permet de garder fixes les lignes/colonnes avec les intitulés (noms des individus, des variables...) tout en faisant défiler le reste.

  • Il existe une sorte d'équivalent pour l'impression : si le tableau imprimé fait plus d'une page, cela permet de faire répéter automatiquement sur chaque page une ou plusieurs lignes ou colonnes (noms des individus, des variables...). La fonction s’appelle « Titres à imprimer ». Dans les versions que je connais, ça se trouve dans Fichier/Mise en page, onglet « Feuille ».

  • Retour à l’affichage : quand on multiplie les colonnes (cf. mes conseils sur les bases de données), on a parfois envie d’en cacher certaines. C’est ce que permet un menu contextuel obtenu une fois sélectionnées la/les colonnes/lignes à cacher, sous le nom « Masquer ». On le trouve aussi dans les menus déroulants. Si vous ne voulez plus masquer, il faut faire « Afficher » : soit après avoir sélectionné toute la feuille de calcul (toutes les lignes et colonnes s’affichent), soit après avoir sélectionné les lignes ou colonnes qui sont autour de la/les lignes/colonnes masquées que vous voulez ré-afficher.

  • Retour à l’impression : pour n’imprimer qu’une partie du tableau, faire avant d’aller dans l’Aperçu avant impression « Zone d’impression/définir ». Si vous voulez de nouveau imprimer tout, il suffit de sélectionner toute la feuille et de la définir comme zone d’impression.

  • Problèmes de cadrage du tableau dans la page : penser à l’option « Ajuster à x pages en largeur et y en hauteur », accessible dans le menu de Mise en page, onglet Page (à ma connaissance, on y accède soit dans le menu Fichier, soit à partir de l’Aperçu avant impression). Il permet comme son nom l’indique de dire combien de pages vous voulez à l’arrivée. Il faut un peu d’habitude pour voir à partir de quel % de réduction le résultat est trop petit pour être lisible…

  • Trois fonctions clés, qui sont normalement dans le menu « Données » : Tri, Filtre, Tableau croisé dynamique (la fonction s’appelle même « Rapport de tableau croisé dynamique »… il s’agit de bien tableaux croisés, tout simplement : ils sont utilisés pour savoir par exemple combien de personnes sont à la fois des femmes et des jeunes, ou encore des membres de la Chambre de commerce et des banquiers).

  • Tri : bien penser à sélectionner toute la feuille avant de trier. Penser à la case qui permet de dire que la première ligne contient les intitulés des variables, sans quoi elle aussi se retrouve triée. Penser à l’utilité du tri pour le recodage : regrouper les modalités identiques permet rapidement de les recoder (soit toutes ensembles soit séparément).

  • Parfois, un problème de tri se produit parce qu’Excel trie vos nombres comme du texte (par « ordre alphabétique » : 1, 10, 101, 2…). Cela peut se résoudre en lui disant explicitement qu’il s’agit de nombres, dans Format/Cellule. À propos, il faut lui interdire d’utiliser le format « Date » qu’il croit parfois reconnaître (ça marche très mal, et pas du tout pour les dates d’avant le xxe siècle…).

  • Filtre : permet d’agir non seulement sur ce qui est écrit au début d’une cellule comme le tri, mais aussi de repérer les cellules contenant tel ou tel mot ou suite de caractères. Le « Filtre automatique » suffit à la plupart des usages (il offre la fonction « Personnaliser »). Quand vous avez filtré, les lignes non concernées n’ont pas disparu, elles sont simplement masquées.

  • Tableau croisé dynamique : dans les dernières versions d’Excel, penser à cliquer sur la case « Disposition… » dans la dernière boîte de dialogue, ce qui vous permet de construire votre tableau avant de le visualiser, plutôt que l’inverse… La fonction « Tableau croisé dynamique » est trop riche, et au départ compliquée (mais on prend vite l’habitude) pour que je détaille tout ici : il faut lire l’Aide... Juste quelques remarques, donc.

  • Penser à utiliser le Collage spécial (ci-dessous). Inconvénient : ensuite, votre tableau n’est plus dynamique (ne peut plus changer d’un simple clic si vous avez changé vos données). Avantages : d’une part votre classeur Excel reprend une taille raisonnable (les Tableaux croisés dynamiques sont très gourmands en mémoire), d’autre part vous pouvez améliorer la mise en forme à votre gré, pour une publication par exemple.

  • Le Tableau croisé dynamique sert pour faire des tableaux croisés (eh oui…), d’effectifs, de % en ligne, en colonne, etc. Mais il a aussi d’autres usages sympathiques. Si on le fait sur une seule variable, il donne sa distribution, mais aussi tout bêtement la liste des modalités (= élimination des doublons) ce qui peut être utile.

  • De plus, dans les dernières versions d’Excel, le fait de double-cliquer sur la case qui vous dit par exemple qu’il y a « 4 » bouchers nés entre 1930 et 1950 dans votre base de données a une conséquence sympathique : cela crée une nouvelle feuille de calcul comprenant les 4 lignes qui concernent ces bouchers (donc leur nom ou toute autre information que vous avez sur eux). C’est une sorte de filtre automatique particulièrement pratique. Si mon explication n’est pas claire, double-cliquez sur une case d’un Tableau croisé dynamique et vous comprendrez ce que je veux dire !

  • Pour les graphiques, je vous renvoie à un petit tutoriel fait autrefois pour des étudiants en DEUG. À savoir surtout que les graphiques produits « par défaut » sont très laids, mais que tout peut se corriger par le recours aux menus contextuels (en cliquant sur chaque élément du graphique : axes, titres, légendes, etc.).

  • Parfois, les copier-coller donnent des résultats bizarres parce que vous avez cru copier un résultat, mais que vous avez copié une formule (une opération à faire). Soit une formule créée par vous, soit les formules contenues « naturellement » dans les Tableaux croisés dynamiques. Pour ne copier que le résultat, il faut faire classiquement « couper » ou « copier », mais au lieu de faire « coller », faire « Collage spécial » (à aller chercher dans le menu Édition ou dans le menu contextuel). Là, vous pouvez choisir de ne copier que les « Valeurs ». C’est à faire dès que vous êtes sûrs de ne plus vouloir modifier les résultats obtenus : c’est plus sûr.

  • Le Collage spécial permet également (option à cocher en bas de la boîte de dialogue) de « transposer », c'est-à-dire de transformer les lignes en colonnes ou réciproquement. C’est parfois très utile.

  • Pour faire faire des calculs à Excel, même si vous n’êtes pas un crack, essayez de cliquer sur le fx susmentionné, ou bien de faire Insertion/Fonction (c’est la même chose). Vous verrez, l’Assistant (boîtes de dialogue) vous tient la main et vous arriverez vite à faire des moyennes, ou encore à concaténer (mettre bout à bout le contenu de deux colonnes, par exemple pour fabriquer « nom et prénom » à partir de « nom » et « prénom »), faire des sommes, etc. Cela dit, Excel comprend aussi les symboles mathématiques classiques +, -, / et * (et les parenthèses pour les priorités). Il suffit de commencer le contenu d’une cellule par « = », de poser l’opération et de finir en frappant sur Entrée pour obtenir un résultat. C’est très utile pour obtenir des âges à partir de dates de naissance, par exemple. Cela dit, l’utilisation des références absolues ou relatives, qui permet beaucoup d’économies d’énergie, n’est pas forcément triviale. Sur ce sujet, voir le tutoriel associé au manuel de Jacques Cellier, Martine Cocaud, Traiter des données historiques. Méthodes statistiques/ techniques informatiques, Presses Universitaires de Rennes, 2001, sur le site web http://www.uhb.fr/pur/Site_TDH/Index.htm.

  • Pour recoder, penser à la fonction « Remplacer ». En particulier, il est possible de remplacer toutes les cellules vides d’une certaine zone par « 0 » ou « non renseigné » par exemple. Penser pour cela à la case à cocher « Totalité du contenu de la cellule » de la boîte de dialogue « Remplacer » (cette case s’obtient, chez moi, en cliquant d’abord sur « Options>> »).

Mise en ligne le 25 janvier 2006.