Les Tableaux Croisés Dynamiques (TCD) 97-2003

Tutoriel pas à pas sur les tableaux croisés dynamiques, versions excel 97-2003
Une série de tutoriels pour les versions 2007 et suivantes est disponible sur cette page et les suivantes.

Vous pouvez télécharger un exemple associé à ce tutoriel.
Sur la feuille données de ce classeur sont présentées des données issues du site de l'IARC : International Agency for Research on Cancer, agence dépendant de l'ONU qui a pour mission de collecter les données mondiales sur les cancers.

Vous pouvez sur ce site récupérer des données d'incidence (nombre de nouveaux cas par an) et de mortalité pour les grandes catégories de cancer, par pays et par sexe. http://www-dep.iarc.fr/globocan/globocan.html

J'ai extrait seulement une toute petite partie des données, et pour l'année 2000 uniquement.

Quelle est la question à laquelle je veux répondre ?

Bien souvent, devant une masse importante de données, il est assez difficile de savoir par où commencer pour les exploiter. La construction d'un TCD permet de simplifier l'affichage, de mettre en rapport différents types de données et de choisir la question qu'on se pose.

Evidemment si on la connaît déjà, c'est pas d'jeu mais ça marche quand même !

Quelques exemples de questions auxquelles nous pourrions essayer de répondre avec l'exemple proposé :

  • Est-ce que les habitudes alimentaires jouent un rôle sur les cancers digestifs ?
  • Est-ce que les hommes ont plus de cancers du poumon que les femmes ? (à ce propos, vous pouvez aussi lire ces quelques pages : )...
  • Est-ce que certains cancers guérissent mieux que d'autres ?

Comment exploiter cet immense tableau de la page données ?

Si vous ne connaissez pas le TCD, il y a fort à parier que vous allez copier sur la page données quelques lignes que vous reporterez sur une autre feuille pour disposer de moins de données, y voir plus clair, faire un graphique et réfléchir à l'interprétation. Le TCD vous permet de faire tout cela mais surtout il vous permet en quelques clics de modifier ce que vous voulez regarder et la présentation. Ce qui vous laisse tout le temps pour l'interprétation.

Entrée des données source.

Les données source d'un TCD doivent obligatoirement être ordonnées de la façon suivante :

La première ligne doit contenir une étiquette par colonne et chaque colonne ne doit contenir qu'un seul type de données (homme/femme ou pays par exemple)

Construction du TCD

Allez sur la page données, sélectionnez la cellule A1 dans le menu édition /atteindre /cellules cliquez sur zone en cours. Ceci sélectionne vos données source. Allez ensuite dans le menu données/rapport de tableau croisé dynamique. Cliquez sur suivant pour les deux premiers écrans.

Sur l'écran du haut sur l'image, vous avez un bouton "disposition". Cliquez dessus, ça vous ouvre l'écran du dessous.

Sur cet écran, à droite vous avez des étiquettes qui sont saisissables avec la souris. Faites les glisser dans les zones (on dit des champs) marquées page, ligne colonne.

Prenez l'étiquette incidence et faites la glisser dans le champs données au centre du tableau. Si l'étiquette se transforme en "nombre d'incidences", double cliquez sur l'étiquette. Ceci ouvre le troisième écran (champ pivot table, ils n'ont pas pensé chez microsoft à traduire !)choisissez "somme", répétez la même chose pour les décès et validez le tout. Une nouvelle feuille, contenant le TCD est créée. En même temps, une nouvelle barre d'outils, TCD, apparaît.

Dans le menu déroulant, vous avez accès à des options diverses, permettant par exemple de masquer les totaux de ligne et de colonne Vous avez également un bouton sur cette barre permettant une mise en forme plus soignée du TCD. Evitez pour l'instant mais vous pouvez tester ensuite ! Sur la barre d'outil TCD, l'un des boutons permet de modifier le paramètre de champ sélectionné (somme d'incidences au lieu de nombre, si vous avez oublié de le faire avant ou si vous avez besoin de changer). Plus important, les cellules à fond grisé comportent des flèches qui vous permettent d'afficher toutes les données ou seulement une données que vous choisissez.Par exemple pour comparer les cancers de l'estomac entre le japon et les USA, cliquez sur la flèche à côté de organe, en tout, décochez la boite "afficher tout" et recliquez sur estomac. Même chose pour ne sélectionner que les hommes par exemple.

Voilà un tableau déjà bien plus facile à analyser non ?

Manipuler le TCD

Cela dit, tel quel, ce tableau fait la somme des cancers dans tous les pays du monde (et même en fait plus puisque le tableau initial contient pour chaque localisation des lignes qui font les sous totaux par continent et pour l'ensemble du globe). Le champ de page, pays, ne contient pas dans son menu déroulant l'info "afficher tout". Par définition, il permet de n'afficher qu'une seule page à la fois. Vous pouvez donc visualiser les données des cancers de l'estomac pour les hommes au japon mais il faut recommencer pour les USA…

Pour résoudre cela, on va transformer le champ de page en champ de ligne ou de colonne. Prenez l'étiquette pays et faites la glisser à côté de celle notée sexe. Un message s'affiche indiquant que le nombre de données est trop grand pour être affiché en entier. Faites le plutôt glisser à côté du champ organe et faites glisser celui-ci à coté du champs sexe.

Voilà qui est déjà plus parlant… Pour que ça le devienne encore plus, cliquez sur l'icône du graphique dans la barre d'outil TCD. Vous créez ainsi un graphique croisé dynamique.

Celui-ci par défaut est horrible et apparaît dans une nouvelle page. Un clic droit dessus vous permettra de le remettre en tant qu'objet dans la feuille du TCD et de modifier le type de graphique, les séries, les couleurs, comme vous le faites pour un graphique standard.Il n'y a cependant pas de graphique en nuage de point disponible... Le gros intérêt est que sur ce graphique, vous retrouvez les flèches du TCD. Toute modification sur le graphique se répercute dans le TCD et inversement. Vous pouvez sur l'un ou l'autre faire glisser les champs pour les passer de lignes en colonne, voire en champ de page. Vous pouvez à tout moment modifier le nombre d'éléments que vous souhaitez voir. On peut ainsi visualiser ceci :

Pas besoin d'être épidémiologiste pour comprendre que les risques de cancers ne sont pas les mêmes au Japon et aux USA… On pense bien sur à la fois à des facteurs génétiques, environnementaux et liés au mode de vie (alcool, tabac, nourriture).

Maintenant quant à trouver la part relative de chacun c'est une autre affaire !

On peut également voir que l'espérance de vie avec un cancer de la prostate est bien plus longue qu'avec un cancer du poumon.

En déplaçant les étiquettes dans tous les sens, vous verrez que certaines représentations sont bien plus parlantes que d'autres. C'est tout l'intérêt du TCD de pouvoir essayer tout cela sans faire autant de sous tableaux et de graphiques que nécessaire.

Amusez vous bien ! C'est la meilleure façon de se rendre compte de la puissance incroyable de cet outil.

Ajouter un champ calculé

Sur le graphique ci dessus, on comprend intuitivement que la chance de guérir d'un cancer de l'estomac n'est pas la même que celle de guérir d'un cancer du poumon. En réalité ici attention, ce que l'on mesure ce n'est pas exactement cela. Mais de fait, plus le nombre de morts annuel est proche du nombre de nouveaux cas pour un cancer donné, plus malheureusement c'est le signe de la gravité du cancer.

Pour quantifier ce degré de gravité on pourrait créer un index de gravité = mortalité/incidence, exprimé en %.

Pour faire cela, on pourrait créer une nouvelle colonne dans la page de données initiales. Mais on peut aussi très simplement le faire dans le TCD en créant un champ calculé.

Dans le menu TCD, choisissez formule/champ calculé. Dans la zone nom, tapez "gravité". Double cliquez dans la liste sur "décès 2000" ajoutez un / puis double cliquez sur "incidence 2000". dans le TCD vous voyez une nouvelle colonne "gravité" apparaître.

Elle apparait aussi dans le graphique mais les valeurs étant très faibles vous ne les voyez pas. Pour cela il faut mettre en forme cette série. Pour la sélectionner, le graphique étant lui même sélectionné, allez dans la barre d'outils graphiques.

Dans la liste déroulante sélectionnez la série puis cliquez sur le bouton de mise en forme. Dans l'onglet sélection de l'axe, choisissez axe secondaire. Cliquez droit ensuite sur les barres jaunes qui apparaissent, type de graphique, et sélectionnez un graphique en courbes. Formatez la série à votre gout, formatez aussi les axes. Si vous voulez faire disparaitre ces gros boutons gris sur le graphique, cliquez sur le graphique, et dans la barre de menu "graphique croisé dynamique" cliquez sur "masquer boutons champs graphique croisé dynamique".

Vous obtenez ce graphique :

Concernant les champs du TCD, vous pouvez en modifier l'affichage en cliquant droit sur l'étiquette (somme décès 2000 par ex). Dans paramètres de champ, vous pourrez modifier le nom qui apparaît, le format des nombres. Dans le bas de la fenêtre il y a un menu déroulant affichage. Il vous permet d'afficher le champ par exemple en pourcentage du total, ou par rapport au nombre de décès au Japon...

Il y a de nombreuses autres fonctions plus avancées disponibles pour les TCD.

On peut même les construire et les manipuler par programmation VBA . Lancez l'enregistreur de macro c'est la meilleure façon de découvrir les bases du code nécessaire pour cela.

Remarque pour les puristes : Je précise qu'avec les données présentées ici, il n'est en fait pas vraiment possible de répondre : les données présentent le nombre de personnes atteintes en 2000 (incidence) et le nombre de morts la même année sans tenir compte ni du nombre d'individus par pays, ni de la répartition par classe d'ages dans une population donnée.

Comparer les données de cancer de la prostate (qui atteint surtout les hommes après 50 ans) entre les USA et le Nigeria qui n'ont pas la même espérance de vie moyenne n'a pas grand sens si on ne corrige pas les données brutes. Pour cela il faut prendre sur le site de l'IARC non pas les données brutes mais les taux corrigés qui prennent en compte ce problème.

Commentaires

Bonjour et merci pour cet excellent tuto !
Juste une remarque : le lien pour télécharger le fichier exemple est erroné. Le bon lien est le suivant : http://www.excelabo.net/exemples/fc-pap-tcd

C'est corrigé, merci de l'avoir signalé

Ce mois-ci sur Excelabo

- Pas de nouvelle page.
- 8 pages modifiées.