Název: Statistiques Autor: Mgr. Jiří Bureš, Ph.D. Název školy: Gymnázium Jana Nerudy, škola hl. města Prahy Předmět, mezipředmětové vztahy: matematika a její aplikace Ročník: 5. (3. ročník vyššího gymnázia, bilingvní sekce) Tématický celek: statistika základní pojmy Stručná anotace: Výukový materiál je zaměřen na představení a procvičení základních statistických pojmů pomocí tabulkového procesoru (Excel, Calc) Tento výukový materiál byl vytvořen v rámci projektu Přírodní vědy prakticky a v souvislostech inovace výuky přírodovědných předmětů na Gymnáziu Jana Nerudy (číslo projektu CZ.2.17/3.1.00/36047) financovaného z Operačního programu Praha Adaptabilita.
Statistiques (cours) 1. Quelques notions de base Une étude statistique s'effectue sur une population composée d'individus. L'objet d'étude d'une série statistique se nomme caractère (ou variable). Exemple: Lorsqu'un professeur corrige un contrôle, il est en train de réaliser une partie d'une étude statistique. La population étudiée est l'ensemble des élèves de la classe, les individus sont les élèves, la variable étudiée est la note. 2. Quelques outils pour comparer les données d'une série statistique Fréquences En pratique, les tableaux qui donnent les effectifs de manière brute sont difficiles à interpréter, surtout dans les situations où les effectifs sont assez élevés.. C est pourquoi il est usuel de transformer la ligne des effectifs en une ligne de fréquences. On définit la fréquence d une classe comme la proportion d individus de la population appartenant à cette classe. Une fréquence est toujours un nombre compris entre 0 et 1 et la somme des fréquences égale 1. Nous allons illustrer la notion de fréquence sur les résultats du premier tour des élections présidentielles en République tchèque en 2013. Nom Nombre de voix Zuzana ROITHOVÁ Jan FISCHER Jana BOBOŠÍKOVÁ Taťána FISCHEROVÁ Přemysl SOBOTKA 255 045 841 437 123 171 166 211 126 846 Miloš ZEMAN 1 245 848 Vladimír FRANZ Jiří DIENSTBIER Karel SCHWARZENBERG 351 916 829 297 1 204 195 Fréquence 0,0495 0,1635 0,0239 0,0323 0,0246 0,2421 0,0684 0,1612 0,2340 Source : http://volby.cz/pls/prez2013/pe2?xjazyk=cz (online) [cit. 2015-03-09] Indices Dans certaines études statistiques, on choisit de comparer les individus de la population à un individu de référence. Dans ce type de situation, on construit un tableau d indices. Par exemple, le tableau ci-dessous donne la superficie de quelques pays, dont la France. Si l on souhaite se faire une idée de la place occupée par chacun de ces pays en les comparant chacun à la France, on ajoute la ligne Indice de superficie. Pays Russie Etats-Unis France Espagne Luxembourg Superficie en km² 17 098 242 9 373 967 547 030 505 580 2 586 Indice de superficie 3125,64 1713,61 100 92,42 0,047 Dans ce tableau, on a choisi d attribuer la valeur 100 à la superficie de la France, puis on a complété les autres cases par proportionnalité relativement à la ligne précédente. 1 709 8242 Par exemple, la valeur 3 125,64 a été obtenue en effectuant le calcul 547030.100.
Ce tableau permet d observer de manière immédiate que, par exemple, la Russie est environ 31 fois plus étendue que la France, et que la superficie de l Espagne est environ 92 % de celle de la France. 3. Quelques caractéristiques de base d'une série statistique Le maximum et le minimum indiquent la valeur la moins élevée et la valeur la plus élevée d'une série statistique. L'étendue d'une série statistique est la différence entre sa valeur la plus élevée et sa valeur la moins élevée. La moyenne arithmétique est une mesure statistique qui caractérise les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous identiques sans changer la dimension globale de l'ensemble. Le mode, appelé aussi la valeur dominante, désigne la valeur la plus représentée d'une variable quelconque dans une population d'objets, de personnes, de choses. Il peut y avoir plusieurs modes pour une série statistique. Il représente une valeur "typique" pour une série statistique. La médiane est la valeur qui permet de partager une série statistique ordonnée en deux parties de même nombre d'éléments. On l'utilise pour caractériser les séries où les valeurs extrêmes pourraient trop influencer la moyenne. L'écart-type représente la racine carrée de la moyenne des carrés des écarts à la moyenne d'une série statistique. Si elle est petite, les valeurs sont plutôt proches entre elles, si elle est grande, les différences parmi les valeurs pourraient être plus importantes. 4. Comment résumer une série statistique? Exemple : le couple moyenne écart-type Lorsqu'un professeur a terminé de corriger un devoir donné dans une classe, il effectue généralement un calcul : celui de la moyenne. La valeur trouvée lui permet de se faire une opinion quant à la réussite de ce contrôle par cette classe. Si le professeur désire analyser les résultats plus en profondeur, il s'aperçoit que la connaissance de cette moyenne n'est pas suffisante : par exemple, elle ne lui permet pas de se faire une opinion sur l'homogénéité de la classe. c'est l'écart type " qui nous permettra de le faire. Prenons un exemple : lors d'un contrôle commun dans deux classes de vingt élèves, tous les élèves de la classe n 1 ont obtenu une note égale à 10, alors que dans la classe n 2 dix élèves ont obtenu 20 et dix ont obtenu 0. Il est manifeste que la classe n 1 est plus homogène que la classe n 2 ; pourtant les moyennes des deux classes sont identiques.
5. Comment représenter graphiquement une série statistique? Les graphiques les plus fréquemment utilisés sont les diagrammes en bâtons, les histogrammes et les diagrammes circulaires. Les hauteurs, les aires des rectangles et les mesures des angles au centre y sont respectivement proportionnelles aux effectifs. Voici deux types de diagrammes représentant les élections présidentielles en 2013 : Elections présidentielles 2013 Zuzana ROITHOVÁ Jan FISCHER Jana BOBOŠÍKOVÁ Taťána FISCHEROVÁ Přemysl SOBOTKA Miloš ZEMAN Vladimír FRANZ Jiří DIENSTBIER Karel SCHWARZENBERG 255 045 841 437 123 171 166 211 126 846 1 204 195 829 297 1 245 848 351 916 Elections présidentielles 2013 Nombre de voix Zuzana ROITHOVÁ Jan FISCHER Jana BOBOŠÍKOVÁ Taťána FISCHEROVÁ Přemysl SOBOTKA Miloš ZEMAN Vladimír FRANZ Jiří DIENSTBIER Karel SCHWARZENBERG 0 500000 1000000 1500000
Le feu et les statistiques Fiche de l'élève Tableau 1. Incendies en République tchèque en chiffres (statistiques annuelles) Année Nombre d'incendies Dommages directs Biens sauvés décédées blessées 2005 20 183 1 634 371 000 7 110 117 000 139 914 2006 20 262 1 933 992 000 9 182 541 000 144 919 2007 22 394 2 158 494 000 8 794 428 000 130 1 023 2008 20 946 3 277 297 000 14 545 693 000 142 1 109 2009 20 177 2 169 150 000 9 074 906 000 117 980 2010 17 937 1 956 159 000 11 115 762 000 131 1 060 2011 21 125 2 241 800 000 8 078 932 000 129 1 152 Tableau 2. Incendies en République tchèque en chiffres (statistiques régionales année 2010) Région Nombre d'habitants Nombre d'incendies Dommages directes Biens sauvés décédées blessées Praha 1 257 158 2509 96630 377445 10 120 Středočeský 1 264 978 3011 300 779 1 745 921 14 148 Jihočeský 638 706 1030 126 130 620 973 12 77 Plzeňský 572 045 1 178 286 475 727 671 8 57 Karlovarský 307 444 817 43 338 94 438 7 37 Ústecký 836 045 2 669 153 497 387 847 10 61 Liberecký 439 942 919 86 320 479 837 6 85 Královéhrad ecký 554 803 1024 101 895 488 017 0 46 Pardubický 517 164 795 138 634 357 347 7 77 Vysočina 514 569 779 82 034 615 983 3 50 Jihomoravsk ý 1 154 654 2170 189 750 1 073 349 16 158 Olomoucký 641 681 1071 86 486 426 089 9 62 Zlínský 590 361 759 377 350 185 286 5 55 Moravskosle zský 1 243 220 2394 172 484 498 729 22 119 Source: Český statistický úřad (www.czso.cz) base de données en ligne (online), [cit. 2014-12-15]
Le feu et les statistiques Fiche de l'élève Les activités suivantes servent à préparer les informations statistiques pour une interprétation des résultats. Le but n'est pas de donner les réponses, mais de se poser des questions sur les différentes termes statistiques et leur interprétation. Activité 1. Caractéristiques de base d'une série statistique 1) Créer un tableau qui résume le nombre d'incendies par année entre 2005 et 2011 en République tchèque. Les nombres d'incendies constituent une série statistique. 2) Calculer le maximum, le minimum, le mode, la médiane, la moyenne arithmétique et l'écart-type de cette série statistique. Activité 2. Calcul des fréquences d'une série statistique 1) Créer un tableau qui résume les totaux des dommages directs par année entre 2005 et 2011 en République tchèque. Les totaux des dommages directs constituent une série statistique. 2) Ajouter la ligne des fréquences pour comparer cette série statistique. Activité 3. Calcul d'indices d'une série statistique 1) Créer un tableau qui résume le nombre d'incendies par région en 2010. Les nombres d'incendies constituent une série statistique. 2) En choisissant la région de Pardubice comme indice (on pose 100 pour le nombre d'incendies de cette région), créer un tableau d'indices correspondant. 3) Représenter les indices à l'aide d'un diagramme en bâtons. Activité 4. Comparaison du nombre d'incendies et du nombre de personnes décédées ou blessées à cause d'un incendie 1) Créer un tableau qui résume le nombre d'incendies, le nombre de personnes décédées et le nombre de personnes blessées par région en 2010. 2) Créer une ligne du tableau qui correspond au nombre de personnes décédées par incendie et par région. 3) Créer une ligne du tableau qui correspond au nombre de personnes décédées par incendie et par région. 4) Comparer les résultats dans de différentes régions.