1. recueil de données
    1. Quelques définitions
      1. Population
        1. vaste ensemble d’unités statistiques regroupées au titre d’une caractéristique commune
        2. EXEMPLE
          1. la population peut être constituée
          2. d'objets
          3. les HLM
          4. les pièces fabriquées par une machine
          5. ..
          6. d’évènements
          7. accidents de la route
          8. décès
          9. ..
          10. de personnes
          11. les habitants de Paris
          12. les agriculteurs,
          13. les personnes privées d’emploi,
          14. les personnes souffrant de troubles cardiaques
          15. ..
          16. ..
      2. échantillon
        1. sous-ensemble de la population.
      3. Unités statistiques
        1. éléments (objets ou sujets) sur lesquels
          1. on va prélever une ou plusieurs information(s)
          2. sur lesquels on va opérer une ou plusieurs mesure(s)
      4. Variable
        1. caractéristique étudiée chez des unités statistiques et susceptible de prendre différentes valeurs ou états.
        2. EXEMPLE
          1. la taille
          2. le QI
          3. le poids
          4. la note obtenue au baccalauréat de Français
          5. la couleur préférée
          6. ...
      5. Modalités
        1. ce sont les différent(e)s valeurs ou états possibles d’une variable
        2. la variable « sexe » possède deux modalités :
          1. la modalité « homme »
          2. la modalité « femme »
        3. lorsque numérique : on parle de valeurs
      6. Propriétés :
        1. Exhaustivité : toute unité statistique mesurée doit être présente au moins dans une modalité possible de la variable
          1. sexe : (rien)
        2. Exclusivité : toute unité statistique mesurée doit être présente au plus dans une modalité possible de la variable.
          1. sexe : homme, femme
        3. conclusion : 1 seule modalité
    2. Application
      1. situation
        1. un chercheur se demande si, en CM2, les garçons ont de meilleures performances en géographie que les filles (relation entre le sexe et la performance).
      2. Topic
        1. La population impliquée est ...
          1. Les élèves en CM2
        2. les échantillons sont
          1. les garçons en CM2
          2. les filles en CM2
        3. Les unités statistiques sont …
          1. les élèves (un par un)
        4. les variables
          1. performance
          2. sexe
        5. modalités
          1. pour la première variable
          2. note allant de 0 à 20
          3. pour la deuxième variable
          4. sexe : homme/femme
  2. Echelle de mesure
    1. definition
      1. ensemble des modalités d’une variable
    2. différents cas
      1. Echelle nominale
        1. propriétés
          1. pas de hierachie
        2. Topic
          1. sexe
          2. nom de famille
          3. oui/non/peut-être
        3. si seulement 2 modalités
          1. => nominale dichotomique
      2. Echelle ordinale
        1. propriétés
          1. une hierarchie
          2. mais pas proprités numérique
        2. Topic
          1. pas du tout » / « un peu » / « moyennement »/« très » / « tout à fait »
          2. classement dans la classe (1er, 2m, etc..)
      3. Echelle d’intervalle
        1. propriétés
          1. une hierarchie
          2. "propriété numérique"
          3. => On peut mesurer l'écart entre deux valeurs (certains nombre d'unités)
          4. => Les différentes modalités successives d’une échelle d’intervalle sont donc séparées par des intervalles égaux
        2. Topic
          1. taille
          2. poids
          3. note en classe
          4. ...
  3. mesures et représentations
    1. Le tri à plat
      1. prérequis
        1. pourcentage et fréquence
          1. pourcentage
          2. 100*(effectif/effectif total)
          3. fréquence
          4. effectif/effectif total
          5. par conséquent : pourcentage/100
        2. différence entre effectifs et effectifs cumulés
          1. effectif :
          2. permet de savoir "combien de personnes ont X"
          3. effectifs cumulés (croissants en l'occurence)
          4. Permet de savoir "combien de personnes ont X ou moins"
          5. conséquence : necessite d'avoir des valeurs ordonnées (echelle ordinale)
          6. de la même manière on parlera de
          7. Effectifs cumulés croissants
          8. Fréquences cumulées croissantes
          9. Pourcentages cumulés croissants
      2. comment construire un tri à plat ?
        1. On construit un tableau au sein duquel on reporte sur la première ligne la liste de toutes les modalités possibles de la variable.
          1. + une colonne "total" qui permettra de noter l'effectif total et de vérifier vos calculs de fréquences et d'effectifs
        2. Sur la deuxième ligne, on fait correspondre, à chacune de ces modalités, l’effectif qui lui est associé.
        3. Sur la troisième ligne, on fait correspondre, à chacune de ces modalités, la fréquence ou le pourcentage qui lui est associé.
        4. Si et seulement si la variable est ordinale ou d’intervalle : sur une quatrième ligne, on indique la suite des effectifs cumulés croissants et sur une cinquième ligne, la suite des fréquences ou pourcentages cumulés croissants.
    2. representations graphiques des données
      1. echelle nominale
        1. camembert
        2. diagramme en batons
        3. diagramme en étoile
      2. echelle ordinale
        1. histogramme
          1. =diagramme en baton "collés"
      3. excel fait ça très bien
    3. représentations numériques des données
      1. Indice de position
        1. permet de résumer (souvent assez grossierement) des données
        2. le mode
          1. il s’agit de la modalité la plus fréquente de la distribution
        3. la médiane
          1. la médiane est la modalité qui partage l’ensemble des observations en deux « moitiés » d’effectifs égaux
          2. Topic
          3. méthode
          4. on cherche le moment ou l'effectif cumulé va dépasser l'effectif total / 2
          5. 2 cas
          6. soit on est entre 2 modalités (comme dans l'exemple ci dessus) et on prend le milieu (8.5 en l'occurence)
          7. soit on est sur une modalité, ce sera la mediane
          8. pour le tableau jaune la médiane est sur "parfois" car :
          9. l'effectif total/2 = 60
          10. 25 < 60
          11. 25 + 40 > 60
        4. La moyenne
          1. m = somme des observations / nombre d’observations
          2. la moyenne de 12, 14 et 15 est 12+14+15 / 3 = 13,6
          3. en se servant d'un tableau d'effectifs
          4. Topic
          5. permet simplement de remplacer 13 +13+13 par 13x3
          6. Topic
          7. Topic
      2. Indice de dispersion
        1. un indice de dispersion indique à quel point une distribution est regroupée (ramassée) ou, au contraire dispersée (étalée), autour de l’indice de position utilisé
        2. Intervalle de variation (étendue)
          1. xmax - xmin
          2. Topic
          3. Topic
        3. Les quartiles
          1. même principe que pour la médiane mais pour
          2. Q1 : 25 %
          3. Q2 : 50 %
          4. correspond à la médiane
          5. Q3 : 75 %
          6. Topic
          7. Topic
          8. déciles, centiles...
        4. écart-type
          1. Topic
          2. c'est la racine de la variance
          3. Topic
          4. Topic
          5. Topic
      3. la boîte à moustache
        1. Topic
  4. Eléments importants à retenir pour les statistiques descriptives
    1. Topic
      1. Population
        1. échantillon
          1. unité statistique
          2. variable
          3. modalités suivent une échelle
          4. nominales
          5. ordinales
          6. intervalle de valeur
          7. une des trois
      2. quelques représentations
        1. tableau (effectifs, frequences, fréquence cumulés, pourcentage, pourcentage cumulé etc...)
        2. histogramme
        3. diagramme à moustache
        4. savoir lire et construire
      3. quantités importantes
        1. moyenne
        2. variance et écart type
  5. loi normale
    1. prérequis
      1. comprendre ce qu'est une variable aléatoire
        1. on peut le comprendre comme un élément pris au hasard
        2. exemple
          1. le poids d'un élève
        3. convention
          1. on la note souvent X si il n'y en a qu'une
        4. à quoi ça sert
          1. par exemple de pouvoir écrire : P(X>70)=0.5
          2. ce qui se comprendrait comme : si je prends le poids d'un élève choisi au hasard la probabilité que son poids dépasse 70 kilos est de 0.5
      2. comprendre ce qu'est une distribution
        1. Définition
          1. l’ensemble des valeurs xi que prend cette variable associé à l’ensemble des pourcentages (Pi) d’apparition de ces valeurs xi.
        2. dans la pratique
          1. Il y a différent type de hasard, la distribution vous informe de la manière dont le hasard particulier que vous étudiez s'exprime
          2. exemples
          3. distribution associée à l'experience de la piece de monnaie
          4. => (pile,1/2),(face,1/2)
          5. loi uniforme entre 0 et 1
          6. => autant de chance de tomber
          7. entre 0 et 0,3
          8. ou entre 0,3 et 0.6
          9. car les segments sont de longueurs égales
        3. comment les représenter
          1. par une loi de probabilité
          2. = courbe dont l'aire en dessous nous indique les probabilités désirées
          3. pour la loi uniforme entre 0 et 1
          4. Topic
          5. l'aire grise correspond à la probabilité de "tomber entre a et b " (ce qui s'écrit P(a<X<b) )
          6. conséquence importante
          7. l'aire totale fait toujours 1
          8. cela sert beaucoup dans la pratique
        4. Vocabulaire
          1. on peut parler aussi de loi de probabilité
          2. on dit qu'une variable aléatoire suit une distribution/loi .... (gaussienne par exemple) de paramètre .... (si il y a des paramètres)
    2. Définition de la loi normale
      1. définition exacte
        1. l'équation de cette loi de probabilité n'est pas necessaire pour les calculs que vous aurez à faire
        2. juste pour la curiosité :
          1. Topic
          2. avec µ la moyenne et sigma l'écart type
      2. ce qu'il faut savoir
        1. c'est une loi très fréquente dans les phénomènes aléatoires
        2. elle a une forme de cloche
          1. Topic
        3. on l'appelle aussi la loi gaussienne
        4. elle a deux paramètres
          1. la moyenne
          2. et l'écart type
          3. on écrira X~N(m,s) pour dire que X suit une gaussienne de moyenne m et d'écart type s
    3. comment utiliser la loi normale ?
      1. calculer une probabilité = trouver l'aire sous la courbe
        1. exemple
          1. Topic
          2. aire barrée en orange = probabilité de trouver un individu dont la taille est supérieure à 1m80
          3. comment la calculer
      2. premier problème
        1. l'aire sous la courbe ne peut pas se calculer facilement
        2. donc on utilise des calculs qui ont déjà été fait ( cf la table de la loi normale centrée réduite)
      3. deuxième problème
        1. on ne peut pas faire ces calculs pour toutes les gaussiennes possibles
        2. on fait ses calculs pour une seule gaussienne
          1. de moyenne : 0
          2. de variance : 1
          3. on l'appelle donc la loi normale centrée réduite
          4. Topic
          5. la deuxième image est interessante car elle vous donne la probabilité "de tomber" dans un intervalle de 1, 2 ou 3 écart-types de la moyenne
          6. à un écart type près
          7. 68% des échantillons
          8. 2 écarts types
          9. 95 % des échantillons
          10. 3 écarts types
          11. 99.7 %
          12. cela reste vrai quelque soit la moyenne et l'écart type !
          13. si on a X~N(14,3) alors P(14 - 3 < X < 14 + 3 ) = 68 %
          14. cela n'est pas à apprendre par coeur mais peut vous donner une idée des probabilités que vous allez trouvez selon "à combien d'écart type" vous vous écartez de la moyenne.Cela peut donc être pratique pour vérifier d'un coup d'oeil la vraissemblance de votre résultat
        3. on établit des règles pour passer d'un problème comme celui vu plus haut (avec la taille) à un problème sur la loi normale centrée réduite
      4. dans la pratique
        1. On transforme la quantité désirée (ici 180) en une valeur qui correspondra au même problème mais avec la gaussiène centrée réduite (voir dessin)
        2. Topic
        3. FORMULE :
          1. z0 = (x0 - m)/s
          2. m : moyenne
          3. s : écart-type
          4. avec x0 la mesure dont on veut la transformée
          5. et zo la nouvelle mesure
        4. d'un point de vue mathématique on peut écrire
          1. P(X>x0)=P(Z>z0) avec Z~N(0,1)
          2. revoir la note de cours sur les variables si cette notation vous semble difficile
        5. DERNIERE ETAPE
          1. on cherche dans la table de la loi normale centrée réduite la quantité associée au z0 ainsi trouvé
          2. c'est la probabilité recherchée
      5. vocabulaire
        1. on dit que
          1. z0 est la transformée en z de x0
          2. ou
          3. z0 est la valeur centrée réduite associée à x0