7 Quelques définitions en statistiques

7.1 Echantillon, échantillonnage, population

Un élement :
Une des unités d’échantillonnage (objet) constituant la population (= unité d’observation, un évènement…).
Exemple :

  • quadrat
  • transect
  • un individus
  • un échelle

L’élément dépendra de l’échelle de votre étude.

Exemple d' élément dans une population d'huitre creuse (*Magalina gigas*)

Figure 7.1: Exemple d’ élément dans une population d’huitre creuse (Magalina gigas)

La population cible :
Ensemble des éléments sur lesquels porte la problématique d’étude. Il est rare que l’étude porte sur la totalité des éléments de la population cible

Exemple de population cible : La population d'huitre creuse (*Magalina gigas*) du Nord Cotentin

Figure 7.2: Exemple de population cible : La population d’huitre creuse (Magalina gigas) du Nord Cotentin

Population statistique :
Ensemble des éléments parmi lesquels sont sélectionnés les échantillons. Ces éléments doivent posséder au moins une caractéristique commune et exclusive permettant de les identifier sans ambiguïté. (e.g. la taille, la couleur, le sexe, une protéine, une caratéristique morphologique, …). Une population statistique possède un effectif fini N ou infini. C’est de cette population que l’on pourra tirer des conclusions et les élargir. Le choix de la population statistique est très important pour étendre les conclusions à la population cible en prenant alors un risque biologique.

Population statistique : Les huitres creuses **adultes de 9cm de long** du Nord Cotentin.

Figure 7.3: Population statistique : Les huitres creuses adultes de 9cm de long du Nord Cotentin.

Un échantillon :
Comme pour la population, il est difficile d’échantillonner toute la population statistique. Par conséquent, un ensemble d’éléments sera sélectionné au sein de cette population, on parle alors d’échantillon. Un échantillon possède un effectif n.
Un échantillon représentatif représente fidèlement la population :

  • il est indépendant de la taille de la population
  • il dépend uniquement du protocole d’échantillonnage.
  • la taille de l’échantillon affecte

La population biologique :
Ensemble d’individus d’une même espèce vivant à un endroit et à un moment donné. Dans notre cas cela pourrait être, “Les huitres adulte de la pointe Nord Cotentin de plus de 9cm de long en novembre 2015.”

Dans certains cas, les populations cible, statistique et biologique peuvent avoir la même définition.

7.2 Les variables et types mathématiques

Une variable est une caractéristique observée ou mesurée sur chacun des éléments de l’échantillon (= descripteur, caractère, attribut, trait)

Exemple de variables étudiées en biologie

Figure 7.4: Exemple de variables étudiées en biologie

Cette caractéristique est sujette à des variations qualitatives ou quantitatives, on parle alors du type mathématique des variables. Ce type mathématique influence la manière de traiter les variables.

Type mathématiques de variables (inspiré de Legendre et Legendre(2012)

Figure 7.5: Type mathématiques de variables (inspiré de Legendre et Legendre(2012)

Une variable qualitative ne peut être mesurée mais peut être classée en catégories comme le sexe, la forme, la couleur,… . Ce type de variable peut être ordonné, i.e. les états sont ordonnés les uns par rapport aux autres (beaucoup, moyen, faible / grand, moyen, petit), on parle alors de variables semi-quantitatives. Ce type peut également être non ordonné avec plusieurs états ou seulement deux états (= binaire, e.g. oui/non, Présence/Absence, Mâle/Femelle,…). Les variables quantitatives continues sont celles qui apportent le plus d’information, on pourra toutefois réduire l’information d’une variable quantitative en variable qualitative pour les besoins d’une analyse, mais la réciproque n’est pas possible. Ceci implique de bien choisir le moyen de mesurer les variables et de trouver le bon compromis entre le coût et l’information disponible.

7.3 Les types de variables

7.3.1 Les variables propres / associées

  • Les variables propres sont directement mesurées sur les éléments de l’échantillon.
  • Les variables associées sont mesurées sur l’environnement des éléments de l’échantillon.

Reprenons notre exemple d’optimisation de croissance de pétoncle noire dans la ferme aquacole. La longueur des pétoncles est une variable PROPRE quantitative continue car l’élément de l’étude est un individus de pétoncle présent dans les différents bassins. En parallèle, le gestionnaire mesure les paramètres de l’eau des bassins pour qu’ils soient le plus homogène entre les bassins. Les paramètres de l’eau (température, salinité, oxygène dissous) sont donc des variables ASSOCIEES.

7.3.2 Les variables simples / complexes

  • Les variables simples sont déterminés par une mesure unique.
  • Les variables complexes sont le résultat de la combinaison de plusieurs variables simples

En océanographie physique la profondeur est un paramètre essentiel. Toutes les sondes multi-paramètres possèdent un capteur qui mesure la profondeur. Alors comment mesurer la profondeur? Grâce à la pression relative, la température et la salinité. Donc la profondeur est une variable COMPLEXE et la pression, la température sont des variables simples. Alors pour la salinité c’est un peu plus complexe :). Je vous laisse réfléchir!! Comment mesure t-on la salinité?

7.4 Les variables aléatoires / contrôlées

  • Les variables aléatoires sont issues d’un processus aléatoire, elles ne sont pas connues avant d’effectuer une observation.
  • Les variables contrôlées sont connues avant d’effectuer une observation.

Durant une étude technique, vous étudiez l’impact des ultra-sons (US) sur la croissance de bar. Vous possédez 600 juvéniles que vous répartissez entre 3 bassins contrôles et 3 bassins US soit 100 individus par bassin. Pour que les mesures soient comparables entre les bassins, vous devez contrôler la température, la salinité et la saturation en oxygène. Tous les 21 jours, vous réalisez une biométrie pour suivre la croissance (longueur, poids). Les paramètres physico-chimques sont donc des variables contrôlées et les mesures de biométrie sont des variables aléatoires car vous ne connaissiez par la longueur, ni le poids des poissons avant de les mesurer et de les peser.

7.5 Les plans d’échantillonnages

Vous connaissez maintenant les différents types de variables, il faut dorénavant que vous mettiez en place un schéma pour échantillonner au sein de votre population statistique. C’est ce qu’on nomme en statistique un plan d’échantillonnage. On parle d’un échantillonnage probabilistique car il est basé sur le tirage aléatoire des échantillons.

Voici 3 plans d’échantillonnages communément utilisés :

Plan d’échantillonnage aléatoire :

Prélèvement aléatoire de n éléments parmi les N de la population. Tous les éléments ont la même probabilité d’être sélectionnés : \(p=\frac{1}{N}\).

Dans l’exemple :

\(N=625\)
\(n=50\)
\(p=1/625\)

Exemple de deux plans d'échantillonnages aléatoires

Figure 7.6: Exemple de deux plans d’échantillonnages aléatoires

Plan d’échantillonnage aléatoire stratifié :

On divise la population en \(k\) strates. Ainsi, on va échantillonner les éléments au sein de ces différentes strates. Par exemple, sur un estran rocheux, on peut réaliser le même nombre de quadrats dans les différentes ceintures algales on parle de plan d’échantillonnage aléatoire stratifié équilibré. Or si la surface des ceintures algales est très hétérogènes, on peut pondérer le nombre de quadrats par la surface,i.e. plus la surface est grande plus il y aura de quadrat. On parle alors de plan d’échantillonnage aléatoire stratifié proportionnel.

Exemple de deux types de plans d'échantillonnages aléatoires stratifiés

Figure 7.7: Exemple de deux types de plans d’échantillonnages aléatoires stratifiés

Plan d’échantillonnage systématique :

On tire aléatoirement un élement parmi les \(N\) élements de la population statistique, puis les autres éléements seront positionnés les uns par rapport aux autres en respectant un pas régulier dans plusieurs dimensions (e.g. spatiales et/ou temporelles).

Exemple d'un schémas régulier en quinconce

Figure 7.8: Exemple d’un schémas régulier en quinconce

7.6 Les plans d’expériences

On u9lise un plan d’expérience lorsque l’on réalise une étude par expérimentation, i.e. lorsque l’on provoque volontairement les faits à étudier. Le plan d’expérience comprend notamment le(s) facteur(s) à faire varier, le nombre de répétitions à réaliser et le dispositif expérimental à mettre en place. L’association des classes de plusieurs facteurs constitue un traitement.

Plan d’expérience aléatoire :

Les élements sont positionnés aléatoirement dans les \(k\) traitements et il y a le même nombre d’éléments par traitement. Dans le cas de l’expérimentation de la ferme aquacole, chaque mixture alimentaire correspond à un traitement et les pétoncles noires (=élements) sont positionnées aléatoirements dans chaque traitement.

Dans la figure ci-contre, il y a 3 traitements A/B/C et dans chacun 5 élements sont positionnés aléatoirement.

Exemple d'un plan d'expérience complètement aléatoire

Figure 7.9: Exemple d’un plan d’expérience complètement aléatoire

Plan d’expérience aléatoire en bloc complet :

S’il y a (ou s’il peut y avoir) une grande hétérogénéité entre les éléments, ils sont réunis en groupes aussi homogènes que possibles (ou blocs). Au sein de ces blocs chaque élément est ensuite affecté aléatoirement à un traitement, de manière à ce que tous les traitements soient présents dans chacun des blocs.

Dans l’expériementation sur l’impact des ultra-sons sur les bars, on remarque au début de l’expérimentation que le comportement du poisson impacte sa propre croissance, on va donc décider de former des groupes (=blocs) correspondant aux différents comportements (e.g. audacieux, timide). Si on décide de faire subir différentes fréquences (=traitements), il faudrat que tous les traitements soient présents dans chaque bloc.
Si tous les traitments ne sont pas présents dans les blocs, on parle alors de plan en bloc incomplet.

Exemple d'un plan d'expérience en bloc complet

Figure 7.10: Exemple d’un plan d’expérience en bloc complet