1 Introduction

Je suis sûr que la plupart d’entre-vous aller penser au plus profond de vous :

" Au mon dieu!! Je ne suis pas venu(e) à Intechmer pour faire des statistiques je n’aime pas les mathématiques ça me donne de l’urticaire…. Comment je vais faire… oO. "

Un intech en panique en entendant le mot statistique!! ((c)123RF)

Figure 1.1: Un intech en panique en entendant le mot statistique!! ((c)123RF)

Pour être honnête vous allez utiliser les mathématiques que vous avez appris au lycée et en 1ère année mais dans des cas concrets! Vous allez apprendre de nouvelles formules, vous allez utiliser votre calculatrice et même apprendre un nouveau langage mathématique. Mais nous allons prendre notre temps!! Pas besoin d’apprendre par coeur les formules et les définitions, vous devez les COMPRENDRE.

1.1 Pourquoi les statistiques en biologie ?

Avant de rentrer dans le vif du sujet, il est important de savoir ce qu’est la statistique. J’ai donc demandé au p’tit Bob et à sa chérie La Rousse1 ce qu’ils y connaissaient.

La statistique moderne (nom féminin):

  • Ensemble des méthodes qui ont pour objet la collecte, le traitement et l’interprétation de ces données
  • Ensemble des données numériques concernant un phénomène quelconque et dont on tire certaines conclusions

En résumé, dès lors que vous :

  1. partez sur le terrain ou que vous faites une expérimentation en laboratoire ; vous COLLECTEZ de la donnée
  2. rentrez vos données dans une base de données et calculez une moyenne et un écart-type ; vous TRAITEZ de la donnée
  3. réalisez des graphiques ou des tabeaux de synthèses pour tirer des conclusions ; vous INTERPRETEZ la donnée

VOUS FAITES DE LA STATISTIQUE!!


1.2 Origines

1.2.1 Le comptage

Au commencement, il y eu la collecte des données par le comptage. Cette notion de comptage remonte dès la naissance des premières structures sociales durant le paléolithiques (~ -30 000 ans ). La plus ancienne méthode de comptage connue est la pratique de l’entaille du temps de la préhistoire ( de -35.000 à -20.000 ans environ ), probablement pour compter les phases de la Lune , le gibier abattu et plus tard , le bétail . La notion de nombre n’est pas encore présente : les hommes de la préhistoire ne savaient pas compter la quantité de gibier tué , mais ils savaient la comparer avec d’autres chasseurs.

Os d'Ishango, datant d'environ - 20 000 ans, découvert sur les berges du lac Edouard entre l'Ouganda et la république démocratique du Congo

Figure 1.2: Os d’Ishango, datant d’environ - 20 000 ans, découvert sur les berges du lac Edouard entre l’Ouganda et la république démocratique du Congo

Vers 1500 avant JC, en Mésopotamie, les bergers recevaient chaque matin une bourse contenant autant de boulettes de terre sèche qu’ils avaient de bêtes à garder . Le soir, il leur suffisait d’en enlever une de la bourse pour chaque bête rentrée à l’étable. Cela leur permettait de vérifier si toutes les bêtes étaient rentrées.

1.2.2 Le recensement

Le recensement est une opération statistique de dénombrement d’une population et donc de connaitre la situation socio-économique de l’Etat. Des traces de recensements ont été découverts en Chine au 23e siècle av. J.-C. ou en Égypte au 17e siècle av. J.-C..

Empereur Yao, de 2324 av. J.-C. à 2206 av. J.-C.

Figure 1.3: Empereur Yao, de 2324 av. J.-C. à 2206 av. J.-C.

En 2238 av. J.-C., l’empereur chinois Yao (2324 av. J.-C. à 2206 av. J.-C.) organisait des recensements pour contrôler la production agricole et la rentrée des impots dans son empire.

En 1700 av. J.-C., les égyptiens instauraient le cadastre et le cens (i.e. institution destinée à enregister les citoyens et leurs biens.).

Le recensement s’est fortement développer durant la Rome antique, Cicéron (106 av. J.-C. à 43 av. J.-C.)insistait sur le fait que :

“Il est nécessaire au sénateur d’avoir une notion complète de l’Etat ; et cela s’étend loin : savoir l’effectif de l’armée, la puissance financière, les alliés, amis et tributaires que possède l’Etat […]”

Au IIIè siècle apparaissent à Rome des tables d’estimation des rentes viagères. A partir XIIIè siècle, les données deviennent de plus en plus abondantes et complexes, elles servent à évaluer les risques financiers chez les marchands,les ressources humaines et militaires pour les nobles… . Bref l’usage de la statistique se développe sans pour autant mettre un nom dessus.

1.2.3 Et la statistique est née

La notion de statistique prend son sens au XVIIIème siècle notamment avec la notion de statistique prévisionnelle. Antoine Deparcieux (1703 - 1768) écrit en 1746 l’Essai sur les probabilités de la durée de vie humaine dans lequel il explique la construction de table de mortalité servant ensuite aux compagnies d’assurance.
La statistique a également été employée pour faire des rétrospections démographiques. En 1832, le Baron de Reiffenberg présenta à l’Académie des Sciences ses calculs pour estimer la population gauloise à partir de l’oeuvre de Jules César (De Bello Gallico, Commentaires sur la Guerre des Gaules)2.
Le XIXème siècle verra l’émergence de nombreux concepts développés par de grands mathématiciens (Fermat, Pascal, Laplace, Condorcet…) étayant la science statistique avec les statistiques mathétiques et inférentielles basées sur les probabilités. C’est à Adolphe Quetelet que l’on doit l’idée que la statistique est une science s’appuyant sur les probabilités.
Au XXème siècle, les statistiques sont surtout employées dans l’industrie. Le développement de l’informatique permit de traiter toujours plus de données et surtout de croiser des jeux de données différents.

1.3 Quels sont les intérêts de la statistique?

Voilà une vaste question!!! A l’heure actuelle, on retrouve les statistiques dans quasiment tous les domaines des secteurs Iaire, IIaire et IIIaire.

  1. Un responsable de ferme d’élevage de pétoncle noire veut optimiser le rendement sa production. Il va préparer plusieurs solutions nutritives en faisant varier la composition spécifique, la structure des communautés, la distribution en taille,… Son équipe mesure quotidiennement la taille des pétoncles noires élevées dans les différents bassins.

    • Comment organiser les bassins?
    • Combien de pétoncles doit-il mesurer, sachant qu’il y a plus de 1000 pétoncles noires par bassin?
    • Existe-t-il des facteurs confondant (température, salinité, oxygène dissous,…)?
    • Est-ce que les variations de croissance correspondent bien aux solutions alimentaires ou à d’autres paramètres?
  2. Pour produire des alginates les entreprises agro-alimentaires font appels à des goëmoniers pour récolter des laminaires. Pour préserver les champs de laminaires, les exploitants organisent un roulement leur permettant d’avoir des ressources tous les ans. Un champ de laminaire est exploitable dès lors que 90% des individus ont un stipe supérieur à 85cm.

    • Comment échantillonner les champs de laminaires pour avoir une bonne représentation de la population?
    • Quelle est la fréquence d’échantillonnage?
    • Combien de laminaires doivent-être prélevées?
    • Peut-on mesurer des proxies pour éviter d’impacter les populations de laminaires?
  3. L’Agence Française pour la Biodiversité fait appel à vous pour étudier l’impact d’une sortie d’une conduite d’eau usée sur les communautés benthiques du port des Flamands. Vous décidez de réaliser un transect de 150m à partir de la sortie l’émissaire.

    • Quel stratégie d’échantillonnage allez-vous choisir?
    • Combien de quadrats allez-vous faire?
    • Qu’allez-vous mesurer (Richesse spécifique, abondance, biomasse,….)?
    • Qu’allez-vous comparer et comment?

Bref, je pourrais vous sortir bien d’autres exemples car les statistiques touchent TOUS LES DOMAINES!! En milieu aquatique, il est d’autant plus important de faire des statistiques car il y a tellement de paramètres à discriminer pour être sûr que ce que l’on voit n’est pas dû simplement à l’environnement ou à la manipulation.

Allez, un petit dernier pour le plaisir !!

VOus êtes sur le N/O Thalassa pour une campagne halieuthique. Vous devez estimer les stocks de lieu noire. Pour cela, vous réalisez des traits de chalut à une profondeur de 30m au lieu de 50m pendant 1h car la funne présente une faiblesse à 34m. En remontant les chaluts vous constatez que la population de lieu noir a fortement diminuer par rapport au dernier leg (2 mois auparavant) et vous ne pêchez que des petits individus.
Que s’est-il passé?

  • Est-il possible que tous les individus mâtures aient disparu?
  • Le changement de profondeur du chalut est-il pour quelque chose?

Pour répondre à ces questions, il est important de faire de la bibliographie pour connaitre les traits de vie de l’espèce étudiée, i.e. cycle de vie, zone de frayère, régime alimentaire, reproduction,… .

Comme je vous l’ai dit précédemment on fait des statistiques sans le savoir, mais quand on veut faire de la Recherche & Développement, il est important de faire des études bibliographiques pour établir des hypothèses et in fine de les tester et les confronter avec d’autres expérimentations.


  1. Le petit Robert et Larousse de leur vrai nom↩︎

  2. Essai sur la statistique ancienne de la Belgique. I. Population. - II. Architecture. - III. Mobilier, Costumes Par le Baron de Reiffenberg, Seconde partie séance de l’académie du 3 novembre 1832, Bruxelles, PDF, 142 pages↩︎