Définition
L'estimation d'une proportion consiste à déterminer un intervalle de confiance pour une proportion $p$ inconnue dans une population, à partir d'un échantillon de taille $n$. Cet intervalle, appelé intervalle de confiance, est une plage de valeurs qui, avec une certaine probabilité (le niveau de confiance), contient la vraie proportion $p$. La prise de décision statistique, basée sur cet intervalle, permet de valider ou de rejeter une hypothèse sur la valeur de $p$.
Méthode — Estimation d'une proportion et prise de décision statistique
1. Calcul de la fréquence observée
À partir d'un échantillon de taille $n$, on calcule la fréquence observée $f = \frac{k}{n}$, où $k$ est le nombre d'individus de l'échantillon possédant la caractéristique étudiée.
2. Vérification des conditions d'application
Pour pouvoir construire un intervalle de confiance asymptotique au niveau de confiance de 95%, les conditions suivantes doivent être remplies :
- $n \geq 30$
- $n × f \geq 5$
- $n × (1-f) \geq 5$
3. Construction de l'intervalle de confiance
Si les conditions sont remplies, un intervalle de confiance asymptotique au niveau de confiance de 95% pour la proportion $p$ est donné par : $$I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$$ Cet intervalle est une approximation de l'intervalle de confiance exact.
4. Prise de décision statistique
Pour prendre une décision sur une proportion $p_0$ donnée (valeur théorique ou attendue) :
- Si $p_0 \in I_c$, on considère que l'hypothèse que la proportion est $p_0$ est compatible avec les données de l'échantillon au niveau de confiance de 95%.
- Si $p_0 \notin I_c$, on rejette l'hypothèse que la proportion est $p_0$ au niveau de confiance de 95%. On peut alors affirmer, avec un risque d'erreur de 5%, que la proportion réelle est différente de $p_0$.
Exemple résolu
Une entreprise fabrique des ampoules. Elle annonce que la proportion d'ampoules défectueuses est de 2%. Pour vérifier cette affirmation, un contrôleur prélève un échantillon aléatoire de 1000 ampoules et constate que 35 d'entre elles sont défectueuses. Que peut-on en conclure au niveau de confiance de 95% ?
- $n = 1000 \geq 30$ (condition vérifiée)
- $n × f = 1000 × 0,035 = 35 \geq 5$ (condition vérifiée)
- $n × (1-f) = 1000 × (1 - 0,035) = 1000 × 0,965 = 965 \geq 5$ (condition vérifiée)
Puisque la proportion annoncée par l'entreprise ($p_0 = 0,02$) appartient à l'intervalle de confiance calculé $[0,0034 ; 0,0666]$, on peut considérer que l'affirmation de l'entreprise est compatible avec les données de l'échantillon au niveau de confiance de 95%. Il n'y a pas de raison de remettre en cause la proportion de 2% d'ampoules défectueuses.
⚠️ Piège fréquent au BAC — Interprétation de l'intervalle
- Confondre l'intervalle de confiance avec l'intervalle de fluctuation. L'intervalle de confiance est pour estimer $p$ à partir de $f$, l'intervalle de fluctuation est pour estimer $f$ à partir de $p$.
- Oublier de vérifier les conditions d'application ($n \geq 30$, $nf \geq 5$, $n(1-f) \geq 5$) avant de construire l'intervalle.
- Mal interpréter la conclusion : si $p_0 \in I_c$, on ne prouve pas que $p=p_0$, mais que $p_0$ est une valeur plausible pour $p$. Si $p_0 \notin I_c$, on rejette $p_0$ avec un risque d'erreur de 5%, on ne prouve pas que $p \neq p_0$ de manière absolue.
- Arrondir trop tôt les valeurs, en particulier pour les bornes de l'intervalle, ce qui peut fausser la décision finale.
Exercice type BAC
Une association de consommateurs souhaite vérifier l'affirmation d'un fabricant de yaourts qui prétend que 80% de ses produits contiennent au moins 100 millions de ferments lactiques par gramme.
- L'association prélève un échantillon aléatoire de 200 yaourts et constate que 140 d'entre eux contiennent au moins 100 millions de ferments lactiques par gramme. Calculer la fréquence observée $f$ de yaourts conformes dans cet échantillon.
- Déterminer un intervalle de confiance asymptotique au niveau de confiance de 95% pour la proportion $p$ de yaourts conformes dans la production du fabricant. On veillera à vérifier les conditions d'application.
- Que peut-on conclure quant à l'affirmation du fabricant au niveau de confiance de 95% ? Justifier la réponse.
Calcul de la fréquence observée :
La taille de l'échantillon est $n = 200$. Le nombre de yaourts conformes est $k = 140$.
La fréquence observée est $f = \frac{k}{n} = \frac{140}{200} = 0,7$.
Détermination de l'intervalle de confiance :
Vérifions les conditions d'application de l'intervalle de confiance asymptotique :
- $n = 200 \geq 30$. La condition est vérifiée.
- $n × f = 200 × 0,7 = 140 \geq 5$. La condition est vérifiée.
- $n × (1-f) = 200 × (1 - 0,7) = 200 × 0,3 = 60 \geq 5$. La condition est vérifiée.
Toutes les conditions sont remplies. L'intervalle de confiance asymptotique au niveau de confiance de 95% est donné par :
$$I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$$En remplaçant $f = 0,7$ et $n = 200$ :
$$I_c = \left[ 0,7 - \frac{1}{\sqrt{200}} ; 0,7 + \frac{1}{\sqrt{200}} \right]$$Calculons $\frac{1}{\sqrt{200}}$ : $\frac{1}{\sqrt{200}} = \frac{1}{10\sqrt{2}} = \frac{\sqrt{2}}{20} \approx \frac{1,414}{20} \approx 0,0707$.
$$I_c \approx [0,7 - 0,0707 ; 0,7 + 0,0707]$$$$I_c \approx [0,6293 ; 0,7707]$$L'intervalle de confiance asymptotique au niveau de confiance de 95% est $[0,6293 ; 0,7707]$.
Conclusion quant à l'affirmation du fabricant :
Le fabricant affirme que la proportion de yaourts conformes est de 80%, soit $p_0 = 0,8$.
Nous comparons cette valeur à l'intervalle de confiance calculé $I_c \approx [0,6293 ; 0,7707]$.
On constate que $p_0 = 0,8$ n'appartient pas à l'intervalle $I_c$, car $0,8 > 0,7707$.
Puisque la proportion annoncée par le fabricant ($p_0 = 0,8$) n'appartient pas à l'intervalle de confiance, on peut rejeter l'affirmation du fabricant au niveau de confiance de 95%. Il y a un risque d'erreur de 5% en affirmant que la proportion réelle de yaourts conformes est différente de 80%.
Questions fréquentes
Quelle est la différence entre un intervalle de confiance et un intervalle de fluctuation ?
Pourquoi le niveau de confiance est-il souvent de 95% ?
Que se passe-t-il si les conditions d'application ne sont pas vérifiées ?
Peut-on dire que la proportion $p$ est égale à $f$ ?
Pour aller plus loin
Vous bloquez sur ce chapitre ?
Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.