Définition
Soit $X$ une variable aléatoire suivant une loi binomiale $\mathcal{B}(n, p)$, où $n$ est le nombre de répétitions d'une épreuve de Bernoulli et $p$ est la probabilité de succès. L'intervalle de fluctuation asymptotique au seuil de $95\%$ pour la fréquence observée $F = \frac{X}{n}$ est un intervalle centré en $p$ tel que la probabilité que $F$ appartienne à cet intervalle est d'environ $0,95$. Pour $n$ suffisamment grand ($n \geq 30$, $np \geq 5$, $n(1-p) \geq 5$), cet intervalle est donné par $\left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$.
Méthode — L\'intervalle de fluctuation au seuil 95% (loi $B(n,p)$)
Vérifier les conditions d'application
Pour pouvoir utiliser l'intervalle de fluctuation asymptotique, il est impératif de vérifier les trois conditions suivantes :
- $n \geq 30$ (taille de l'échantillon suffisamment grande)
- $np \geq 5$ (nombre attendu de succès suffisamment grand)
- $n(1-p) \geq 5$ (nombre attendu d'échecs suffisamment grand)
Calculer les bornes de l'intervalle
Une fois les conditions vérifiées, on calcule les bornes de l'intervalle de fluctuation $I = \left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$. Il est important de bien identifier $n$ (taille de l'échantillon) et $p$ (probabilité théorique du succès). Le coefficient $1,96$ est associé au seuil de $95\%$ pour une loi normale centrée réduite.
Calculer la fréquence observée
Dans une situation concrète, on dispose d'un échantillon de taille $n$ et on observe un nombre $k$ de succès. La fréquence observée est alors $f_{obs} = \frac{k}{n}$. Cette fréquence est celle que l'on va comparer à l'intervalle de fluctuation.
Prendre une décision
On compare la fréquence observée $f_{obs}$ à l'intervalle de fluctuation $I$.
- Si $f_{obs} \in I$, on considère que l'échantillon est compatible avec l'hypothèse de la probabilité $p$ au seuil de $95\%$.
- Si $f_{obs} \notin I$, on considère que l'échantillon n'est pas compatible avec l'hypothèse de la probabilité $p$ au seuil de $95\%$. Cela signifie que l'hypothèse initiale est remise en question.
Exemple résolu
Une entreprise fabrique des ampoules. Le service qualité affirme que la proportion d'ampoules défectueuses est de $p = 0,04$. Pour vérifier cette affirmation, un contrôleur prélève un échantillon aléatoire de $n = 200$ ampoules et en trouve $12$ défectueuses. L'affirmation du service qualité est-elle remise en question au seuil de $95\%$ ?
- $n = 200 \geq 30$ (condition vérifiée)
- $np = 200 \times 0,04 = 8 \geq 5$ (condition vérifiée)
- $n(1-p) = 200 \times (1-0,04) = 200 \times 0,96 = 192 \geq 5$ (condition vérifiée)
On calcule la valeur de $\frac{\sqrt{p(1-p)}}{\sqrt{n}}$ :
$\frac{\sqrt{0,04(1-0,04)}}{\sqrt{200}} = \frac{\sqrt{0,04 \times 0,96}}{\sqrt{200}} = \frac{\sqrt{0,0384}}{\sqrt{200}} \approx \frac{0,19596}{14,142} \approx 0,01386$.
Maintenant, on calcule les bornes :
Borne inférieure : $0,04 - 1,96 \times 0,01386 \approx 0,04 - 0,0271656 \approx 0,0128344$.
Borne supérieure : $0,04 + 1,96 \times 0,01386 \approx 0,04 + 0,0271656 \approx 0,0671656$.
L'intervalle de fluctuation est $I \approx [0,0128 ; 0,0672]$ (arrondi à $10^{-4}$).
La fréquence observée est $f_{obs} = \frac{12}{200} = 0,06$.
On constate que $0,0128 \leq 0,06 \leq 0,0672$.
La fréquence observée appartient à l'intervalle de fluctuation. Par conséquent, l'échantillon est compatible avec l'hypothèse que la proportion d'ampoules défectueuses est de $4\%$ au seuil de $95\%$. L'affirmation du service qualité n'est pas remise en question.
La fréquence observée de $0,06$ appartient à l'intervalle de fluctuation $[0,0128 ; 0,0672]$. L'affirmation du service qualité n'est donc pas remise en question au seuil de $95\%$.
⚠️ Piège fréquent au BAC — Confusion entre intervalle de fluctuation et de confiance
- L'intervalle de fluctuation est centré sur la proportion théorique $p$ et permet de juger si un échantillon est compatible avec cette proportion. Il est utilisé pour tester une hypothèse.
- L'intervalle de confiance est centré sur la fréquence observée $f_{obs}$ et permet d'estimer la proportion théorique $p$ inconnue dans la population. Il est utilisé pour estimer une valeur.
- Ne pas vérifier les conditions d'application ($n \geq 30$, $np \geq 5$, $n(1-p) \geq 5$) avant d'utiliser la formule asymptotique. Si elles ne sont pas remplies, la formule n'est pas valide.
Exercice type BAC
Un laboratoire pharmaceutique affirme qu'un nouveau médicament est efficace dans $80\%$ des cas. Pour vérifier cette affirmation, un organisme indépendant mène une étude sur un échantillon de $150$ patients ayant pris ce médicament.
- Vérifier que les conditions d'application de l'intervalle de fluctuation asymptotique au seuil de $95\%$ sont satisfaites.
- Déterminer l'intervalle de fluctuation asymptotique au seuil de $95\%$ de la fréquence des succès pour un échantillon de $150$ patients. On arrondira les bornes à $10^{-3}$.
- Sur les $150$ patients de l'étude, $108$ ont vu leur état s'améliorer grâce au médicament. Que peut-on conclure quant à l'affirmation du laboratoire au seuil de $95\%$ ?
Vérification des conditions d'application :
On a $n = 150$ (taille de l'échantillon) et $p = 0,80$ (probabilité théorique de succès).
- $n = 150 \geq 30$. La première condition est satisfaite.
- $np = 150 \times 0,80 = 120$. Comme $120 \geq 5$, la deuxième condition est satisfaite.
- $n(1-p) = 150 \times (1-0,80) = 150 \times 0,20 = 30$. Comme $30 \geq 5$, la troisième condition est satisfaite.
Toutes les conditions sont remplies, on peut donc utiliser l'intervalle de fluctuation asymptotique.
Détermination de l'intervalle de fluctuation :
L'intervalle de fluctuation asymptotique au seuil de $95\%$ est donné par la formule :
$$I = \left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$$
Avec $n = 150$ et $p = 0,80$, on calcule d'abord l'écart-type de la fréquence :
$$\frac{\sqrt{p(1-p)}}{\sqrt{n}} = \frac{\sqrt{0,80(1-0,80)}}{\sqrt{150}} = \frac{\sqrt{0,80 \times 0,20}}{\sqrt{150}} = \frac{\sqrt{0,16}}{\sqrt{150}} = \frac{0,4}{\sqrt{150}}$$
$$\frac{0,4}{\sqrt{150}} \approx \frac{0,4}{12,247} \approx 0,03266$$
Maintenant, on calcule les bornes de l'intervalle :
Borne inférieure : $0,80 - 1,96 \times 0,03266 \approx 0,80 - 0,06401 \approx 0,73599$
Borne supérieure : $0,80 + 1,96 \times 0,03266 \approx 0,80 + 0,06401 \approx 0,86401$
En arrondissant à $10^{-3}$, l'intervalle de fluctuation est $I \approx [0,736 ; 0,864]$.
Conclusion :
Le nombre de succès observés est $108$ sur $150$ patients. La fréquence observée est :
$$f_{obs} = \frac{108}{150} = 0,72$$
On compare cette fréquence à l'intervalle de fluctuation $I \approx [0,736 ; 0,864]$.
On constate que $f_{obs} = 0,72$ n'appartient pas à l'intervalle $I$, car $0,72 < 0,736$.
Par conséquent, au seuil de $95\%$, la fréquence observée n'est pas compatible avec l'affirmation du laboratoire selon laquelle le médicament est efficace dans $80\%$ des cas. L'affirmation du laboratoire est remise en question.
Questions fréquentes
Pourquoi utilise-t-on $1,96$ dans la formule de l'intervalle de fluctuation ?
Quelle est la différence entre un intervalle de fluctuation et un intervalle de confiance ?
Que signifie 'au seuil de $95\%$' ?
Que faire si les conditions d'application ne sont pas remplies ?
Pour aller plus loin
Vous bloquez sur ce chapitre ?
Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.