L'intervalle de fluctuation au seuil 95% (loi binomiale) – Fiche BAC Terminale Maths

Q: Pourquoi utilise-t-on $1,96$ dans la formule de l'intervalle de fluctuation ?

Le coefficient $1,96$ est un quantile de la loi normale centrée réduite $\mathcal{N}(0,1)$. Il correspond à la valeur $z$ telle que $P(-z \leq Z \leq z) \approx 0,95$ pour une variable aléatoire $Z$ suivant une loi $\mathcal{N}(0,1)$. C'est une valeur standard pour un seuil de $95\%$.

Q: Quelle est la différence entre un intervalle de fluctuation et un intervalle de confiance ?

L'intervalle de fluctuation est utilisé pour tester une hypothèse sur une proportion $p$ connue. Il permet de déterminer si un échantillon observé est compatible avec cette proportion. L'intervalle de confiance est utilisé pour estimer une proportion $p$ inconnue à partir d'un échantillon observé. Il donne une plage de valeurs probables pour $p$.

Q: Que signifie 'au seuil de $95\%$' ?

Cela signifie qu'il y a $95\%$ de chances que la fréquence observée d'un échantillon aléatoire appartienne à cet intervalle, si l'hypothèse sur la proportion $p$ est vraie. Il y a donc $5\%$ de risque de rejeter à tort l'hypothèse (risque d'erreur de première espèce).

Q: Que faire si les conditions d'application ne sont pas remplies ?

Si les conditions $n \geq 30$, $np \geq 5$ et $n(1-p) \geq 5$ ne sont pas remplies, l'approximation de la loi binomiale par la loi normale n'est pas valide. Dans ce cas, la formule de l'intervalle de fluctuation asymptotique ne peut pas être utilisée. Il faudrait alors utiliser des méthodes exactes basées sur la loi binomiale elle-même, ou des tables statistiques, ce qui est généralement hors programme au lycée.

Définition

Soit $X$ une variable aléatoire suivant une loi binomiale $\mathcal{B}(n, p)$, où $n$ est le nombre de répétitions d'une épreuve de Bernoulli et $p$ est la probabilité de succès. L'intervalle de fluctuation asymptotique au seuil de $95\%$ pour la fréquence observée $F = \frac{X}{n}$ est un intervalle centré en $p$ tel que la probabilité que $F$ appartienne à cet intervalle est d'environ $0,95$. Pour $n$ suffisamment grand ($n \geq 30$, $np \geq 5$, $n(1-p) \geq 5$), cet intervalle est donné par $\left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$.

💡 Bon réflexe : Toujours vérifier les conditions d'application ($n \geq 30$, $np \geq 5$, $n(1-p) \geq 5$) avant de calculer et d'utiliser l'intervalle de fluctuation asymptotique.

Méthode — L\'intervalle de fluctuation au seuil 95% (loi $B(n,p)$)

Vérifier les conditions d'application

Pour pouvoir utiliser l'intervalle de fluctuation asymptotique, il est impératif de vérifier les trois conditions suivantes :

$n \geq 30$ (taille de l'échantillon suffisamment grande)
$np \geq 5$ (nombre attendu de succès suffisamment grand)
$n(1-p) \geq 5$ (nombre attendu d'échecs suffisamment grand)

Si ces conditions ne sont pas remplies, l'approximation par la loi normale n'est pas valide et l'intervalle de fluctuation ne peut pas être calculé par cette formule.

Calculer les bornes de l'intervalle

Une fois les conditions vérifiées, on calcule les bornes de l'intervalle de fluctuation $I = \left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$. Il est important de bien identifier $n$ (taille de l'échantillon) et $p$ (probabilité théorique du succès). Le coefficient $1,96$ est associé au seuil de $95\%$ pour une loi normale centrée réduite.

Calculer la fréquence observée

Dans une situation concrète, on dispose d'un échantillon de taille $n$ et on observe un nombre $k$ de succès. La fréquence observée est alors $f_{obs} = \frac{k}{n}$. Cette fréquence est celle que l'on va comparer à l'intervalle de fluctuation.

Prendre une décision

On compare la fréquence observée $f_{obs}$ à l'intervalle de fluctuation $I$.

Si $f_{obs} \in I$, on considère que l'échantillon est compatible avec l'hypothèse de la probabilité $p$ au seuil de $95\%$.
Si $f_{obs} \notin I$, on considère que l'échantillon n'est pas compatible avec l'hypothèse de la probabilité $p$ au seuil de $95\%$. Cela signifie que l'hypothèse initiale est remise en question.

Exemple résolu

Une entreprise fabrique des ampoules. Le service qualité affirme que la proportion d'ampoules défectueuses est de $p = 0,04$. Pour vérifier cette affirmation, un contrôleur prélève un échantillon aléatoire de $n = 200$ ampoules et en trouve $12$ défectueuses. L'affirmation du service qualité est-elle remise en question au seuil de $95\%$ ?

Vérifier les conditions d'application de l'intervalle de fluctuation asymptotique.

On a $n = 200$ et $p = 0,04$.

$n = 200 \geq 30$ (condition vérifiée)
$np = 200 \times 0,04 = 8 \geq 5$ (condition vérifiée)
$n(1-p) = 200 \times (1-0,04) = 200 \times 0,96 = 192 \geq 5$ (condition vérifiée)

Toutes les conditions sont remplies, on peut donc utiliser l'intervalle de fluctuation asymptotique.

Calculer les bornes de l'intervalle de fluctuation au seuil de $95\%$.

L'intervalle de fluctuation est donné par $\left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$.
On calcule la valeur de $\frac{\sqrt{p(1-p)}}{\sqrt{n}}$ :
$\frac{\sqrt{0,04(1-0,04)}}{\sqrt{200}} = \frac{\sqrt{0,04 \times 0,96}}{\sqrt{200}} = \frac{\sqrt{0,0384}}{\sqrt{200}} \approx \frac{0,19596}{14,142} \approx 0,01386$.
Maintenant, on calcule les bornes :
Borne inférieure : $0,04 - 1,96 \times 0,01386 \approx 0,04 - 0,0271656 \approx 0,0128344$.
Borne supérieure : $0,04 + 1,96 \times 0,01386 \approx 0,04 + 0,0271656 \approx 0,0671656$.
L'intervalle de fluctuation est $I \approx [0,0128 ; 0,0672]$ (arrondi à $10^{-4}$).

Calculer la fréquence observée dans l'échantillon.

Le contrôleur a trouvé $12$ ampoules défectueuses sur un échantillon de $200$.
La fréquence observée est $f_{obs} = \frac{12}{200} = 0,06$.

Prendre une décision.

On compare la fréquence observée $f_{obs} = 0,06$ avec l'intervalle de fluctuation $I \approx [0,0128 ; 0,0672]$.
On constate que $0,0128 \leq 0,06 \leq 0,0672$.
La fréquence observée appartient à l'intervalle de fluctuation. Par conséquent, l'échantillon est compatible avec l'hypothèse que la proportion d'ampoules défectueuses est de $4\%$ au seuil de $95\%$. L'affirmation du service qualité n'est pas remise en question.

La fréquence observée de $0,06$ appartient à l'intervalle de fluctuation $[0,0128 ; 0,0672]$. L'affirmation du service qualité n'est donc pas remise en question au seuil de $95\%$.

⚠️ Piège fréquent au BAC — Confusion entre intervalle de fluctuation et de confiance

L'intervalle de fluctuation est centré sur la proportion théorique $p$ et permet de juger si un échantillon est compatible avec cette proportion. Il est utilisé pour tester une hypothèse.
L'intervalle de confiance est centré sur la fréquence observée $f_{obs}$ et permet d'estimer la proportion théorique $p$ inconnue dans la population. Il est utilisé pour estimer une valeur.
Ne pas vérifier les conditions d'application ($n \geq 30$, $np \geq 5$, $n(1-p) \geq 5$) avant d'utiliser la formule asymptotique. Si elles ne sont pas remplies, la formule n'est pas valide.

Exercice type BAC

Un laboratoire pharmaceutique affirme qu'un nouveau médicament est efficace dans $80\%$ des cas. Pour vérifier cette affirmation, un organisme indépendant mène une étude sur un échantillon de $150$ patients ayant pris ce médicament.

Vérifier que les conditions d'application de l'intervalle de fluctuation asymptotique au seuil de $95\%$ sont satisfaites.
Déterminer l'intervalle de fluctuation asymptotique au seuil de $95\%$ de la fréquence des succès pour un échantillon de $150$ patients. On arrondira les bornes à $10^{-3}$.
Sur les $150$ patients de l'étude, $108$ ont vu leur état s'améliorer grâce au médicament. Que peut-on conclure quant à l'affirmation du laboratoire au seuil de $95\%$ ?

Vérification des conditions d'application :
On a $n = 150$ (taille de l'échantillon) et $p = 0,80$ (probabilité théorique de succès).
- $n = 150 \geq 30$. La première condition est satisfaite.
- $np = 150 \times 0,80 = 120$. Comme $120 \geq 5$, la deuxième condition est satisfaite.
- $n(1-p) = 150 \times (1-0,80) = 150 \times 0,20 = 30$. Comme $30 \geq 5$, la troisième condition est satisfaite.
Toutes les conditions sont remplies, on peut donc utiliser l'intervalle de fluctuation asymptotique.
Détermination de l'intervalle de fluctuation :
L'intervalle de fluctuation asymptotique au seuil de $95\%$ est donné par la formule :
$$I = \left[ p - 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} ; p + 1,96 \frac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$$
Avec $n = 150$ et $p = 0,80$, on calcule d'abord l'écart-type de la fréquence :
$$\frac{\sqrt{p(1-p)}}{\sqrt{n}} = \frac{\sqrt{0,80(1-0,80)}}{\sqrt{150}} = \frac{\sqrt{0,80 \times 0,20}}{\sqrt{150}} = \frac{\sqrt{0,16}}{\sqrt{150}} = \frac{0,4}{\sqrt{150}}$$
$$\frac{0,4}{\sqrt{150}} \approx \frac{0,4}{12,247} \approx 0,03266$$
Maintenant, on calcule les bornes de l'intervalle :
Borne inférieure : $0,80 - 1,96 \times 0,03266 \approx 0,80 - 0,06401 \approx 0,73599$
Borne supérieure : $0,80 + 1,96 \times 0,03266 \approx 0,80 + 0,06401 \approx 0,86401$
En arrondissant à $10^{-3}$, l'intervalle de fluctuation est $I \approx [0,736 ; 0,864]$.
Conclusion :
Le nombre de succès observés est $108$ sur $150$ patients. La fréquence observée est :
$$f_{obs} = \frac{108}{150} = 0,72$$
On compare cette fréquence à l'intervalle de fluctuation $I \approx [0,736 ; 0,864]$.
On constate que $f_{obs} = 0,72$ n'appartient pas à l'intervalle $I$, car $0,72 < 0,736$.
Par conséquent, au seuil de $95\%$, la fréquence observée n'est pas compatible avec l'affirmation du laboratoire selon laquelle le médicament est efficace dans $80\%$ des cas. L'affirmation du laboratoire est remise en question.

Questions fréquentes

Pourquoi utilise-t-on $1,96$ dans la formule de l'intervalle de fluctuation ?

Le coefficient $1,96$ est un quantile de la loi normale centrée réduite $\mathcal{N}(0,1)$. Il correspond à la valeur $z$ telle que $P(-z \leq Z \leq z) \approx 0,95$ pour une variable aléatoire $Z$ suivant une loi $\mathcal{N}(0,1)$. C'est une valeur standard pour un seuil de $95\%$.

Quelle est la différence entre un intervalle de fluctuation et un intervalle de confiance ?

L'intervalle de fluctuation est utilisé pour tester une hypothèse sur une proportion $p$ connue. Il permet de déterminer si un échantillon observé est compatible avec cette proportion. L'intervalle de confiance est utilisé pour estimer une proportion $p$ inconnue à partir d'un échantillon observé. Il donne une plage de valeurs probables pour $p$.

Que signifie 'au seuil de $95\%$' ?

Cela signifie qu'il y a $95\%$ de chances que la fréquence observée d'un échantillon aléatoire appartienne à cet intervalle, si l'hypothèse sur la proportion $p$ est vraie. Il y a donc $5\%$ de risque de rejeter à tort l'hypothèse (risque d'erreur de première espèce).

Que faire si les conditions d'application ne sont pas remplies ?

Si les conditions $n \geq 30$, $np \geq 5$ et $n(1-p) \geq 5$ ne sont pas remplies, l'approximation de la loi binomiale par la loi normale n'est pas valide. Dans ce cas, la formule de l'intervalle de fluctuation asymptotique ne peut pas être utilisée. Il faudrait alors utiliser des méthodes exactes basées sur la loi binomiale elle-même, ou des tables statistiques, ce qui est généralement hors programme au lycée.

Pour aller plus loin

Vous bloquez sur ce chapitre ?

Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.

📞 Appeler Cours Terminale →