
Effectuer un test de Student dans R
Introduction
Lorsqu’il s’agit de comparer des moyennes entre deux groupes de données (ex. moyenne d’âge, notes moyennes de deux classes, le chiffre d’affaire moyen entre deux entreprises), le test de Student (test t de student ou t-test) est une méthode incontournable en analyse statistique. Que vous soyez étudiant, chercheur ou analyste, il est fréquent de devoir évaluer si une différence observée entre deux échantillons est significative ou simplement due au hasard. Imaginez que vous étudiez l’impact d’une formation en ligne sur les performances d’un groupe d’apprenants : comment déterminer si la différence est réelle ? Grâce au test
de Student dans R, vous avez la réponse.
Dans cet article, découvrez un guide complet pour effectuer un test de Student dans R, accompagné
d’exemples concrets et de morceaux de code pour une application immédiate.
Qu’est-ce qu’un test de Student ?
Le test de Student, également connu sous le nom de t-test ou test t de student, est une méthode statistique utilisée pour
comparer les moyennes de deux échantillons et évaluer si ces différences sont statistiquement significatives.
En d’autres termes, il permet de répondre à la question : « La différence entre ces deux groupes est-elle
due au hasard ou à une cause réelle ?«
Quand utiliser le test de Student ?

- Comparaison entre deux groupes indépendants : Par exemple, comparer les scores de deux classes différentes.
- Comparaison de moyennes appariées : Par exemple, évaluer les performances avant et après une formation chez le même groupe.
- Hypothèses de normalité : Le t-test suppose que les données suivent une distribution normale.
Comment effectuer un test de Student dans R ?
Préparer les données pour le t-test
# Données simulées
groupe_A <- c(12, 15, 14, 10, 13, 12, 11)
groupe_B <- c(14, 17, 13, 15, 18, 14, 16)
# Visualisation rapide des données
boxplot(groupe_A, groupe_B,
names = c("Groupe A", "Groupe B"),
main = "Comparaison des scores")

Effectuer un t-test pour deux groupes indépendants
# Test de Student
resultat <- t.test(groupe_A, groupe_B)
# Résultat
print(resultat)
# Exemple de sortie
Welch Two Sample t-test
data: groupe_A and groupe_B
t = -3.0382, df = 11.974, p-value = 0.01033
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.9065845 -0.8077013
sample estimates:
mean of x mean of y
12.42857 15.28571
La p-value de 0,010 (< 0,05) indique une différence statistiquement significative entre les moyennes des deux groupes, permettant de rejeter l’hypothèse nulle. Autrement dit, La différence entre les deux groupes est réelle et significative, ce n’est pas dû au hasard.
Effectuer un t-test pour des données appariées
# Données appariées
avant <- c(10, 12, 11, 13, 12, 10, 14)
apres <- c(13, 15, 14, 14, 15, 13, 16)
# Test de Student apparié
t.test(avant, apres, paired = TRUE)
Paired t-test
data: avant and apres
t = -8.6469, df = 6, p-value = 0.0001318
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.299093 -1.843764
sample estimates:
mean of the differences
-2.571429
Les résultats montrent une différence claire et significative entre les mesures avant et après. Cette différence n’est pas due au hasard, et on peut être très confiant (à 95 %) que la vraie différence se situe entre -3,30 et -1,84.
Pour info, pour un test apparié (Paired t-test) : On compare les mêmes individus ou éléments avant et après une intervention.
Interpréter les résultats du t-test
Les valeurs clés à comprendre
- P-value : Si elle est inférieure à 0,05 (5%), la différence est significative.
- T-statistic : Mesure la magnitude de la différence relative à la variance.
- Intervalle de confiance : Indique la plage dans laquelle se situe la différence de moyenne.
Astuce
Si vos données ne respectent pas les hypothèses de normalité, envisagez d’utiliser
un test non paramétrique comme le test de Wilcoxon.
Visualiser vos résultats avec des graphiques dans R
Histogramme des distributions
# Histogrammes
hist(groupe_A, main = "Distribution du Groupe A", col = "blue", xlab = "Scores")
hist(groupe_B, main = "Distribution du Groupe B", col = "red", xlab = "Scores")

Envie de tester tous le code en ligne ?
Se rendre sur RDRR.IO et coller le code ci-dessous dans la case affichée puis cliquez sur RUN.

# Données simulées
groupe_A <- c(12, 15, 14, 10, 13, 12, 11)
groupe_B <- c(14, 17, 13, 15, 18, 14, 16)
# Visualisation rapide des données
boxplot(groupe_A, groupe_B,
names = c("Groupe A", "Groupe B"),
main = "Comparaison des scores")
# Test de Student
resultat <- t.test(groupe_A, groupe_B)
# Résultat
print(resultat)
# Données appariées
avant <- c(10, 12, 11, 13, 12, 10, 14)
apres <- c(13, 15, 14, 14, 15, 13, 16)
# Test de Student apparié
t.test(avant, apres, paired = TRUE)
# Histogrammes
hist(groupe_A, main = "Distribution du Groupe A", col = "blue", xlab = "Scores")
hist(groupe_B, main = "Distribution du Groupe B", col = "red", xlab = "Scores")
Vidéo YouTube
Conclusion
Le test de Student est un outil puissant pour comparer des moyennes et tirer des conclusions solides à partir
de vos données. En utilisant R, vous pouvez effectuer ces analyses rapidement tout en bénéficiant d’une
flexibilité exceptionnelle pour explorer vos résultats.
Vous souhaitez aller plus loin ? Découvrez nos formations sur R et la statistique appliquée pour maîtriser les bases
de l’analyse de données et booster vos compétences. Cliquez ici pour en savoir plus !