L’hypothèse nulle () correspond à l’hypothèse d’absence d’effet de notre VI sur notre VD (), on est alors dans le cas par défaut, et la variabilité observée pour la VD est celle du hasard, dont la distribution suit une loi normale:
L’hypothèse alternative () correspond à celle où la VI a une influence sur la VD (ex: ).
*On suppose alors que les deux hypothèses sont complémentaires l’une de l’autre donc rejeter l’une revient à accepter l’autre: on va chercher à rejeter .
C’est la probabilité, pour un modèle statistique donné, sous l’hypothèse nulle d’obtenir une valeur au moins aussi extrême que celle observée.
Le seuil correspond à un critère de décision fixé arbitrairement (à 0.05 en général) :
Si la p-value est inférieur ou égale à α, alors il y a « probablement » une différence entre la valeur calculée et la valeur théorique, donc les groupes diffèrent. On parle d’effet significatif.
Sinon, il n’y a pas une différence « suffisamment probable » entre la valeur calculée et la valeur théorique, on admet que les groupes ne diffèrent pas. C’est un effet non-significatif, une absence d’effet.
Effet principal: c’est l’effet que produit une VI sur une VD, c’est-à-dire sans considération des autres potentiels facteurs (= VI).
Effet d’interaction: c’est l’effet que produit une VI sur une VD dépendamment de l’état d’une seconde VI, en sachant que ça ne peut être le cas que lorsque ces VI ne sont pas additives : l’interaction est le produit d’une dépendance entre deux variables indépendantes produisant un effet sur une VD. Il ne s’agit pas d’une somme, le produit doit être différent de la somme des VI.
Effet simple: c’est l’effet que produit une VI sur une VD, lorsqu’on ne considère qu’un seul niveau de l’autre VI. Autrement dit, c’est l’effet d’une VI sur une VD en supposant la constance d’une modalité de l’autre VI
Taille d’effet
d de Cohen : Taille d’effet, ampleur de l’influence de notre VI sur notre VD normalisée par la variabilité dans l’échantillon; définie dans le cadre d’un test T de Student par : avec l’erreur standard (écart-type..?).
Normalité: les distributions des résidus (différences entre chaque individu et son groupe) doivent être normales. (visible graphiquement par Q-Q plot, graphique Quantile par Quantile, si les résidus sont réparties selon une loi normale, les échantillons apparaissent le long de la ligne sur le Q-Q plot.) (Si non respect: transformer les données, par exemple avec une fonction log pour restaurer la normalité)
Indépendance: Euuuh plus dur à expliquer on skip..
Homogénéité: les variances des différents groupes doivent être égales (afin que la seule différence entre les groupes soit bien leur moyenne (T-test)) → Permet une interprétation correcte des résultats. (Si non respect : Test de Welch, peu apprécié plutôt que Student, sinon U de Mann&Whitney, Note : pas de test d’interaction pour ces tests non paramétriques.)