Connexion à votre espace

Sensibilité et difficulté d’un test psychotechnique

Indice de sensibilité

Un test psychotechnique est considéré comme sensible s’il permet de distinguer des sujets de niveaux différents sur une même dimension psychologique, comme par exemple l’intelligence. On considère que les dimensions psychologiques se répartissent dans la population selon une loi normale (une courbe de Gauss) comme l’indique cette figure :

Courbe de Gauss indice de sensibilité d'un test psychotechnique

Soit une épreuve notée sur 60 points. On doit aboutir à une certaine répartition des sujets : une faible proportion de sujets doit se trouver sur la gauche de la courbe (c’est-à-dire obtenir des scores faibles au test), symétriquement une proportion identique doit se situer sur la droite (scores élevés), avec vers le centre une majorité de sujets (scores autour de la moyenne), et une décroissance progressive des effectifs du centre vers les deux extrémités. Dans la phase d’élaboration d’une épreuve, les questions ou items sont donc sélectionnés pour assurer cette discrimination entre les sujets. Un test d’intelligence comportera ainsi des items de niveaux de difficulté variables de manière à différencier efficacement les sujets en fonction de leur réussite. Ici va intervenir la notion de difficulté de l’épreuve. Pour assurer une sensibilité maximale, un test doit présenter un niveau moyen de difficulté par rapport au niveau de la population auquel il est destiné. Il faut éviter par exemple « l’effet plafond », qui correspond à une épreuve trop facile (tous les sujets obtiennent alors de bons scores, il n’y a donc pas discrimination), ainsi que l’effet inverse, « l’effet plancher », qui correspond à une épreuve trop difficile dans laquelle tous les sujets obtiennent des notes basses. Dans ces deux situations la différenciation des sujets n’est pas réalisée de façon satisfaisante et le test n’a alors que peu d’utilité. Cette finesse de la mesure est également liée au nombre de questions de l’épreuve : plus une épreuve comportera de questions, plus elle permettra d’effectuer une différenciation fine entre les sujets.

Indice de difficulté

Si 60 sujets sur 110 réussissent la question A, l’indice de difficulté de A est de 60/110 = 0,545 soit 54,5 % de réussite. Cela correspond à une question de difficulté moyenne, car elle a été réussie par un peu plus de la moitié des sujets de l'échantillon. Si seulement 35 sujets réussissent la question B, l’indice de difficulté de B est de 35/110 = 0,318 soit 31,8 %. La question B, qui présente un indice de réussite plus faible, est donc plus difficile que la question A.

On considère qu’une question a un bon pouvoir discriminant lorsque l’indice de difficulté est proche de 50 %. Une valeur plus élevée témoigne d’un niveau de difficulté plus faible, et inversement une valeur plus faible témoigne d’un niveau de difficulté plus élevé.

Pour assurer un bon niveau de sensibilité du test, on considère que l’épreuve, au total, doit présenter un niveau de difficulté moyen. Pour arriver à ce résultat, on sélectionne les items dont la fréquence de réussite est comprise entre 30 et 70 % environ. Mais l’épreuve doit comporter également des items plus faciles, qui seront placés généralement en début d’épreuve (afin de motiver les sujets), et qui permettent de distinguer les sujets de faible niveau, et des items plus difficiles, placés généralement plutôt en fin d’épreuve, qui serviront à différencier les sujets de niveau de compétence plus élevée.