Analiza statystyczna wyników całego egzaminu będącego wskaźnikiem jego  jakości jak i oceny poszczególnych testów wchodzących w jego skład bierze pod uwagę następujące wskaźniki.

 

Wskaźnik trudności zadania

Wskaźnik ten przyjmuje wartości od 0 (dla skrajnie trudnych zadań) do 1 (dla skrajnie łatwych zadań). Nie jest on tożsamy z procentem poprawnych odpowiedzi, gdyż nie uwzględnia odpowiedzi udzielonych przez zdających z przeciętnymi wynikami testu.

 

Dolna granica

Górna granica

trudne

0

0,49

średnie

0,5

0,69

łatwe

0,7

0,89

b. łatwe

0,9

1

Inna skala

 

Dolna granica

Górna granica

trudne

0

0,39

srednie

0,4

0,75

latwe

0,76

0,9

b. latwe

0,91

1

 

Wskaźnik trudności całego testu

Wskaźnik trudności całego testu jest obliczany jako średnia wartość wskaźników trudności poszczególnych zadań.

 

Dolna granica

Górna granica

trudne

0

0,4

Umiarkowanie trudny

0,401

0,75

latwe

>0,75

1

 

Moc różnicująca zadania

Moc różnicująca zadania - Wskaźnik mocy różnicującej pokazuje nam, jak silnie zadanie związane jest z całym testem. Im zadanie jest silniej związane z wynikiem dla całego testu, tym jego zdolność przewidywania wyniku prawdziwego jest większa. Dobre pomiarowo zadania powinny być silnie związane z całym testem. Jeżeli zadanie jest słabo (a w skrajnych przypadkach ujemnie) związane z całym testem, może to oznaczać, iż mierzy ono jakąś inną umiejętność, niż zaplanowali konstruktorzy testu, lub jest źle skonstruowane, może być nawet błędne pod względem merytorycznym. Brak związku zadania z całym testem oznacza, że uczniowie uzyskujący wysokie wyniki z całego testu (z innych zadań) nie uzyskują równie dobrych wyników przy rozwiązywaniu danego zadania i analogicznie – uczniowie uzyskujący słabe wyniki z całego testu nie uzyskują równie słabych wyników przy rozwiązywaniu zadania o niskiej mocy różnicującej.
W sytuacji skrajnej, lecz zdarzającej się w praktyce, gdy moc różnicująca danego zadania jest ujemna, oznacza to, iż uczniowie uzyskujący wysokie wyniki z całego testu rozwiązują źle zadanie o ujemnej mocy różnicującej, a uczniowie o niskich wynikach z całego testu rozwiązują to zadanie dobrze (dobrze według zamysłu autora lub schematu punktowania).

 

Podsumowując:

Moc różnicująca zadania - zdolność zadania do rozróżniania uczniów według ich ogólnych osiągnięć z wybranego zakresu programowego. Jeżeli dane zadanie rozwiązują zarówno uczniowie dobrzy, jak i słabi (lub go nie rozwiązują), to ma ono niewielką moc różnicującą. Zadanie testowe ma dużą moc różnicującą, jeżeli rozwiązują je tylko uczniowie najlepsi.

Moc różnicująca zadania mierzymy przy pomocy testu korelacji punktowo-dwuseryjnej

Wskaźnik korelacji punktowo-dwuseryjnej - Wskaźnik ten przyjmuje wartości od -1 do 1 i powinien mieć wartość dodatnią dla odpowiedzi poprawnej oraz wartości ujemne dla odpowiedzi niepoprawnych (dystraktorów).
Najogólniej ujmując pokazuje on relacje pomiędzy wynikiem całego testu a wyborem konkretnej odpowiedzi w danym zadaniu.

 

Dolna granica

Górna granica

test zły

< 0

0,1

test dobry

0,1

0,22

test rzetelny

0,22

0,4

wysoka rzetelność

0,4

1

Uwaga: wyniki wskaźnika różnicującego są najbardziej wiarygodne gdy wskaźnik trudności ma  wartość 0.5. Im większa jest różnica pomiędzy wyliczonym dla pytana wskaźnikiem trudności a wartością 0.5 tym mniej dokładna jest ocena trafności pytania za pomocą wskaźnika różnicującego

Dla oceny całego testu stosujemyWskaźnik Kudera-Richardsona (KR20)

Wskaźnik Kudera-Richardsona (KR20):

Wskaźnik KR20 oczywiście jest obliczany dla całego testu a nie poszczególnych zadań. Jest on powszechnie stosowany jako miara rzetelności testu. Może być interpretowany jak współczynnik korelacji wskazujący na spójność w odpowiedziach na poszczególne zadania dla wszystkich egzaminowanych. W związku z tym jego wartość jest obniżana przez zadania o ujemnym wskaźniku mocy dyskryminacyjnej.

 

Dolna granica

Górna granica

Test nierzetelny

0

0,4

test rzetelny

0,41

0,8

test bardzo rzetelny

0,81

0,9

Test wysokiej rzetelności

0,91

1

 

Wskaźnik mocy dyskryminacyjnej - jest to stopień w jakim dana pozycja testowa różnicuje badana populację

Pozycja testowa o dodatniej mocy różnicującej jest częściej rozwiązywana przez badanych o wysokich wynikach testowania, a więc różnicuje badanych w zgodzie z innymi pozycjami testu i zwiększa wariancję wyników testowania. Pozycja testowa o ujemnej mocy różnicującej jest częściej rozwiązywana przez badanych o niskich wynikach testowania, a więc różnicuje badanych przeciwnie niż inne pozycje testu i zmniejsza wariancję wyników testowania.

Wskaźnik ten przyjmuje wartości od -1 (dla skrajnie źle dyskryminujących zadań) do 1 (dla skrajnie dobrze dyskryminujących zadań). W praktyce ujemne wartości tego wskaźnika sugerują,  że zadanie źle funkcjonowało w teście (np. gdy pogłębiona wiedza w danym przedmiocie paradoksalnie utrudnia wskazanie prawidłowej odpowiedzi). Wskaźnik mocy dyskryminacyjnej testu jest obliczany jako średnia wartość odpowiednich wskaźników dla poszczególnych zadań.

Uwaga: wskaźnik mocy dyskryminacyjnej jest dokładniejszy jeśli wskaźnik trudności przekracza wartość 0.5

podział skali dyskryminacyjnej

 

Dolna granica

Górna granica

zmienić test

<0

0,2

poprawić test

0,2

0,3

prawie dobrze

0,3

0,4

Dobrze

0,4

1