Validitatea este un criteriu de calitate al evaluării.
S-a impus folosirea acestui criteriu în urma constatării că, în evaluarea de tip subiectiv, există o tendință a evaluatorului de a se lăsa influențat în evaluare de un complex de criterii insuficient delimitate și cu caracter personal. Astfel, deși se folosesc criterii, evaluatorii tind să dea o pondere „personală” fiecărui criteriu, prin tendința de compensare de la un criteriu la altul. Mai precis, dacă în sinea lui evaluatorul consideră un criteriu mai important decât altul, iar baremul de evaluare stabilește altfel, atunci evaluatorul va compensa această „nedreptate”, după caz, prin exigență mai mare sau mai mică decât în mod normal în evaluarea criteriului respectiv. Fenomenul se poate produce și în mod inconștient din partea evaluatorului.
Prin procedeul descris mai sus, evaluatorul nu mai măsoară în mod corect ceea ce este de măsurat în cadrul criteriului respectiv, ceea ce înseamnă că evaluarea nu este validă, adică nu ne oferă informații corecte cu privire la criteriul de evaluat.
Atunci când un singur profesor realizeză evaluarea unui set de lucrări / teste pe toate criteriile, lipsa validității are efect prin absența unor informații relevante în privința lucrărilor respective pentru fiecare criteriu de evaluat în parte. Este însă posibil ca, prin evaluarea făcută de o singură persoană, „clasamentul” celor evaluați să fie, în raport cu sistemul de criterii al acelei persoane, corect.
Atunci când evaluarea este făcută de două sau mai multe persoane, „compoziția” criteriilor fiecărui evaluator (ponderea specifică) duce la rezultate neașteptate, conform cărora „clasamentul” fiecărui evaluator este diferit, iar media rezultată este și ea diferită. În plus, dacă între evaluatori au loc discuții / negocieri ale evaluării, există riscul ca anumite caracteristici de personalitate ale evaluatorilor să dirijeze evaluarea într-o direcție sau alta, ca și riscul ca un evaluator să își „adapteze din mers” evaluarea pentru a obține rezultatele dorite, în ciuda evaluării operate de celălalt.
Rezultatele sunt și mai neașteptate dacă în evaluare sunt implicate seturi mari de lucrări care trebuie împărțite în pachete mai mici pentru evaluare. Atunci când sunt implicate criterii subiective, se constată experimental că echipe diferite de evaluatori evaluează foarte diferit același set de lucrări.
Pornind de la aceste constatări, au fost stabilite câteva criterii de calitate ale oricărei evaluări. Între acestea, validitatea se refera la asigurarea unei asemenea evaluări încât în cadrul fiecărui criteriu să fie evaluat numai acel criteriu, fără influențe din partea altora.
În cadrul evaluării de la olimpiada de limba germană modernă, noi favorizăm validitatea prin evaluarea verticală. Faptul că un evaluator se concentrează asupra unui singur criteriu pentru tot setul de lucrări crește calitatea evaluării, pentru că acesta tinde să „uite” de criteriile celelalte, pe care le are în vedere, și să se concentreze pe ceea ce trebuie să evalueze.
2 Responses in other blogs/articles
[…] verticală, câte cel puțin doi profesori pentru fiecare criteriu de evaluat, ceea ce crește validitatea evaluării. De câte ori este posibil, sunt folosiți chiar mai mulți evaluatori încă din prima […]
[…] putea face pe verticală, ca la olimpiada noastră, ceea ce ar crește eficiența, calitatea și validitatea – adică aceeași lucrare poate fi evaluată de 2 evaluatori pe un criteriu, alți 2 pe alt […]