Horn Dániel MTA KTI és ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

37
Csalás a kompetenciamérés tesztjein empirikus kísérlet a kompetenciamérés megbízhatóságának tesztelésére (előzetes eredmények) Horn Dániel MTA KTI és ELTEcon [email protected] Egészség és Munkaerőpiac konferencia Szirák, 2011. november 4-5.

description

Csalás a kompetenciamérés tesztjein empirikus kísérlet a kompetenciamérés megbízhatóságának tesztelésére (előzetes eredmények). Horn Dániel MTA KTI és ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia Szirák, 2011. november 4-5. tartalom. - PowerPoint PPT Presentation

Transcript of Horn Dániel MTA KTI és ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Page 1: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Csalás a kompetenciamérés tesztjeinempirikus kísérlet a kompetenciamérés

megbízhatóságának tesztelésére(előzetes eredmények)

Horn DánielMTA KTI és [email protected]

Egészség és Munkaerőpiac konferenciaSzirák, 2011. november 4-5.

Page 2: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

tartalom

• A Jacob-Levitt módszer rövid bemutatása• A kompetenciamérésről röviden• A csalási arány becslése – J-L módosításával• Robosztussági tesztek

(Megj.: eredmények nem véglegesek!)

Page 3: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

A Jacob-Levitt módszer

Page 4: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Rotten Apples• Jacob és Levitt 2003, QJE• Chicagoi általános iskolák

– 1993-2000– 3-7. évfolyam– Iowa Test of Basic Skills– csak feleletválasztós kérdések (multiple choice)– tanárok „javítják”

• Két indikátor a csalásra:– 1. indikátor – nagy tesztpontszám változás (large test score

fluctuation)– 2. indikátor – gyanús válaszadási minták (suspicious answer strings)

• 4 mérték (4 measures – M1, M2, M3 és M4)

Page 5: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

1. indikátornagy tesztpontszám változás

ahol rankgain a c osztály, b teszten t évben elért percentilis-rang változása (percentile rank increase)

Page 6: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

2. indikátorgyanús válaszadási minták

• M1– annak a valószínűsége, hogy diákok egy csoportja

egymás után következő kérdésekre ugyan azt a választ adja. Minél kisebb a valószínűség, annál valószínűbb, hogy csalnak.

– (probability of blocks of identical answer strings)

Page 7: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

2. indikátorgyanús válaszadási minták

• M2 (átlag) és M3 (szórás)– osztályszintű aggregált statisztikája annak, hogy

mennyire volt váratlan az adott kérdésre adott válasz.

Page 8: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

2. indikátorgyanús válaszadási minták

• M4– a helyes válaszok aránya képességszintenként.

ennek eltérése az országos átlagtól.

Page 9: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

2. indikátorgyanús válaszadási minták

• A 2. indiátor a mértékek rangérték-négyzetének összege (majd ennek a rangsora).

Page 10: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Intuíció

Page 11: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia
Page 12: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Intuíció kritikája

• Az 1. indikátorban lehet első és másodfajú hiba is

• A 2. indikátor sorba rendezésével elveszítjük a legfontosabb információt: a kilógó eseteket.

• Vagyis szükség volna egy küszöbértékre, ahol a „nem csaló” társadalom állna ugyanezen mértékek alapján.

Page 13: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Országos Kompetenciamérés

Page 14: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

  4th grade 6th grade 8th grade 10th grade

2003 020 students from every

school 020 students from each track from each school

2004 020 students from every

school20 students from

every school20 students from each track from each school

2006 full cohortevery student from a

sample of 195 schools full cohort

30 students from each track from each teaching

site

2007 full cohortevery student from a

sample of 200 schools full cohort

30 students from each track from each teaching

site

2008*

every student from a sample of

200 schools full cohort full cohort full cohort

2009*

every student from a sample of

200 schools full cohort full cohort full cohort

2010*

every student from a sample of

200 schools full cohort full cohort full cohort

• Csak 2 év panel• Nem csak feleletválasztós kérdések• Nem a tanárok javítják• Item Response Theory!

Page 15: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

A csalási arány becslése – némi módosítással

Page 16: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Item Response Theory

• Ahol a – discrimination, b – difficulty, c – pseudoguessing• ez a három paraméter minden itemre adott.• és

Page 17: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia
Page 18: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Folyamat

• Az IRT által adott függvény segítségével:– kiszámoltuk diákonként, hogy mekkora

valószínűséggel válaszol helyesen az adott itemre– ha ez a valószínűség nagyobb volt mint egy

random szám (0 és 1 között) akkor az új adatbázisban helyesen válaszolt

– ha nem, akkor helytelenül• a helytelen válaszok megoszlását – szintén random

módon – a populáció megoszlásához igazítottuk.

Page 19: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Folyamat

• Az új adatbázisra kiszámoltam az M1, M2 M3 és M4-et.

• ahol az eredeti mérték szignifikánsan nagyobb mint az új, ott feltehető a csalás (2008/8, matek):

Cheater # of classes

% of classes

# of students

% of students

# of schools

0 1140 21,91 24439 22,59 8481 1733 33,31 36525 33,76 12492 1610 30,94 32592 12,55 12213 665 12,78 13578 12,55 5804 55 1,06 1061 0,98 53

sum 5203 100 108195 100 2444*

Page 20: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Robusztussági tesztek

Page 21: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Csalás vs. tesztpontszám változásCheater Test score

fluctuation(indicator 1)

Difference in standardized test score between grade 8 and 10

0 0,08 0,0625

1 0,13 0,0713

2 0,21 -0,0077

3 0,30 0,0267

4 0,48 -0,0674

Total 0,18 0,0369

Page 22: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Csalás vs. alulteljesítés

Underperformer Freq. Percentage

0 1726 54,11

1 741 23,23

2 396 12,41

3 222 6,96

4 105 3,29

Page 23: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Csalás vs. alulteljesítés

Ordered Logit underperformerindicator 2 (cheating indicator) 0.254** 0.295** 0.166**

(9.16) (10.01) (5.38)indicator 1, (test score fluctuation) 0.321** 0.154*

(4.86) (2.32)size of school -0.092**

(17.36)Observations 5187 5032 5032Absolute value of z statistics in parentheses* significant at 5%; ** significant at 1%

Page 24: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Konklúzió helyett

Page 25: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

További teendők

• Más évekre is megcsinálni ugyanezt (2008/6, 2010/8 és 2010/10 lehetséges még)

• Nem csak matekra, hanem olvasásra is• és beépíteni az itt kapott javaslatokat…

Page 26: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Köszönöm a figyelmet!

[email protected]

Page 27: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 1Large test score fluctuation

where rankgain is the percentile rank increase for class c in subject b in year t

Page 28: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2Suspicious answer strings

• Measure 1 (M1)1) estimates the probability of each answer in each

item for each student

where Y is the response for student s in class c on item i. J is the number of possible responses (four), X is a vector of student characteristics, that includes past and future test scores, and some background data (free lunch, gender and race)

Page 29: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2Suspicious answer strings

• Measure 1 (M1)2) Calculates the probability for each student for the

answer s/he actually gave

where k is the response the student gave on the specific question

3) Calculate this probability for a (large) set of consequtive questions, from item m to item n

Page 30: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2Suspicious answer strings

• Measure 1 (M1)4) Take the product of this across all students, who

had the same responses for the given set of questions

5) Finally, take the minimum of these probabilities

Page 31: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 2 (M2)1) Calculate the residual for each of the possible

choices a student could have made for each item

response j on item i by student s in classroom c. four separate residuals per student per item

Page 32: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 2 (M2)2) sum the residuals for each response across students

within a classroom (four measures per classroom per item)

This measure is close to zero if there is no within class correlation across students in a given item

That is, if students responded the same way to an item, this measure is very high.

Page 33: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 2 (M2)3) take sum of squares across the four possible

responses for each item for each classroom, and normalize by class size

4) take the average of this within classroom (and divide by the number of items)

Page 34: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 3 (M3)the third measure is simply the variance (as opposed to the mean) of the same

statistic

M2 might be large due to teaching differences, e.g. teacher might emphasize a given topic more.

„If the teacher changes answers for multiple students on selected questions, the within-class correlation on those particular questions will be extremely high, while the degree of within-class correlation on other questions is likely to be typical. This leads the cross-question variance in correlations to be larger than normal in cheating classrooms.”

Note: this is also true if a teacher emphasizes a topic more through the year

Page 35: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 4 (M4)1) calculate

where qisc equal one if student s in classroom c answered item i correctly, and zero otherwise. As is the aggregate score of student s, and z denotes a given score level, while nsA denotes the number of students with an aggregate score A.

This shows the fraction of students at each aggregate score level, who answered each item correctly

Page 36: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

• Measure 4 (M4)2) calculate a measure of how much the response

pattern of student s differed from the response pattern of other students with the same aggregate score

3) subtract out the mean deviation for all students with the same aggregate score, ZA, and sum the students within each classroom to obtain the fourth indicator

Page 37: Horn Dániel MTA KTI és  ELTEcon horn @ econ.core.hu Egészség és Munkaerőpiac konferencia

Indicator 2 Suspicious answer strings

Indicator 2 is the sum of squares of the rank value of these measures

The Jacob-Levitt estimates: