i Test Intll.

58
I test di intelligenza Sunto a cura di: Enrico De Nigris Universale Paperbacks Il Mulino Michel Huteau Jacques Lautrey

description

I Test d'intelligenza

Transcript of i Test Intll.

Page 1: i Test Intll.

I test di intelligenza

Sunto a cura di: Enrico De Nigris

Universale Paperbacks

Il Mulino

Michel Huteau Jacques Lautrey

Page 2: i Test Intll.

M ICLIEL UTEAU JACQUES LAUTREY

I TEST DI INTELLIGENZA

I lettori che desiderano informarsisui libri e sull'insieme delle attività della

Società editrice il Mulinopossono consultare il sito .Internet:

http://www.mulino.it IL MULINO

Page 3: i Test Intll.

Conclusioni p. 111 PRESENTAZIONE

Letture consigliate119

Riferimenti bibliografici193

La definizione e la conseguente misurazione dell'intelli-genza sono stati certamente tra i temi della psicologia chehanno suscitato maggiore dibattito, in ambito sia nazionale siainternazionale. Tra le ragioni di tale dibattito vi è senza dub-bio la difficoltà a fornire dell'intelligenza una definizione uni-voca e condivisa e a sviluppare modelli teorici stilla sua naturae sul suo funzionamento; questa confusione a livello teorico hafatto sì clic per lungo tempo le pratiche di misurazione del-l'intelligenza abbiano tratto sostegno e fondamento da valida-zioni empiriche, quale ad esempio l'efficacia con cui è possi-bile discriminare soggetti normali da soggetti mentali deboli.Il successo dei test di intelligenza e il loro contributo all'ana-lisi psicologica è comunque indiscutibile. I test di intelligenzasono oggi impiegati, anche in Italia, nell'ambito clinico (so-prattutto a fini diagnostici), ma anche in quelli scolastico o edu-cativo (a scopo di orientamento o per valutare l'opportunità diun insegnamento di sostegno) e del lavoro (ad esempio, nellaselezione del personale). Le implicazioni sociali e politiche delloro impiego sono quindi particolarmente profonde e riguar-dano aspetti quali, ad esempio, la realizzazione professionaledel singolo individuo, l'efficienza del sistema scolastico o laproduttività di un'azienda.

Una delle ragioni che ci ha indotto a proporre al lettore ita-liano questo libro, opportunamente adattato, il presente testoè che esso offre informazioni puntuali sui test di intelligenzapiù frequentemente utilizzati: ne esemplifica le domande piùsignificative, le caratteristiche psicometriche, ne discute l'in-terpretazione dei risultati e ne analizza le implicazioni. Non silimita comunque «solo» a questo arduo e meticoloso compito.Vengono infatti anche riportati i principali riferimenti storicialla nascita e all'evoluzione degli strumenti di misura dell'in-telligenza. Il lettore viene così condotto attraverso le fasi: 1) di

7

Page 4: i Test Intll.

costruzione dei test come risposte alle necessità sociali, educa-tive e cliniche di un'epoca, 2) di critica e loro successiva revi-sione, 3) cli analisi e sviluppo delle implicazioni etiche e deon-tologiche relative al loro utilizzo. La prospettiva da cui questiargomenti vengono presentati è quella di due eminenti studiosifrancesi che da diversi anni si occupano di misure dell'intelli-genza e delle problematiche connesse, e che intrattengono si-gnificative collaborazioni scientifiche con il nostro gruppo diricerca. 11 loro interesse e la loro sensibilità a questi temi sonoper natura molto vicini a quelli sviluppatisi nel nostro paese ese vogliamo, più in generale, in Europa e si differenziano dal-l'approccio americano che è di gran lunga più interessato adaspetti numerici e psicometrici del testing.

CESARE CORNOEDI - PAOLA PALLADINO

PREFAZIONE

I test inquietano e affascinano. Periodicamente, i media nefanno oggetto di aspre critiche in quanto stupidi e arbitrari,tecnocratici e pericolosi. Ma, nello stesso tempo, i test hannomolto successo presso il grande pubblico. Le riviste li pro-pongono, più o meno seriamente; numerose opere pretendonodi diffonderne i segreti. C'è molta confusione in questi processie in questi entusiasmi. Forse per la loro diversità e quantità èmolto difficile parlare dei test ín generale. Questo libro vuolefornire alcune informazioni e chiarimenti su che cosa i test sonorealmente. E centrato su una categoria particolare dí test, quellidestinati a valutare l'intelligenza, che sono anche quelli chehanno provocato i dibattiti più vivaci.

Per misurare l'intelligenza bisogna, naturalmente, averedapprima un'idea generale di che cosa essa sia. Noi vedremoche l'intelligenza, o, in altri termini, l'insieme di capacità checonsentono di risolvere i problemi, può essere concepita in di-versi modi e da punti di vista diversi, e i test non fanno che ren-derla più oggettiva. I test valutano ciò che valutano le idee chehanno presieduto alla loro costruzione. Non rivelano proprietàmisteriose e nascoste degli individui. Essi permettono sempli-cemente di descrivere dei comportamenti dal punto di vistadella loro efficienza. Non sono altro che tecniche d'osserva-zione. Queste tecniche sono in generale accuratamente elabo-rate e rigorosamente codificate al fine di ridurre al minimo glieffetti. della soggettività dell'osservatore e di consentire con-fronti tra gli individui.

Nel primo capitolo vengono forniti alcuni cenni storici suiprimi tentativi di «misura» dell'intelligenza e sul loro contesto.Nel secondo capitolo viene analizzato un test d'intelligenzaclassico riguardante il ragionamento astratto. Quest'esempiopermette di precisare le caratteristiche essenziali dei tese ilmodo di presentazione dei problemi proposti, la valutazione

8 e

Page 5: i Test Intll.

delle prestazioni, il grado di fedeltà e validità. 11 terzo capitoloè dedicato alla presentazione delle grandi categorie di test: testdi quoziente intellettivo (QI), test analitici di intelligenza, testfondati sulla teoria di Piaget. L'ultimo capitolo, infine, riguardal'utilizzo dei tese espone i principali dibattiti e le polemiche dicui i test d'intelligenza sono stati oggetto e fa il punto sulla pra-tica dí utilizzo dei test e sui problemi deontologici che essapone.

CAPITOLO PRIMO

CENNI STORICI SULLA NASCITADEI TUST DI INTELLIGENZA

L'idea di «misurare» l'intelligenza era nell'aria alla fine delXIX secolo, alla nascita della psicologia scientifica. Il primo la-boratorio di psicologia sperimentale venne fondato a Lipsia nel1879 da Wilhelm Wundt (1832-1920). In questo laboratorio lericerche riguardavano soprattutto i processi sensoriali elemen-tari. Si cercava ad esempio di determinare come la percezionevaria ín funzione dell'intensità dello stimolo o di individuare laminima differenza di intensità dello stimolo che possa esserepercepita dai soggetti. Questi esperimenti inducevano a otte-nere delle misure piuttosto precise di differenti caratteristichedelle risposte dei soggetti, soglie di detezione, tempi di rea-zione e, a partire da queste caratteristiche, si cercava di infe-rire la natura dei processi in gioco nella risposta allo stimolo.

Uno degli studenti di Wundt, James IVIcKeen Cattell (1860-1944), fu colpito dalla variabilità che osservava tra i soggettisottoposti a questi esperimenti. Questo non era certo l'oggettodegli studi condotti nel laboratorio di Wundt, dove si cercavadi stabilire delle leggi generali dei processi sensoriali e dove ledifferenze tra gli individui erano per questo trattate come delleforme di «errore». C'attell osservava tuttavia che queste diffe-renze erano abbastanza stabili. Una volta rientrato negli StatiUniti, si servì di piccole situazioni sperimentali ispirate a que-sti compiti di laboratorio per studiare le differenze interindi-viduali e fu il primo ad utilizzare l'espressione mental test, nel1890, per designa de.

Nello stesso periodo, in Gran Bretagna, Francis Galton(1822-1911) utilizzava situazioni di questo tipo per misurarel'acutezza sensoriale, le soglie di discriminazione, i tempi direazione. Il suo interesse per le differenze individuali era peròpiù antico. Era infatti cugino di Darwin e, dalla pubblicazionedell'Origine delle specie, cercò di dimostrare che la teoria delcugino poteva anche essere applicata all'evoluzione dell'intel-

11.

Page 6: i Test Intll.

ligenza nella specie umana. E questa la ragione per cui appro-fittò della Mostra internazionale della salute a Londra, nel1884, per fondare un «laboratorio antropometrico» ín cui i vi-sitatori potevano «farsi misurare», sia in relazione a variabiliantropometriche (misure del corpo umano e delle sue diverseparti) sia rispetto alle piccole prove che Cattell qualificherà piùtardi come mental test. Galton misurava genitori e figli con l'o-biettivo di mostrare che le differenze individuali sono ereditateda una generazione all'altra; questo lo indurrà a introdurre ilprincipio del coefficiente di correlazione per quantificare la re-lazione che lega le misure effettuate sui genitori a quelle effet-tuate sui figli.

1. I primi tentativi di misura e il loro conic.cto

primi tentativi di misura di differenze individuali relativea caratteristiche «mentali» sono datati intorno alla fine del XIXsecolo e le loro ragioni intellettuali possono essere collocate,da un lato, nella nascita di una psicologia scientifica, che hamostrato la possibilità di misurare le caratteristiche dei pro-cessi mentali molto elementari, e, dall'altro lato, nell'influenzadella teoria di Darwin, che ha messo l'accento sul ruolo gio-cato dalle variazioni interindividuali nell'evoluzione delle spe-cie. Un altro fattore determinante di questa «atmosfera dell'e-poca» è da collocarsi negli sconvolgimenti economici e socio-culturali prodotti dall'industrializzazione. La necessità di dif-fondere l'istruzione, la formazione, di reclutare massiccia-mente per funzioni professionali popolazioni che non eranopreparate, ha creato dei nuovi bisogni in materia di valutazionedelle persone.. Uno di questi espresso regolarmente in quest'e-poca era la necessità di distinguere, tra gli allievi che non giun-gevano a frequentare la scuola elementare – ed erano comun-que tenuti a farlo perché era divenuto obbligatorio – coloroche avevano i mezzi intellettuali per beneficiare di questo in-segnamento ma erano ostacolati dalle circostanze e quelli cheinvece erano ritardati mentali. L'idea sottostante era che oc-correva dare ai bambini ritardati mentali un insegnamentoadatto alle loro possibilità, ma ciò comportava che si potessefare una valutazione affidabile e oggettiva dei bambini con dif-ficoltà scolastica.

12

Di fronte a questa richiesta sociale, i mental tests, simili aquelli adottati da Cattell nei suoi esperimenti di laboratorio,sembrarono essere, in un primo tempo, dei buoni strumentiper valutare le capacità intellettuali. Queste prove riguarda-vano processi molto elementari: si valutava, ad esempio, la piùpiccola differenza di peso che il soggetto era in grado di notarenel momento in cui si aggiungeva o sottraeva qualche grammoad un peso di 100 grammi, il tempo di reazione ad uno stimolouditivo, il tempo necessario per pronunciare il n ome del colorepresentato, ecc. Per comprendere come all'epoca si sia potutopensare di valutare l'intelligenza con tali prove, bisogna collo-carsi nel contesto delle teorie allora in vigore sui processi men-tali. La filosofia dominante era l'associazionismo. Si pensavache le immagini mentali fossero formate dall'associazione disensazioni elementari e che le idee fossero formate dall'asso-ciazione e dal concatenamento di queste immagini mentali. Inbreve, si ipotizzava che le sensazioni elementari costituissero lamateria di base a partire dalla quale venivano a formarsi i pro-cessi mentali più complessi. Da lì a supporre che la qualità deiprocessi complessi fosse largamente determinata dalla qualitàdelle sensazioni elementari il passo è breve. Cattell ha quindiapplicato i suoi menta! tests a tutti gli studenti che entravanoalla Columbia University, con l'obiettivo di basarsi sui loro ri-sultati per precisare indicazioni d'orientamento e per adattarei programmi. I suoi ripetuti tentativi si sono conclusi con uncocente fallimento. Non c'era alcuna relazione tra l'efficienzain questi mental tests e il successo scolastico. Tentativi similicondotti da altri ricercatori nello stesso periodo, con studentiuniversitari ma anche di scuola elementare, hanno prodotto lostesso risultato. I metodi di valutazione del funzionamento in-tellettivo tratti dalla psicologia scientifica nascente si rivelaronoincapaci di rispondere alla richiesta sociale dell'epoca in que-sto campo.

2. La soluzione di 13inet: la scala metrica 1/ sviluppo dell'intel-ligenza

e uno psicologo francese, Al fred Binet (1857-1911), chetroverà la soluzione del problema. Binet era uno spirito curiosoche aveva tra i suoi molteplici interessi la misura dell'intelli-

13

Page 7: i Test Intll.

genza. Una delle piste che egli esplorò fu la ricerca di una re-lazione tra le misure del cranio, considerate misure indirettedella dimensione del cervello, e l'intelligenza. L'insuccesso deiprimi tentativi gli diede l'idea di rovesciare il problema e con-frontare bambini normali a bambini ritardati. Egli chiesequindi a Théodore Simon, che in quel periodo, 1899, lavoravain un istituto per bambini ritardati a Perray-Vaucluse, di esten-dere le misure del cranio a bambini diagnosticati appuntocome ritardati mentali. Ma, una volta ancora, la ricerca si scon-trò con l'assenza di mezzi di valutazione obiettivi e affidabilidel grado di ritardo mentale dei soggetti esaminati. Binet e Si-mon cominciarono allora a sottoporre i bambini ad un esamesistematico per valutare le loro capacità intellettive.

Binet conosceva l'esistenza dei mentai tests messi a puntoda Cattell, ma aveva espresso già da diversi anni il suo disac-cordo con questa modalità di affrontare il problema. Egli rite-neva che le differenze individuali nei processi sensoriali ele-mentari avessero scarsa influenza sui processi mentali complessie che le differenze nella capacità intellettiva dovessero esserecercate nelle abilità di memoria, di immaginazione, di ragiona-mento, di giudizio. Questa convinzione, che ha giocato un ruolodeterminante, andava contro le tesi associazioniste, e -lo con-dusse ad abbandonare le caratteristiche individuali, che si erain grado di «misurare», per rivolgersi a caratteristiche più com-plesse, ma anche più problematiche, che non si sapeva «misu-rare».

Invece di paragonare le soglie di discriminazione sensorialedei bambini ritardati con quelle dei bambini normali, Binet eSimon sottoposero loro piccoli problemi di memoria, di giudi-zio scegliendo poi quegli item che separavano più nettamentei soggetti dei due gruppi (si chiamano item le diverse domandeo i diversi piccoli problemi, in genere di difficoltà graduata, checompongono un test e nei quali il soggetto può riuscire o fal-lire).

La spinta a procedere in questo lavoro verrà dalla domandasociale. Nel 1904, una commissione ministeriale chiese a Binetdi studiare il problema della

bdiaemosi del ritardo mentale. Bi-

ne': e Simon proposero allora nelle scuole le prove che avevanocominciato a mettere a punto. Si accorsero che alcuni item cheben discriminano i bambini ritardati da quelli normali avevanoanche un buon potere di discriminazione all'interno del

gruppo dei bambini normali ma di età inferiore. Insomma,item sembravano caratteristici di una data età nel mo-

mento in cui lo sviluppo intellettivo è avvenuto normalmente.Da ciò, lo scarto tra questa età e l'età in cui il bambino li su-pera realmente può segnalare il grado di evoluzione o di ritardonello sviluppo intellettivo. E l'origine della nozione di età men-tale. Tutto lo sforzo di Binet e di Siinon, a partire da quel mo-mento, fu di trovare delle piccole prove di memoria, di giudi-zio, di ragionamento, la cui riuscita apparisse rappresentativadei compiti cognitivi che può padroneggiare un bambino diuna data età. Per essere ritenuto rappresentativo di un'età di 5anni, ad esempio, un item doveva produrre un fallimento nellamaggior parte dei bambini di 4 anni, essere superato dalla mag-gior parte dei bambini di 6 anni, e avere una percentuale disuccesso del 50% tra i bambini di 5 anni, a dimostrazione chea questa età sta per essere padroneggiato. Gli item adatti nondovevano richiedere conoscenze scolastiche. Non si trattava divalutare il grado di istruzione, ma la qualità del funzionamentointellettivo in situazioni ordinarie.

A titolo d'esempio, una delle situazioni di valutazione dellamemoria selezionata da Binet e Simon (oggi si parlerebbe dimemoria a breve terrnine) consisteva nel chiedere al bambinodi ripetere una lista di cifre appena letta dallo sperimentatore.Essere in grado di ripetere due cifre corrisponde ad un'età men-tale di 2 anni, 3 cifre di 3 anni, 5 cifre di 8 anni, e 7 cifre di 15anni. Un'altra prova consisteva nel mostrare al bambino dellefotografie chiedendogli di spiegare che cosa esse rappresenta-vano (cfr. fig. 1). Elencare (ad esempio, «un signore ed una si-gnora») corrispondeva ad un'età mentale di 3 anni, descrivere(ad esempio, «un signore e poi una signora che dormono su unapanca») ad un'età mentale di 7 anni, e interpretare (ad esem-pio, «degli sfortunati») ad un'età mentale di 15 anni. A partiredal 1905, Binet e Simon proposero una prima versione dellaloro «scala metrica» dell'intelligenza. Una seconda versione èapparsa nel 1908 [Binet e Simon 19081. La scala conteneva unacinquantina di item, in ragione di 4 o 5 per ogni età mentale, eciò per livelli di età che andavano da 3 a 15 anni. L'età mentalenon era determinata da un item particolare, ma dall'insieme de-gli item superati: se la scala prevedeva 4 itero caratteristici del-l'età mentale di 4 anni, la riuscita in ognuno di questi item cor-rispondeva ad un credito di 3 mesi e l'età mentale era ottenuta

14 15

Page 8: i Test Intll.

FIG. L Una delle tre fotografie mostrate ai bambini nella scala (li 13inedSimon.

Fonte: A. Binet e T. Simon, Marine/ (le Téchelle inéitique, Paris, A. Collo.

sommando i crediti degli item superati. La precocità o il ritardodello sviluppo intellettivo erano dati dal confronto tra l'età men-tale così ottenuta e l'età cronologica del bambino. F, soltantodopo la morte di Binet, nel 1912, che uno psicologo tedesco,William Louis Stern, ebbe l'idea di esprimere la rapidità di svi-luppo come il rapporto tra l'età mentale e l'età cronologica(moltiplicato per cento per evitare i decimali). Questo indicevenne chiamato quoziente intellettivo (QI). Il QI è superiore a100 per i bambini avvantaggiati (più precoci) e inferiore a 100per i bambini in ritardo: tanto più si allontana da 100, in unsenso o nell'altro, tanto più i bambini sono in vantaggio o in ri-tardo. Un bambino di 10 anni che manifesta le stesse abilitàdella media dei bambini di 12 ha un'età mentale di 12 anni esi vede attribuire un Q1 di (12/10) Y. 100 = 120.

La scala di Binet e Simon ebbe un successo immediato. Ineffetti, permetteva dí diagnosticare il ritardo mentale in ma-niera più precisa e più obiettiva di quanto si facesse in prece-denza e si mostrò predittiva della riuscita scolastica. Venne tra-dotta e adattata negli Stati Uniti nel 1909. 1.1 più famoso di que-

sti adattamenti è quello fatto da Termali all'Università di Stati-ford nel 1916. Da allora, la «Stanford-13inet» è stata più volterivista ed è tuttora utilizzata negli Stati Uniti. In Francia, in-vece, fu solo nel. 1966 che la scala metrica di Binet e Simonvenne revisionata sotto la direzione di René Zazzo per diven-tare la «nuova scala metrica dell'intelligenza».

1.1 primo aspetto di novità che ha permesso a Binet di faruscire il problema dell'intelligenza dall'Impasse in cui si trovavaalla fine del XIX secolo è stato di aver capito che la valutazionedoveva riguardare processi mentali complessi. Questa primaidea, tuttavia, non era ancora sufficiente, poiché a quell'epocasi era in grado di valutare solamente i processi sensoriali ele-mentari. Un ulteriore apporto originale di. Binet è stato di avercompreso clic la possibilità di ordinare gli itero in funzione del-l'età in cui questi ultimi vengano superati poteva costituire unprimo livello di misura della loro complessità cognitiva. Daquesta possibilità di ordinare gli itero discendeva la possibilitàdi ordinare allo stesso modo anche i soggetti, compresi quellidella stessa età cronologica, in funzione del loro livello di riu-scita al test. Spesso, nella ricerca, non basta avere delle ideenuove, ma bisogna anche saper abbandonare le vecchie chenon «funzionano». Si può notare che, da quando Binet si av-viò sulla strada della scala metrica dell'intelligenza, egli ab-bandonò quella della misura del cranio che non aveva prodottonulla di interessante fino a quel momento e che neanche in se-guito si rivelò produttiva.

3. La soluzione di Spear/nal ' : fattoriale

Per confrontare i soggetti Binet si è riferito all'approccioevolutivo e alla nozione di età mentale. Un'altra soluzione, sco-perta pressappoco nello stesso momento da Spearman, consi-ste nel riferirsi ad un'analisi matematica, l'analisi fattoriale, perdefinire le dimensioni intellettive sulle quali gli individui pos-sono essere confrontati.

3.1. I principi generali dell'analisi fattoriale

Prima di fornire alcuni riferimenti storici sull'origine diquest'altro approccio alla «misurazione» co-

16 17

Page 9: i Test Intll.

minciamo a introdurre il principio dell'analisi fattoriale conl'aiuto di un'analogia. Le qualità atletiche possono essere va-lutate in tutti i tipi di prove sportive, ad esempio il lancio deldisco, il salto in alto, il lancio del peso, il salto in lungo, il lan-cio del giavellotto, il salto triplo, per citarne solo alcune. Si puòsupporre che alcune di queste prove, benché diverse tra loro,facciano intervenire un fattore comune di performance. Le treprove del lancio hanno probabilmente in comune il fatto di fareappello alla forza e all'elasticità delle braccia, mentre le treprove di salto hanno probabilnieme in comune il riferimentoalla forza e all'elasticità delle gambe. LA forza e l'elasticità dellegambe intervengono probabilmente anche nel lancio, tua conun peso meno rilevante che nel salto.

Ci si può così rappresentare la performance nel lanciocome la risultante di un insieme di fattori, di cui alcuni hannoun peso importante (elasticità delle braccia) e altri un pesomeno rilevante (estensione delle gambe). Poiché alcune provehanno in comune di mettere in gioco e con un certo peso undato fattore di efficienza, esse tendono ad essere superate tutteinsieme: se l'elasticità delle gambe ha un peso rilevante nel saltoin alto e nel salto in lungo, un soggetto che riesce bene in unadi queste due prove ha senza dubbio Una buona estensionedelle gambe e riuscirà dunque bene anche nell'altra. Invece,non ci si aspetta una correlazione altrettanto forte tra le pre-stazionistazioni nel salto in alto e nel lancio del giavellotto nella misurain cui ciascuna fa riferimento ad un fattore di riuscita che gli èspecifico: elasticità delle gambe per la prima ed elasticità dellebraccia per la seconda. Tuttavia, è possibile che, all'origine diuna correlazione alquanto moderata tra prove di lancio e provedi salto, vi sia malgrado tutto una dipendenza tra questi duefattori di efficienza. Le condizioni generali della muscolatura,la motivazione per le attività sportive, l'allenamento possonoin effetti concorrere ad un fattore generale di performance im-plicato in tutte queste attività, che si tratti di corsa, di salto odi lancio.

metodi di analisi fattoriale esplorativa sono utili nel mo-mento in cui, contrariamente al modo in cui si è procedutonelle prove diatletica', non si hanno idee a priori sui fattori ingioco nel successo ad un insieme dí prove. In questo caso, ilprocesso va esattamente nella direzione inversa a quella seguitain precedenza: si parte dalle relazioni empiriche tra le prove

per inferire l'esistenza di eventuali fattori comuni. 11 metododell'analisi fattoriale consiste nel calcolare prima le correlazionitra tutte le prove prese due a due, poi eli verificare se esistonogruppi di prove che correlano tra loro più che con le altre. Sisuppone allora che ci sia un fattore di variazione comune a que-sto gruppo di prove, ma la parola fattore assume qui un signi-ficato diverso da quello attribuitogli poco prima. Si tratta di unfattore comune nel senso matematico del termine («Mettere •un'espressione a fattore») e l'analisi fattoriale è il metodo ma-tematico che permette di estrarre questi fattori di variazionecomuni. l fattori sono dunque in questo caso delle entità ma-tematiche, astratte e teoriche. Nella rappresentazione geome-trica dei risultati dell'analisi fattoriale eli una serie di correla-zioni, questi fattori com uni di variazione sono rappresentati SU-

gli assi cartesiani. Le differenti prove possono essere situiate inrapporto agli assi sulla base delle loro coordinate. Più unaprova è vicina ad un asse, più ha contribuito con forza alla de-terminazione di questo fattore, e più questo ha un peso rile-vante nei punteggi ottenuti in questa prova. Si dice che la provaè fortemente «saturata» dal fattore. La saturazione di unaprova da parte di un fattore è valutata sulla base della sua cor-relazione con quel fattore, varia quindi da –1 a +1 e si inter-preta come il peso del fattore nella variazione dei punteggi aquesta variabile. Si . può cercare di interpretare un fattore co-mune a più prove individuando in che cosa queste prove si as-somigliano e in che cosa differiscono dalle prove saturate daun altro fattore.

Ritorniamo alle nostre sei prove dí atletica. Ammettiamostavolta che, non avendo alcuna ipotesi in partenza sui fattoridi variazione della performance in queste prove, noi abbiamofatto un'analisi fattoriale delle loro intercorrelazioni. Se tro-viamo che le tre prove di salto sono fortemente saturate daun primo fattore, chiamiamolo e le tre prove di lancio for-temente saturate da un secondo fattore, chiamiamolo F2, al-lora potremmo interpretare Fl e F2 – che non sono che dellefonti di variazione latenti, teoriche – in funzione delle ipotesiche questo raggruppamento di prove ci suggerisce: forse l'e-lasticità delle gambe per Fl e l'elasticità delle braccia per F2.

Era insomma questa la situazione in cui si trovavano i primipsicologi che applicarono l'analisi fattoriale ad un insieme ditest. Ignorando la natura dei differenti fattori in grado di spie-

18 19

Page 10: i Test Intll.

gare le variazioni nelle performance ai test di intelligenza, essihanno preso come punto di partenza le correlazioni tra i test ene hanno fatto un'analisi fattoriale. Nel momento in cui sonostati individuati uno o più fattori comuni a più test, l'esame delcontenuto dei diversi test saturati dallo stesso fattore ha por-tato ad una sua interpretazione (e qualche volta a più di una).

3.2. Spearman e il fattore generale di intelligenza

Il primo metodo di analisi fattoriale è stato inventato daCharles Spearman (11863-1945), uno psicologo inglese, per ana-lizzare specificamente la tavola delle correlazioni ottenute daun campione di soggetti in diverse prove, voti scolastici, pic-coli test, stime dell'intelligenza fatte dagli insegnanti, ecc. Conil suo metodo di calcolo egli mostrava che si poteva separarela varianza di questi punteggi in due parti: un fattore di varia-zione generale, comune a tutti questi punteggi, e un fattore divariazione specifico per ciascuno di essi. In un articolo pub-blicato nel 1904 e intitolato General intelligence objectively de-termined and íneasured, egli interpretava questo fattore co-mune a tutti i compiti della sua batteria di prove come un fat-tore generale di intelligenza, il famoso fattore g, e presentava ilsuo metodo come il mezzo per misurarlo.

Si noterà dapprima la quasi coincidenza di questa data conquella della pubblicazione della prima versione della scala me-trica di Binet e Simon. La misura dell'intelligenza era sicura-mente nell'aria da tempo. Si noterà poi che questa prima formadi analisi fattoriale conduceva anche a una concezione globaledi intelligenza. Spearman non ha proposto teorie elaborate dicosa rappresentasse il fattore g, ma ha dapprima ritenuto checorrispondesse all'«energia mentale», senza che questa no-zione superasse lo status di metafora. Egli ha suggerito poi[Spearman 19271 che i compiti maggiormente saturati nel fat-tore g erano i compiti di «estrazione cli relazioni» (noi diremmooggi di inferenza) e di «estrazione di correlati» (noi diremmooggi di generalizzazione). L'estrazione di relazioni consiste, datin elementi, nel trovare la relazione che li lega; ad esempio, datigli elementi «birra» e «vino», nel trovare che la relazione cheli lega è essere delle bevande alcoliche. L'estrazione di corre-lati consiste, dati un elemento e una relazione, ad esempio«birra» e «bevanda alcolica», nel trovare un altro elemento le-

gaio al primo da questa relazione. Questa concezione di ciò cheè comune alle attività intellettive non era particolarmente ela-borata, ma era senza dubbio operazionale. E con queste ispi-razioni che .Raven mise a punto la prova delle matrici progres-sive che sarà presentata nel capitolo seguente. Nelle analisi fat-toriali si osserva infatti che il test delle matrici progressive èuno di quelli che sono saturati con maggior forza dal fattore g(fattore comune all'insieme dei test).

3.3. Thurstone e le abilità primarie

Questo modello unidimensionale è stato messo in discus-sione verso la fine degli anni Trenta da Thurstone (1887-1955),uno psicologo americano. Analizzando le intercorrelazioni diun ampio gruppo di test con il metodo dell'analisi fattoriale,egli non trovò un fattore generale, ma numerosi fattori che cor-rispondevano secondo lui a delle abilità indipendenti chechiamò «abilità primarie». Il numero di queste abilità prima-rie variava un po' a seconda dei test che componevano la bat-teria, ma le più frequenti erano le sette seguenti: comprensioneverbale (V), fluidità verbale (W), abilità numerica (N), infe-renza (I), abilità spaziale (S), velocità percettiva (P) e memoria(V) [Thurstone e Thurstone 1941]. Vedremo più avanti alcunitest che sono maggiormente saturati da questi diversi fattori.

Sulla base di queste considerazioni si è avviata una pole-mica tra Spearman e Thurstone sulla struttura dell'intelligenza:è unidimensionale, come suggeriva il fattore generale indivi-duato da Spearman, o M ultidirnensionale, come suggerivano imolteplici fattori individuati da Thurstone?

Come è emerso successivamente, le differenze di risultatoriguardavano, da un lato, il fatto che questi due autori utiliz-zassero delle tecniche di analisi fattoriale differenti, e dall'al-tro, che queste analisi fossero condotte su dei campioni diprove e di soggetti abbastanza diversi. È stato mostrato chequesti due metodi erano parziali e potevano essere integrati inun modello fattoriale gerarchico più generale. In breve, nel mo-mento in cui si fa l'analisi fattoriale di una batteria di test conun metodo simile a quello di Thurstone, si ritrovano i fattoriprimari che egli ha messo in evidenza, ovvero fattori comunisoltanto a piccoli gruppi di test. Tuttavia, questi fattori sonocorrelati tra loro in modo tale Cile se se ne fa un'analisi fatto-

20

21.

Page 11: i Test Intll.

riale si ottengono fattori di second'ordine, più generali, cherendono conto della varianza comune ai fattori primari.

nom e Cattell [1966] hanno così distinto cinque fattori ge-nerali di secondo ordine: un fattore generale di intelligenza cri-stallizzato (gc), un fattore generale di intelligenza fluida (g/) eun fattore generale di intelligenza visuo-spaziale (v), un fat-tore generale di creatività e un fattore generale di velocità direazione. L'intelligenza cristallizzata è quella che si fonda sul-l'organizzazione delle conoscenze in memoria; l'intelligenzafluida è in gioco nelle situazioni che richiedono poche cono-scenze a priori e in cui è l'efficienza dei meccanismi di ragio-namento ad essere valutata; l'intelligenza visuo-spaziale; è ingioco nell'elaborazione di informazioni di natura visuo-spa-ziale; l'intelligenza creativa è in gioco in situazioni in cui de-vono essere scoperte soluzioni nuove e originali. Ma questi fat-tori secondari sono anche correlati tra loro in modo che, se siapplica su essi un'analisi fattoriale di secondo ordine, si puòtrovare un fattore generale, di «terzo ordine», comune all'in-sieme dei test che compongono la batteria. In altre parole,Spearman e Thurstone avevano entrambi ragione ed entrambitorto.

Questi cenni storici danno un'idea delle soluzioni che sonostate proposte per valutare l'intelligenza. Si sono cercati me-todi diversi per confrontare gli individui con compiti che met-tano in gioco i differenti aspetti dell'intelligenza. I compiti co-gnitivi non sono comunque per questo tutti dei test di intelli-genza. Rimane perciò da vedere in modo più preciso ciò chedistingue un test da altre situazioni di valutazione.

I\RYIA. al. LAPITOLO PRIMO

Teniamo a precisare che non siamo esperti in quest'ambito e c i tiest'a-nlisi a priori dei fattori in gioco in prove di atletica è forse scorretta. ll solointeresse di questo eseinpio è nelle sue ipotizzare virtù pedagogiche.

CAPITOLO SECONDO

CI IE COSt UN TEST?

Un test è un dispositivo d'osservazione degli individui chepresenta quattro proprietà:

1. è standardizzato;2. permette di collocare la prestazione di ogni soggetto in un

gruppo di riferimento;3. presenta un determinato grado eli accuratezza della misura

(fedeltà);4. viene precisato il significato teorico o pratico della sua mi-

sura (validità).Per esaminare queste proprietà prenderemo come esempio un

test di ragionamento induttivo, il test delle Matrici Progressive –livello superiore (Advanced Progressive Ma Irices, APM) – messo apunto dallo psicologo inglese Raven [1965; 1992; Raven, Court eRaven 1988]. Cominceremo con la presentazione di questa prova.

1. Ut7 ir'Si ch ragiontwiento Induttzvo

Il test di Raven è rivolto ad adolescenti o adulti con un buonlivello intellettivo (Raven ha anche proposto dei test costruiti congli stessi principi e rivolti ai bambini). Elaborato nel 1943 per es-sere utilizzato nelle procedure di selezione degli ufficiali dell'e-sercito britannico, è stato rivisto una prima volta nel 1947, in pre-visione di un impiego più diversificato, principalmente nell'am-bito dell'orientamento e del reclutamento, poi una seconda voltanel 1962, Questo test è costituito da una serie di figure incompleteche il soggetto deve completare scegliendo la soluzione più ap-propriata tra le numerose che gli vengono proposte. Il test è rap-presentativo di una categoria di prove dette «carta e matita», poi-ché non c'è bisogno d'altro che del quaderno degli item e di unamatita per indicare la risposta, o anche test «collettivi» perché leloro caratteristiche consentono una somministrazione collettiva.

7723

Page 12: i Test Intll.

Il test è costituito da due serie di problemi (o item). La primaserie si compone di .12 item per la maggior parte piuttosto facili.Sono proposti con lo scopo di esercitare il soggetto e consentirglidi familiarizzare con il compito e quindi mettere a punto una mo-dalità generale di risoluzione. La seconda serie, nella versione del1962, prevede 36 item di cui molti sono piuttosto difficili (la ver-sione del 1947 proponeva 12 item supplementari). Il punteggio delsoggetto è in genere calcolato accordando un punto per ogni itemsuperato.

Istruzioni molto precise indicano al soggetto che cosa deve faree che cosa ci si aspetta da lui. Il test è presentato come un compitodi osservazione e di ragionamento. Si mostra al soggetto dapprimal'item numero 1 della prima serie (vedi fig. 2) e gli si spiega checiascuna delle piccole figure nella parte bassa della pagina po-trebbe riempire lo spazio vuoto nella figura grande, ma che solo

una completa adeguatamente il disegno. Il soggetto deve scoprirequesta figura e riportare il suo numero su un foglio di risposta aparte, distinto dal quaderno degli item. Dopo aver verificato cheognuno ha individuato la risposta esatta e l'ha segnata corretta-mente, si chiede ai soggetti di risolvere l'item 2 (la lettura della fi-gura grande si fa da sinistra a destra e dall'alto verso il basso). Alloscadere di una ventina di secondi, si controlla nuovamente la ri-sposta. I soggetti hanno a disposizione circa cinque minuti per ri-solvere gli item successivi. Si chiarisce loro che i problemi diven-tano presto difficili, che bisogna sempre utilizzare lo stesso metodoper risolverli, che si tratta di una serie di esempio e che la cosa es-senziale non è risolvere tutti i problemi ma imparare il metodo dautilizzare, metodo che le istruzioni non esplicitano. Bisogna infattitrovare delle regolarità o delle regole di trasformazione in riga e incolonna. L'iteri n. 10 è riportato nella figura 3.

l a1

q ri o 111 )

FIG. 2. Ttern n. I della serie I delle -Matrici Progressive. Fin, 3. tieni n. 10 della serie I delle Matrici Progressive.

24

25

Page 13: i Test Intll.

Si passa poi alla seconda serie di item. Le istruzioni pre-cisano che si tratta del test vero e proprio, che i problemi darisolvere sono simili a quelli della prima serie, che la loro dif-ficoltà cresce più lentamente, e che è preferibile affrontarlinell'ordine con cui vengono proposti. Se la prova è applicatacon un tempo limitato, il soggetto ha a disposizione quarantaminuti (vedi fig. 4, item 19 della versione del 1962 che è unitem di difficoltà media). Il punteggio del soggetto al test(punteggio grezzo) dato dal numero di problemi superati.

19

4. Itero n. L9 della sede Il delle Matrici Progressive.

2. Le proprietà .1(..)rmali di un test

2.1. La standanlizzazione

I test sono delle procedure di osservazione standardizzate.La standardizzazione riguarda la situazione di osservazione, leconsegne e la valutazione del risultato. Nel test di Raven, i pro-blemi proposti sono assolutamente identici per tutti i soggettipoiché sono stampati sui quaderni. Quando il test richiede lamanipolazione del materiale, questa viene sempre descritta congrande precisione. Noi abbiamo dato solo un riassunto delleconsegne del test di Raven. Nel manuale le istruzioni sono scru-polosamente redatte e a colui che applica il test è strettamenterichiesto di non discostarsene. Infine, il modo di calcolare ilpunteggi() grezzo di ogni soggetto è sempre perfettamenteesplicitato. Nei test collettivi, concepiti appunto per poter es-sere somministrati contemporaneamente ad un gruppo di sog-getti, il calcolo è generalmente semplice e consiste nel sommarele risposte corrette. Per altre tipologie di test, la correzione èpiù complessa, ma si dispone sempre di indicazioni molto pre-cise. Prendiamo ad esempio í test di vocabolario in cui il sog-getto deve produrre la definizione di una parola. Nel manualedel test si trova la descrizione, accompagnata da esempi, deidiversi livelli di risposta che possono essere prodotti dai sog-getti, con indicazione del numero di punti da attribuire in ognicaso.

Questa standardizzazione ha un'unica funzione: rendereoggettiva la valutazione, cioè evitare che la misurazione delledifferenze tra gli individui sia influenzata dalla soggettività del-l'osservatore, o, in altri termini, permettere che ci sia un ac-cordo sulla valutazione delle performance tra osservatori di-versi. là risaputo che questo non succede con procedure di os-servazione libere quando la situazione in cui si trova il soggetto,le indicazioni che gli vengono date e le modalità di valutazionedelle risposte sono mal definite. Le differenze che vengono cosìindividuate tra i soggetti possono essere dovute tanto alla va-riabilità di questi parametri, da un osservatore all'altro, quantoalle effettive performance dei soggetti. La procedura di OSSer-

v azione standardizzata si distingue così nettamente dalla valu-tazione scolastica. Poiché nella situazione scolastica lo stessocompito viene dato a tutta la classe nelle stesse condizioni, si

5

9 627

DENNY'S
Resaltado
Page 14: i Test Intll.

può ritenere che la situazione e le consegne siano standardiz-zate. Ma la correzione generalmente non lo è (uno sforzo co-munque viene compiuto ín questo senso con l'introduzione diuna scala di punteggio di riferimento). Le differenze tra stu-denti sono quindi ambigue. I lavori di docimologia hanno re-golarmente mostrato da più di sessant'anni [cfr. de Landsheere1992] che queste differenze sono attribuibili in parte a varia-bili che ancora oggi si sottostimano, quali la severità dei cor-rettori, l'utilizzo vario che si fa delle scale di valutazione (al-cuni, ad esempio, danno voti compresi tra 2 e 10, mentre altritra 4 e 8), o ancora al fatto che non c'è unanimità nel definirel'importanza degli obiettivi educativi e la loro gerarchia.

Se la standardizzazione consente una valutazione oggettiva,bisogna tuttavia notare che conduce spesso ad un impoveri-mento del campo di osservazione: è facile da applicare alla va-lutazione delle prestazioni ma non è sempre un indice di per-tinenza odi validità. La standardizzazione della situazione edelle consegne non riduce necessariamente il repertorio com-portamentale dei soggetti. Se la situazione è debolmente strut-turata e la condotta poco finalizzata, i soggetti sono spinti aprodurre risposte diversificate. Succede questo, ad esempio,nei test detti di creatività in cui si richiede di immaginare tuttii possibili utilizzi di un oggetto come un mattone o una scatola.Ma, molto spesso, la standardizzazione è tale da consentire alsoggetto di manifestare solo un numero limitato di comporta-menti (risposte), e precisamente quelli che la valutazioneprende in considerazione. Ma ritorniamo al test di Raven. La

situazione è tale da richiedere essenzialmente di osservare lascelta di una delle Otto figure proposte. In effetti, sono possi-bili altre osservazioni: tra i fallimenti si possono distinguere glierrori dalle omissioni, ci si può domandare come si collocanoi fallimenti sulla base del grado di difficoltà degli item, inter-rogarsi sulla natura degli errori, ecc. Ma ciò non toglie che lasituazione è poco favorevole alla comparsa di comportarnenti.differenziati.

In teoria, ogni fenomeno psichico che si manifesta attra-verso un comportamento può essere l'oggetto di un'osserva-zione standardizzata. Questa osservazione può essere provo-cata e assumere delle forme complesse. Si sono così messe apunto delle procedure standardizzate dí indagine che consen-tono eventualmente di far emergere certi comportamenti che

testimoniano l'esistenza di strutture mentali o di particolarimodalità di trattamento dell'informazione. Si trovano esempidi tale procedura in alcuni test costruiti partendo dalla teoriadi Piaget (vedi cap. 3). Ma è particolarmente difficile osservareoggettivamente processi di pensiero che si caratterizzino per illoro aspetto qualitativo e la dimensione temporale piuttostoche per la semplice efficienza. Per questo, nella maggior partedei test attualmente in uso, ci si limita a valutare la qualità dellaprestazione del soggetto contando il numero dí risposte cor-rette o misurando il tempo necessario all'esecuzione di un com-pito.

L'oggettività così ottenuta è una qualità. ecessaria alla stan-dardizzazione. In sua assenza non si sa più a sufficienza checosa, nel comportamento del soggetto, è attribuibile al soggettostesso o alle caratteristiche di colui che osserva, e di conse-guenza le osservazioni raccolte sono poco utilizzabili per finidi ricerca o per fini pratici. Ma l'oggettività non è una qualitàsufficiente. Occorre essere certi che l'osservazione riguardiaspetti centrali del comportamento. Occorre anche accertarsiche l'accordo tra gli osservatori non sia il risultato di un erroresistematico di osservazione che non condurrebbe ad altro chea conclusioni ambigue o anche scorrette.

2.2. Livello di difficoltà degli /toni e unidimensionalità dellasana

Il test deve consentire di differenziare gli individui, sia se-parandoli in classi differenti non ordinate, sia, quello che piùspesso accade, collocandoli gli uni in relazione agli altri su unC0116171111171 (una dimensione). Noi ci interesseremo al caso incui ci si propone di collocarli su un continuum. Al fine di dif-ferenziare sensibilmente gli individui, è opportuno avere a di-sposizione item di livelli diversi di difficoltà. L'itero è tanto piùdifficile, per i soggetti di un gruppo, quanto più la sua proba-bilità di essere superato in questo gruppo è debole. Gli itemtroppo facili (superati da quasi tutti) o troppo difficili (quasitutti falliscono) non contribuiscono alla differenziazione degliindividui. Ecco alcuni dati sul livello di difficoltà degli item deltest di Raven: sono stati raccolti su un campione di più di unmigliaio di adolescenti tedeschi di 15 anni, scolarizzati. Nellaserie I, la percentuale di successo agli item varia dal 93% (item

28

29

Page 15: i Test Intll.

n. 1) al 42% (item n. 11). L'item n. 10 (fig. 3) è stato superato1111'82% dei soggetti. Nella serie IL queste percentuali varianodall'85 % (item n. 1) al 4% (item n. 36). Litem n. 19 (fig. 4) èstato superato dal 60% (lei soggetti. Per ogni serie, l'ordine dipresentazione degli item è molto vicino al loro ordine di diffi-coltà.

11 punteggio grezzo dei soggetti al test deve consentire dicollocarli su una dimensione. Nel caso del tesi delle matriciprogressive, questa dimensione può essere chiamata «effi-cienza nel ragionamento induttivo» o «capacità di ragionare in-duttivamente». L'esistenza di questa dimensione deve esseredefinita e univoca. Non avrebbe alcun senso sommare gli itemsuperati se ciascun item non valutasse in misura diversa la ca-pacità di ragionare in modo induttivo. L'esistenza di una di-mensione è fondata a sua volta su considerazioni teoriche e su

criteri formali. Da un punto di vista teorico è sensato ritenereche tutti gli item del test di Raven mettono in gioco il ragiona-mento induttivo O, più esattamente, una certa formo di ragio-namento induttivo. Da un punto di vista formale, ci si deve as-sicurare che il successo in un item sia strettamente associato alpunteggio globale al quale deve contribuire. Se ciò succede pertutti gli item, si concluderà che la scala è unidimensionale. Sipossono utilizzare diversi metodi per verificare questo unidí-mensionalità. Ne prenderemo in considerazione due: il calcolodei coefficienti di correlazione item-test e la generazione dicurve caratteristiche degli item. Li presenteremo riprendendol'esempio del test di Raven.

2.3. La correlazione item-test

Una volta che il test è stato applicato, ogni soggetto è ca-ratterizzato da un punteggio per ogni item (1 o 0) e da un pun-teggio totale (al massimo 12 punti per la serie I e 36 per la se-rie II). Se un item richiede la stessa abilità dell'insieme degli al-tri item, il punteggio a quell'item dovrà essere in correlazionecon quello del test. In altre parole, il successo nell'acni dovràessere più frequente per quelli che hanno punteggi elevati altest. Il grafico di correlazione per un item della serie I è pre-sentato nella tabella 1. Vediamo, per il test di Raven, le corre-lazioni item-test calcolate sul campione di adolescenti tedeschi.Per la serie I, i coefficienti di correlazione item-test variano da

AB. Diagnnumd ch correlazione nunrewo di un item 09 e il punteggio delleA latrici Progressive (serie I)

Punteggio al test (.)c)

0 1 2 3 4 5 6 7 8 9 10 11 12 n

Punteggio l 2 3 5 12 16 12 .5 3 2 60 •

all'iterar (r) 1 4 9 12 9 4 1 40

li punteggio dell'iterar è 1 o C. 11 punteggio al test vada da C) a 12. Su 100 soggettiche hanno fano il test, 60 hanno saper s i l'itero e -(0 hanno fallito (colonna n). So60 soggetti che hanno superato ritetn, 2 hanno ottenuto al test un punteggio di 4, 3un punteggio di 5, ecc. Su 40 soggetti che non hanno superato l'itero, I Ira ottenuto1111 punteggio di 2, 4 hanno ottenuto un punteggio di 3, ecc. Il coefficiente di CON

relazione ira l'itero e il test (qui si unita di un coefficiente di correlazione biseriale)è di 0,85. Traduce il fatto che la maggior parte dei soggetti che hanno superato l'i-tem hanno un punteggio elevalo (50 su 60 hanno più di 6) mentre la maggior pattedi coloro clic hanno sbagliato all'item hanno un punteggio basso al, test (26 su 40hanno areno di 6).

0,41 a 0,60 1 . Per la serie Il variano da 0,11 a 0,61. Si può no-tare che tutti i coefficienti di correlazione item-test sono posi-tivi e che quelli deboli sono poco numerosi (su 36 coefficientidella serie 7 sono inferiori a 0,30). Per l'item n. 10 della se-rie I (fig. 3), la correlazione item-test è 0,51 e per l'item n. 19della serie II (fig. 4) è di 0,43.

Le distribuzioni di frequenza dei punteggi agli itero forni-scono nello stesso tempo informazioni sul grado di difficoltàdegli item e sulla loro relazione con il punteggio della scala. Percostruire queste curve si riporta il punteggio della scala inascissa e, in ordinata, per ogni valore della scala, la percentualedi soggetti che hanno superato l'item. Nella figura 5 si possonovedere le curve corrispondenti ai 12 item della serie. .L'itero nu-mero 10, ad esempio (rappresentato dalla curva numero 1.0), èstato superato da circa il 30% dei soggetti che hanno avuto altest un punteggio globale di 6 e da circa il 75% di coloro chehanno avuto un punteggio globale di 8. Le curve più soddi-sfacenti sono quelle per cui si può osservare una progressioneregolare passando da punteggi della scala bassi a punteggi viavia più alti. 'Esse mostrano che l'acni contribuisce alla diffe-renziazione dei soggetti e che l'abilità valutata dall'i tem è pros-sima a quella valutata dall'intero test. Al momento della co-struzione del test e della sua revisione del 1962, gli acni sono

30 31

Page 16: i Test Intll.

Percentualedi successoperogni item 5 0

25 —

O

Pinteggio totale

FIG. 5. Distribuzioni di frequenza dei 12 item della serie l delle Matrici Progressive.

stati selezionati sulla base dell'esame delle distribuzioni di fre-quenza dei punteggi.

Ci sono altri modi per valutare l'unidimensionalità dellascala: ad esempio, verificare che tutte le intercorrelazioni tra gliitem siano forti o verificare che il superamento di un item di uncerto livello di difficoltà implichi il superamento degli item didifficoltà inferiore.

3. Scale di punteggio

Il punteggio grezzo al test dà un'indicazione della prestazionedel soggetto, ma non consente di confrontare questa prestazione

con quella dei soggetti di un gruppo di riferimento. Per questoscopo, i punteggi grezzi sono trasformati in scale di punteggio.Le scale di punteggio sono dei sistemi di categorie ordinate in cuiè possibile distribuire tutti í soggetti di un gruppo di riferimento.

Si distinguono due grandi categorie di scale di punteggio aseconda che si basino su categorie ordinate di punteggi grezzi(quantili) o corrispondano alla suddivisione secondo certe regolecli una distribuzione gaussiana o normale (distribuzione norma-lizzata).

3.1. I quantili

i quantili sono i limiti tra due categorie. Si chiamanoguarnii se la distribuzione dei punteggi è suddivisa in quat-tro categorie, decili se le categorie sono dieci. e centili se cisono 100 categorie. Succede spesso che, essendo il vocabo-lario in quest'ambito piuttosto flessibile, con il termine quan-tile ci si riferisca alle categorie stesse. Dire quindi che un sog-getto è nel terzo decile significa che quel soggetto si collocain un gruppo a cui appartiene il 10% dei soggetti e tale cheil 20% ha punteggi superiori ad esso e il 70% punteggi in-feriori. La costruzione di questa scala è molto semplice: ba-sta raggruppare i punteggi grezzi in modo tale da ottenerecategorie numericamente omogenee. Si può anche stabilireun cern& calcolando direttamente la percentuale di soggettiche hanno ottenuto un certo punteggio grezzo o dei punteggiinferiori. Si può osservare nella tabella 2 l'esempio di unascala in centili della serie II. del test di Raven che era statoproposto senza vincoli temporali a studenti dell'Università diBerkeley.

TAB. 2 Divtrikinzione in ceratili della serie TI (1962) delle Matrici Progres5ive (Id'ellasuperiore) applicata senza limiti di 'colpo a studenti di Berkeley (Callf)

h int eggiogrezzo

Percentile Punteggio

grezzoPerenni ile

13 26 4315 3 27 5217 4 28 '5718 6 29 6519 7 30 7120 il 31 8121 14 32 8677 18 33 8923 24 34 9324 29 35 9825 37 36 100

L' l% degli studenti ha un punteggio grezzo minore o uguale a 13. 113 % degli stu-denti ha un punteggio grezzo minore o uguale a 15, ecc. Questa distribuzione con-sente di collocare un soggetto qualsiasi in rapporto agli studenti americani dell'Uni-versità di Berkeley Supponiamo che nn soggetto abbia ottenuto un punteggio di 25.1:8%, degli studenti americani ha ottenuto questo punteggio (37-29), il 299 lin avumpunteggi inferiori e il 6.30 (100-37) ponteggi superiori. Questo soggetto si situaquindi in prossimità dei due terzi della distribuzione degli studenti americani.

100 —

75 -

32

33

Page 17: i Test Intll.

3.2. Le distribuzioni normalizzate

I livelli delle categorie di una scala normalizzata vengonodefiniti a partire dalle proprietà della distribuzione teorica diGauss, detta anche distribuzione «normale». La curva che rap-presenta questa distribuzione è simmetrica e a campana (fig.6). Essa indica come si distribuiscono le categorie (riportate inordinata) in funzione di una variabile (riportata in ascissa). Co-noscendo la media e la deviazione standard' di una distribu-zione gaussiana, si può calcolare la proporzione della popola-zione che si colloca al di qua o al di là di un dato valore dellavariabile considerata, o tra due valori della variabile (il risul-tato di questi calcoli si può trovare in alcune tavole). Se siesprime il valore di una variabile in deviazioni standard dallamedia, si sa che il 6,7% della popolazione si situa al di là di 1,5deviazioni standard dalla media, e che il 24,2% della popola-zione si situa tra 0,5 e 1,5 deviazioni standard, ecc. (fig. 6).

38,)%

24,2%

camerate la distribuzione di queste classi, attribuendo adognuna di esse uno stesso intervallo sull'asse delle ascisse, si ot-tiene un istogramma che si avvicina alla curva di Gauss (fig. 7).

38,2%

24,2%

6,7 %

4

19(i. 7. lstogrannua corrispondente alla distribuzione di Causa.

Nella tabella 3 si può osservare un esempio di scala in 5 ca-tegorie normalizzate della serie II (versione del 1947) del testdi Raven somministrato con un tempo massimo di quaranta mi-nuti ad un campione francese con alto livello di scolarità.- La scelta di un tipo di scala è guidata da ragioni di como-

dità. Se si vogliono differenziare i soggetti con precisione, sisceglierà una scala composta di numerose categorie. General-

24,2%

6,7

24,2%

6,7%

-3/2 -1/2 1/2 3 '2 X

FIG. 6. La distribuzione teorica di (Muss.

Si può rappresentare la distribuzione dei punteggi grezziosservata ad un test con una curva ottenuta collocando le ca-tegorie in ordinata e i punteggi grezzi in ascissa. Non è dettoche tale curva sia identica alla curva teorica di Gauss. Ma sipossono raggruppare i punteggi grezzi al fine di formare nuoveclassi la cui distribuzione sarà prossima a quella di Gauss (è ilsistema di costruzione delle distribuzioni normalizzate, dettaanche «normalizzazione»). Per costruire una distribuzionenormalizzata in 5 classi, sí costituirà una prima classe con il6,7% dei soggetti più efficienti, poi una seconda classe con il24,2% dei soggetti che seguono, ecc. Se si rappresenta grafi-

34

"1'AB. 3 1)isiribuzion e in 5 caicgorú.' norntalizszate della seriell (1047) delle Matrici Pro-

grei-vive (livello superiore) applicata in 40 a 200 adulti tra 25e 40 anni,

la/umili ue imdcrie vatentoiche e residenti nella regione th Parigi

Categorienormalizzate

39

Circa il 6,7% dei soggetti 1 .1a un punteggio almeno uguale a 41.Circa il 24,2% dei soggetti ha un punteggio almeno uguale a 36 e interiore a 41.

Circa il 38,2% dei soggetti ha un punteggio almeno uguale a 32 e inferiore a 36.Circa il 24,2% dei soggetti ha un punteggio almeno uguale a 27 e inferiore a 32.Circa il 6,7% dei soggetti ha un punteggio almeno uguale a 26.1.1u qualsiasi soggetto che ha un punteggio grezzo di 39 può essere collocato in ungruppo di soggetti che comprende circa il 24,2% della popolazione, il 6,7% ha pura-.reggi superiori a questo gruppo c 6),1% punteggi inferiori,

35

Punteggigrezzi

4 I e oltre

36.10

32-35

27-3

26 e meno

Page 18: i Test Intll.

mente, si considera più facile distinguere i soggetti alle estre-mità della distribuzione piuttosto che verso il suo centro doveessi sono prossimi alla media. Ciò induce a preferire aí quan-tili le distribuzioni normalizzate nelle quali le frequenze sonopiù numerose nelle classi centrali che in quelle estreme. A finipratici, è sempre utile disporre di scale relative a diversi gruppidi riferimento.

Le scale di punteggio consentono anche confronti intrain-dividuali. Se un soggetto si mostra migliore in una prova ver-bale piuttosto che in una prova di ragionamento, si può direche la sua capacità verbale è superiore alla sua capacità di ra-gionamento. I confronti intraindividuali sono facilitati dalla co-struzione di profili. Un esempio di profilo è presentato nella fi-gura 8.

2

Test verbale

'l'est numerico

Test spaziale

FIG. 8. Profilo psicologico di un soggetto a partire dai punteggi standardizzati (scalanormalizzata in cinque categorie) ai tre test.

3.3. Il quoziente intellettivo

Esistono due definizioni di «quoziente intellettivo» (Q1).Questa espressione può riferirsi ad un indice di velocità diluppo intellettivo (QI-Stern) o ad una misura di efficienza cal-colata rispetto alla media di un gruppo, ovvero una forma dipunteggio ponderato (QI-Wechsler «di deviazione»). La primadefinizione è quella originaria ed è stata presentata nel primocapitolo con la descrizione della scala di intelligenza messa apunto da Binet. La seconda definizione è decisamente la piùutilizzata oggi.

Il QI di tipo Stern, di grande praticità, è il QI determinatodal rapporto tra l'età mentale e l'età cronologica; questo indiceebbe molto successo ma evidenziò presto due dei suoi limiti.Un primo limite viene dal fatto che l'indice è inadatto alla de-scrizione delle differenze tra gli adulti. Certamente lo svilupponon si arresta dopo l'adolescenza, ma, a partire dall'adole-scenza, cambia ritmo e, radicalmente, natura. Se sembra abba-stanza naturale attribuire ad un bambino di 10 anni un'età men-tale di 12 sarebbe piuttosto strano attribuire ad un adulto di 45anni un'età mentale di 52. La nozione di età mentale e, di con-seguenza, quella di QI, è adatta per il periodo di rapido svi-luppo che va dall'infanzia all'inizio dell'adolescenza. Si è ten-tato di caratterizzare gli adulti per un QI-Stern (scegliendo ar-bitrariamente una stessa età cronologica per tutti gli adulti e fa-cendo corrispondere, ancora in modo arbitrario, delle età men-tali alle performance), ma questi tentativi sono rimasti pococonvincenti e sono stati abbandonati. 11 secondo limite del QI-Stern è di altra natura. Per definizione la media dei Q1 è la stessaa tutte le età (e uguale a 100), ma ciò non vale per la loro di-spersione. A certe età è più concentrata mentre ad altre è piùdistribuita, senza che questo abbia un significato particolare intermini di sviluppo. Questo fenomeno sí spiega per il fatto chead ogni età gli itero sono diversamente rappresentativi dell'etàstessa (un item è adeguatamente rappresentativo di un'età se illasso di tempo che trascorre da quando è risolto da qualcuno aquando e risolto da quasi tutti è breve). Ne consegue quindi unacerta ambiguità nel significato del QI se si confrontano soggettidi età diverse: secondo l'età, varia la proporzione di soggetti chesuperano un QI dato. Questi limiti hanno indotto numerosi au-tori, tra cui Wechsler verso la fine degli anni Trenta, a definireil Q1 in tutto un altro modo.

QI di tipo Wechsler ha la proprietà di non essere un «quo-ziente». Sarebbe stato certamente preferibile trovare un altronome a questo indice, ma quello di QI è stato mantenuto perla popolarità che tale sigla aveva ormai acquisito. Il QI-Wech-sler è unicamente un indice di efficienza che consente di collo-care il soggetto all'interno del suo gruppo di età, senza alcun ri-ferimento allo sviluppo. Per stabilire questi QI si opera una tra-sformazione dei punteggi grezzi al fine di ottenere una nuovadistribuzione dei punteggi, che si chiamerà dei QI, e che avràla forma della distribuzione di Laplace-Gauss (normalizza-

36 37

Page 19: i Test Intll.

zione), una media uguale a 100 e una deviazione standard di 15.Questa trasformazione dei punteggi grezzi è assolutamente le-gittima perché non modifica l'ordine dei soggetti. I valori 100e 15 sono convenzionali e se ne possono scegliere altri (ma al-lora non si parla di QI)'. Conoscendo il QI di un soggetto si sacome egli si situa nel gruppo di riferimento. Dire che un sog-getto ha un 01 di 100 significa che ha tanti soggetti avanti a luiquanti dietro, e niente altro. Dire che un soggetto ha un QI di115 significa che ha circa il 16% dei soggetti del suo livello dietà avanti_ a lui (16% è la percentuale della popolazione che sicolloca oltre un punteggio eli «media + una deviazione stan-dard» se la distribuzione è gaussiana). Con questo tipo di QIdiventa possibile classificare anche gli adulti. Del resto, la di-spersione dei QI individuali è, per costruzione, la stessa a tuttele età. Ma questo QI non è che una forma di classificazione tratante ed è dunque possibile, e del resto eli solito lo si fa, espri-mere in QI i risultati a qualsiasi test. Si può osservare nella ta-bella 4 uno schema di corrispondenza tra i Q1 e i percentili.

Nel capitolo 4 affronteremo i dibattiti e le polemiche ri-guardanti il QI. Tali dibattiti sono infatti relativi al contenutodi alcuni test e all'interpretazione dei loro risultati, non alla clas-sificazione scelta per descriverli.

7'Al3. 4. 1;11 ,,A1 i, COM pOndenZd lui c ceni/li

(:ertili

130 2

125 5

120 9

115

110 25

105 37100 50

95 63

90 -75

85 84

80 91

75 95

70 98

11 2`í, della popolazione ha un punteggio superiore al soggetto che ha un Q1 di 130.

4. (71i errori di

Gli errori di misura possono essere dovuti o al momentoparticolare in cui si procede alla misurazione o al dispositivostesso scelto per quest'ultima.

1.1. La stabilità o fedeltà

Quando si applica un test ad un gruppo di soggetti, ce n'èsempre qualcuno che non è troppo in forma (può essere ma-lato, avere preoccupazioni che lo distraggono, ecc.) mentre al-tri sono ben concentrati sul compito. Se si fosse applicato il testin un altro momento, altri soggetti non sarebbero stati in formae altri sarebbero stati ben disposti per svolgere il compito. Ilpunteggio cli un soggetto può così variare in modo imprevedi-bile nella misura in cui le cause di questa variazione non sonoanalizzate, in funzione del momento dell'osservazione. La mi-sura è quindi intaccata da un errore aleatorio relativo a questofattore temporale. Si dice che essa non è perfettamente fedele,o, più precisamente, che essa manca di perfetta stabilità o dicostanza. Sarebbe certamente desiderabile poter disporre elimisure «senza errori». A questo scopo, si potrebbe pensare diapplicare il test 1111 gran numero di volte allo stesso soggetto edi fare la media dei punteggi ottenuti. Gli «errori» che avvan-taggiano il soggetto sarebbero così compensati da quelli che losvantaggiano. Ma una tale procedura non è praticabile. Nonsolo sarebbe troppo costosa in termini di tempo, ma i soggettidopo le prime prove apprenderebbero, più o meno rapida-mente, a risolvere i problemi del test, e per molti questi pro-blemi perderebbero presto interesse. Dunque i fenomeni di ap-prendimento e di demotivazione possono essere consideraticome errori eli misura. Il test è quindi applicato una sola volta.Ma l'esaminatore dispone di informazioni sulla sua stabilità chegli permettono di accorciare una fiducia più o meno grande allamisura ottenuta.

Per valutare la stabilità di un test, lo si applica in due ripresead uno stesso gruppo di soggetti e si calcola un coefficiente clicorrelazione tra le due serie di punteggi. Tale coefficiente èdetto di fedeltà o eli stabilità. Se è elevato, ovvero se gli indivi-dui si collocano approssimativamente ad uno stesso livellonella prima come nella seconda somministrazione, la misura

.38 39

Page 20: i Test Intll.

verrà considerata stabile, minimamente influenzata dal mo-mento di osservazione. In caso contrario, se íl coefficiente dicorrelazione è debole, la misura è poco stabile e non ci con-sente di classificare il soggetto in modo affidabile. La tabella 5mostra una tavola di correlazione che corrisponde ad un coef-ficiente di fedeltà di 0,61.

I coefficienti di fedeltà dei test di intelligenza, calcolati adintervalli di diverse settimane o di diversi mesi, sono sempreelevati. Le Matrici :Progressive di Raven, applicate ad adole-scenti o ad adulti, ha una stabilità di 0,90. Un tale coefficienteindica che i soggetti si collocano praticamente a livelli identiciad ognuna delle somministrazioni e dunque che l'errore attri-buibile al momento dell'applicazione è irrilevante.

TAB. 5. Tavola di correlazione Ira la prima e la seconda somministrazione di un lesi

SecondaSommi.

Prima somministrazione

60-64 65-69 70-74 75-79 80-8,1 85-89 90-94 95-99

120-124

115-119

110-114 1 2

105-109 1 4 6 2

1(10-104 7 5 2

92-99 2 C) 4

90.94 2 5

85-89 3 I 1

80-84 2

85 soggetti hanno fatto un test in due momenti. Dei 3 soggetti che hanno ottenutoun punteggio compreso tra 60 e 64 alla prima somministrazione, uno ha ottenuto unpunteggio compreso tra 85 e 89 alla seconda, un altro un punteggio compreso tra 90e 94 e un terzo un punteggio compreso tra 95 e 99. Coloro clic hanno ottenuto unpunteggio elevato alla prima somministrazione hanno tendenza a ottenere un pun-teggio elevato anche alla seconda. La correlazione è positiva e moderata (0,61). Sinota un effetto di apprendimento: il punteggio medio alla seconda è più elevato chealla prima.

4.2. L'equivalenza e l'omogeneità

Gli errori di misura possono anche avere origine dallascelta delle situazioni proposte ai soggetti. Questa scelta siorienta dapprima verso una data categoria cli situazioni, poiverso situazioni più specifiche. Per valutare l'abilità di ra-

gionamento induttivo, Raven ha scelto innanzitutto dei pro-blemi con matrici da completare e poi ha dato loro una formaparticolare. Questi due tipi di scelta non hanno lo stesso va-lore. La scelta di una categoria dí situazioni è in relazione conil grado di «generalità» della dimensione lungo la quale si or-dinano i soggetti. Esiste una dimensione generale di ragio-namento induttivo, ovvero una capacità che opererebbe nonsoltanto nei test di matrici, ma anche, ad esempio, nella ri-cerca di leggi di trasformazione in serie di lettere o di cifre,o su contenuti significativi? O, al contrario, bisogna distin-guere dimensioni diverse, ad esempio, una che riguarda l'a-bilità di ragionamento induttivo con problemi di matrici, el'altra che riguarda la capacità di ragionamento induttivo suserie di cifre? Riprenderemo questi quesiti nella discussionesulla validità teorica. Una volta scelta una categoria di situa-zioni, rimane da dare un contenuto ad ogni problema. La li-sta dei contenuti possibili è quasi infinita e la scelta di cer-tuni invece di altri è sempre molto arbitraria. Problemi dif-ferenti da quelli scelti da Raven sarebbero apparentementeandati bene, anche se non è del tutto certo. Ci si deve quindidomandare in che misura il punteggio di un soggetto non èinfluenzato dal carattere specifico delle situazioni problemapropostegli.

Per valutare il peso di questi errori rispetto alla situazione,si possono costruire delle forme parallele dello stesso test, ov-vero diversi test destinati a valutare la stessa abilità e relativiallo stesso tipo di situazioni, ma realizzati in modo diverso. Sesi intende, ad esempio, valutare l'estensione del vocabolario insituazioni di produzione di definizioni, si possono costituirediverse liste di parole da definire, simili per alcuni aspetti (lafrequenza d'uso, il carattere più o meno astratto, ecc.) ma di-verse per altri. Il coefficiente di correlazione tra due formeparallele, o coefficiente di equivalenza, ci indicherà in che mi-sura le osservazioni sono fedeli rispetto alla scelta delle situa-zioni. Un coefficiente elevato indica che i soggetti si classifi-cano allo stesso modo ín ogni prova, e quindi che gli errori ri-feribili alla scelta della situazione sono trascurabili. Un coeffi-ciente debole indicherà che la classificazione dei soggetti va-ria al variare del contenuto delle situazioni. Poiché questa va-riazione non è né prevedibile né spiegabile, il significato delledue prove è quindi ambiguo.

40

41

Page 21: i Test Intll.

Quando si ha un test formato da una serie sufficientementelunga di itera, le forme parallele possono essere ottenute sepa-rando gli itero pari da quelli dispari. Il coefficien te di correla-zione tra queste due metà del test, chiamato coefficiente di omo-geneità, ha lo stesso significato del coefficiente di equivalenza.Si può osservare che il coefficiente di omogeneità caratterizzasoltanto una metà del test e sottostima la fedeltà del test intero;inoltre prende in considerazione soltanto gli errori dovuti allasituazione mentre il coefficiente di equivalenza tiene conto an-che degli errori dovuti al momento dell'osservazione , dato chenon èI possibile superare due test contemporaneamente.

coefficienti di equivalenza e di omogeneità dei test di in-telligenza sono generalmente elevati. Ad esempio, calcolati sugruppi di studenti di diversi paesi, i coefficienti della serie Hdelle Matrici Progressive Raven si collocano tra 0,71 e 0,83.

Gli errori di misura possono anche derivare dalla soggetti-vità degli osservatori. Abbiamo avuto modo di vedere all'ini-zio di questo capitolo che la funzione della standardizzazioneera precisamente di ridurre gli effetti di questa soggettività. Neitest quindi il peso delle fonti d'errore relative all'osservatorediventa molto debole,

5. La validità

Qual è l'interesse pratico di un test e qual è il significatodelle misure che esso consente di ottenere? Ponendosi questedomande ci si interroga sulla validità empirica e sulla validitàteorica della prova.

5.1. La validità empirica

A fini pratici, i test sono utilizzati come strumenti dia-gnostici o prognostici e sono validi se contribuiscono effetti-vamente a diagnosi che si riveleranno esatte o a buoni prono-stici.

In quanto strumenti di diagnosi, essi possono favorire, adesempio, una migliore comprensione dell'origine di certe dif-ficoltà scolastiche o di certi disturbi del comportamento, equindi dei rimedi più adeguati. Si dirà ad esempio che un testdi tipo spaziale è valido se, essendo in correlazione con delle

difficoltà di 'apprendimento in matematica, esso permette diprecisare l'origine di sottotipi di difficoltà, o 'ancora che untest di memoria è valido se consente di distinguere pazientiche soffrono di turbe della memoria di origine differente.Questa validità diagnostica si manifesta nel corso della praticaclinica e non è formalizzata, ma intrattiene comunque legamistretti con la validità teorica. In effetti, l'osservazione realiz-zata per mezzo di test ha più possibilità di essere utile seprende posto in un modello validato di funzionamento psico-logico del soggetto.

In quanto strumenti di prognosi, i test forniscono infor-mazioni utili per promuovere azioni di prevenzione, di orien-tamento e eli formazione. La validità predittiva è ben forma-lizzata e può essere espressa sotto forma di coefficienti.

Per giudicare la validità predittiva di un test ' è necessario

uno studio preliminare. Il test viene applicato ad un gruppo disoggetti e, qualche mese o qualche anno più tardi, si va ad Os-servare la posizione (lei soggetti rispetto alla variabile conside-rata a scopo prognostico (questa variabile si chiama criterio;può trattarsi, ad esempio, del successo nell'istruzione o dell'a-dattamento ad una professione). Si predispongono quindi pergli stessi soggetti due serie (li osservazioni di cui si misura ilgrado di associazione con il calcolo del coefficiente di correla-zione che è il coefficiente di validità predittiva del test per il cri-terio considerato (e per i soggetti esaminati). Un coefficienteelevato indica che era possibile una buona previsione. Si potràallora utilizzare questa informazione per fare dei pronostici ve-ritieri. Si prediranno dei punteggi elevati al criterio per coloroche hanno ottenuto punteggi elevati al test (predittore). Pro-cedendo così, si ammette che i fattori che hanno spiegato lariuscita al criterio nel passato continueranno a spiegarla nel fu-turo, il che suppone una stabilità abbastanza buona dell'am-biente o, nel caso in cui questa non sia assicurata, una revisionefrequente della validità. Se il coefficiente di correlazione tra iltest e il criterio è debole, si potranno fare solamente pronosticiimprecisi, nel qual caso è più opportuno astenersi completa-mente dal fare previsioni sui soggetti.

L'esame del diagramma di correlazione permette di preci-sare i valori pronosticati dal criterio e l'importanza dell'erroredi pronostico. Per un dato valore del predittore si prevede, peri soggetti che hanno ottenuto tale valore, la media dei punteggi

42

43

Page 22: i Test Intll.

al criterio. Lo scarto medio tra questo punteggio medio e i pun-teggi effettivamente osservati è una misura della precisione delpronostico (vedi tab. 6).

TAB. 6. Tavola di correlazione Ira test e criterio

Punteggi Punteggi al test

al criterio 0-2 3-5 6-8 9-11 12-11 15-1.7 18-20 21-23

li l

10 1 2

9 l 1 3 7 2

8 4 5 27 3 3 2 4 4

6 I 6 I 5 2

5 1 2 1 9 5 4

4 2 1 2 2 2 2 1

3 1 2 2 2 1

2 3 1 2 1 2

113 soggetti sono caratterizzati dal loro punteggio al test e dal loro punteggio al crite-rio, ad esempio il voto ad un esame. (Di 6 soggetti che hanno avuto un pun teggio coni-preso tra 0 e 2 al test, 3 hanno avuto un punteggio di 2 al criterio, 1 un punteggio di 3e 2 un punteggio di 4.) La correlazione tra il test e il criterio è di 0,65. Quale voto, adesempio, si può predire al criterio per i 25 soggetti che hanno un punteggio compresotra 12 e 14 al test? Si porrebbe predire il voto ottenuto pii) frequentemente nel corsodegli studi in questione (qui il voto 5 ottenuto da 9 soggetti). Si mostra clic, in generale,con distribuzioni dei voti al criterio, per un voto dato al predittore, la predizione dellamedia di queste distribuzioni è quella che minimizza gli errori di pronostico. Nell'e-sempio scelto è così il voto 5. Pcr misurare l'importanza dell'errore di previsione, si puòcalcolare lo scarto medio tra il punteggio pronosticato e il punteggio ottenuto nel corsodegli studi. Nell'esempio scelto lo scarto medio è diI,1 pomi.

Citiamo a titolo esemplificativo i lavori in cui ci si proponedi prevedere la riuscita scolastica degli adolescenti a partire dalleMatrici Progressive di Raven (livello superiore). T coefficienti divalidità prognostica sono dell'ordine di 0,40 per la conoscenzadella lingua e di 0,60 per la riuscita nelle discipline scientifiche.

Succede frequentemente che si proceda nello stesso mo-mento sia alla misura del predittore che a quella del criterio. Siparla allora di validità concorrente. L'interesse principale dellavalidità concorrente è d'indicare in quale misura è possibilerimpiazzare una procedura d'osservazione costosa con unaprocedura che lo è meno, generalmente un test. Se, ad esem-

pio, c'è una forte correlazione tra il livello di lettura valutatoda insegnanti durante corsi preparatori (criterio) e i punteggiad un test di lettura (predittore), si potrà sostituire il giudiziodelle insegnanti con l'applicazione del test. Se si hanno buoneragioni di pensare che le differenze tra gli individui osservatesul predittore sono antecedenti a quelle osservate sul criterio,si può ritenere che la validità concorrente fornisce informazioniequivalenti a quelle della validità prognostica. Si può trovareun esempio di validità concorrente nella tabella 7 (in questocaso, la validità empirica non è espressa da un coefficiente dicorrelazione, tuttavia i dati indicano una correlazione tra i pun-teggi al test e il corso di studi intrapreso).

A13.7 . Punteggi medi alla serie H (1962) del test di Rauco riguardante 745 studentiaustraliani accedenti alle diverse facoltà universitarie

Lettere 21,9

Scienze 25,1

Ingegneria 25,6

Giurisprudenza 20,8

Medicina 24,1

Odontoiatria 22,1

Agraria 24,1

Economia e commercio 22,3

5.2. La validità teorica

Un test ha una validità teorica tanto più soddisfacentequanto più si conosce ciò che il test sta misurando, ovverotanto più le osservazioni realizzate con quel test possono es-sere interpretate in modo coerente e senza venire smentite dadati sperimentali o d'osservazione. La validità teorica dei testdi intelligenza può essere definita in una prospettiva strutti Hrale e in una prospettiva funzionale. Nella prima, ci si do-manderà come si situa il test rispetto alle teorie dell'organiz-zazione delle capacità cognitive, ossia in relazione alle grandidimensioni dell'efficienza cognitiva che permettono di diffe-renziare gli individui. Nella seconda, ci si domanderà come sicolloca il test in rapporto ai parametri dei modelli di funzio-namento cognitivo, o, in altri termini, ci si interrogherà sulleparentele tra le operazioni mentali sollecitate dagli itera del

44 45

Page 23: i Test Intll.

test e quelle descritte dai modelli di funzionamento del sog-getto. Illustriamo queste nozioni riprendendo la prova dellematrici progressive.

Abbiamo già fatto riferimento nel primo capitolo alla teo-ria dell'organizzazione delle differenze individuali nell'ambitoverbo-concettuale di Horn e Cattell 11966; cfr. L'ideati 19901.Questa teoria individua alcune grandi abilità o «fattori»: l'in-telligenza cristallizzata, data dalle conoscenze di cui dispon-gono i soggetti e dalla loro organizzazione (si manifesta parti-colarmente con la comprensione verbale); l'intelligenza fluida,che è la capacità di mettere in atto i meccanismi di base delragionamento in situazioni in cui le conoscenze di base sonopoco importanti; la visualizzazione, che è la capacità di rap-presentarsi e di trasformare visivamen te gli oggetti; la creati-vità o capacità di produrre associazioni di parole o idee origi-nali; e, infine, una capacità a reagire velocemente (velocità direazione). Queste differenti abilità non sono poi completa-mente indipendenti, poiché, a partire dalle loro intercorrela-zioni, è possibile definire una capacità cognitiva generale (oun fattore generale) vicino all'intelligenza fluida. Quando Ra-ven ha messo a punto il suo test, voleva espressamente co-struire una prova di capacità generale e, come Spearman, pen-sava che il miglior mezzo per raggiungere questo obiettivofosse di scegliere delle situazioni che consentissero di distin-guere gli individui sulla base della loro abilità a scoprire e ap-plicare delle relazioni (cioè, utilizzando un vocabolario suc-cessivo alla costruzione del test, sulla base della loro intelli-genza fluida). Ci si deve allora domandare se le Matrici Pro-gressive siano appunto un test di capacità generale e di intel-ligenza fluida. Dato che i soggetti si classificano praticamenteallo stesso modo al test di Raven e all'insieme dei test di in-telligenza fortemente saturati dal fattore generale, si può ri-spondere affermativamente a questa domanda.

Per giudicare la validità teorica al test di Raven in una pro-spettiva funzionale, ci si deve riferire alle teorie sul ragiona-mento induttivo. Consideriamo la teoria proposta da Stern-berg 11977; Sternberg e Gardner 1982; cfr. Huteau 1985;1995; Lautrey 19951 Questa teoria scompone il ragionamentoinduttivo in una sequenza di operazioni intellettive o di com-ponenti elementari che si articolano all'interno di componenticli livello gerarchico superordinato o «metacomponenti». Tra

le componenti elementari troviamo la costruzione di una rap-presentazione analitica degli elementi di una situazione (codi-fica), la definizione di relazioni tra gli elementi (inferenza), lageneralizzazione di queste relazioni (analogia) e la loro utiliz-zazione per generare nuovi elementi (applicazione).

Nell'item delle Matrici Progressive riportato nella figura

4, ad esempio, la componente di codifica è l'operazione concui i diversi attributi delle figure vengono identificati e fissatiin memoria (grande quadrato, piccolo quadrato, croce, cer-chio...). La componente di inferenza è l'operazione con cui laregola di trasformazione delle figure viene scoperta confron-tando tra loro gli attributi di ognuna; nella prima colonna que-sta operazione di confronto porta a scoprire che la terza figurasi ottiene sommando la croce della seconda nel piccolo qua-drato della prima; nella seconda colonna l'inferenza consentedi cogliere che la terza figura è ottenuta aggiungendo il cer-chio della seconda alla croce della prima. La componente dianalogia è quella che viene messa in gioco nel confronto tra latrasformazione della prima colonna e quella della seconda;essa porta ad astrarre le caratteristiche comuni alle due regolee a comprendere che le prime due figure si sommano per ge-nerare la terza. L'applicazione è l'operazione con la quale laregola che è stata astratta con l'inferenza e l'analogia viene ap-plicata alla terza colonna per scoprire la figura mancante. Qui,la somma delle prime due figure porta ad anticipare la figuramancante aggiungendo la croce con il piccolo cerchio della se-conda figura nel piccolo quadrato della prima (senza che lacroce appaia nel quadrato grande). L'ultima operazione, lascelta della risposta, consiste nel cercare, tra le differenti fi-gure proposte al di sotto dell'item, quella che corrisponde allarisposta già anticipata. Le metacomponenti sono le operazionicon le quali queste differenti componenti elementari sono or-dinate e controllate. Una di queste metacomponenti, ad esem-pio, ha la funzione di modificare la distribuzione delle risorsecognitive (attenzione, tempo) tra le diverse componenti ele-mentari in funzione degli ostacoli incontrati. Una strategia, adesempio, può essere quella di passare all'inferenza non appenaviene individuata una differenza tra le figure della prima co-lonna; un'altra potrebbe essere di dedicare più tempo e risorsead una codifica esaustiva prima di passare all'inferenza. Lamessa in atto efficace di queste componenti elementari e me-

4647

Page 24: i Test Intll.

tacomponenti suppone, fin dall'inizio del ragionamento e nelcorso del suo svolgimento, una strategia analitica che consentedi dissociare i differenti elementi da codificare, Essa richiedeanche particolare attenzione all'elaborazione di una rappre-sentazione adeguata della situazione poiché è su tale rappre-sentazione che opereranno l'inferenza, l'analogia e l'applica-zione.

Questa descrizione del ragionamento induttivo si applicaabbastanza bene agli item del test di Raven nel momento incui diventano difficili e non possono essere risolti intuitiva-mente. Si può accertare l'esistenza di questo cambiamento os-servando, specialmente in situazioni normali, i processi messiin atto dal soggetto.

Sí noti che ci sono due aspetti della validità teorica di untest: la qualità del suo rapporto o della sua integrazione conuna teoria e la validità di tale teoria.

Piuttosto che verificare se una teoria valida rende contodelle procedure di soluzione attivate per rispondere agli itemdi un test, si può seguire una direzione in qualche modo in-versa: analizzare le procedure di risoluzione degli item di untest, e poi mostrare che sono abbastanza generali. Questo me-todo è stato applicato alle Matrici Progressive di Raven daCarpenter, Just e Shell 11.990] ed ha fornito loro risultati com-pletamente compatibili con il modello che verrà descritto quidi seguito. Questi autori, secondo una metodologia classica inpsicologia cognitiva, mettono in evidenza le procedure di so-luzione degli item a partire dai commenti dei soggetti nel corsodello svolgimento della prova (protocolli verbali), dalle regi-strazioni dei movimenti oculari e dalla frequenza e natura de-gli errori.. dati raccolti mostrano che i soggetti scompongonoogni problema in una serie di microproblemi che vengono ri-solti in successione. Quando l'item richiede l'applicazione dinumerose regole, anch'esse sono scoperte in successione, sullabase di numerosi confronti tra gli elementi della matrice. Ilsuccesso ad un item implica quindi il superamento dí tutta unaserie di piccoli problemi più elementari e l'integrazione pro-gressiva delle soluzioni. Carpemer e collaboratori mostranoche le differenze tra soggetti molto efficienti e soggetti me-diamente efficienti derivano da differenze nella capacità di de-finire dei sotto-obiettivi, di conservare nella memoria di lavoroe integrare le informazioni ottenute nel corso della sequenza

di soluzione. A partire dai principi di soluzione messi ín evi-denza da queste analisi, gli autori hanno elaborato un pro-gramma informatico che simula in modo soddisfacente i com-portamenti osservati nei soggetti reali. Ad esempio, l'ordine dicomplessità degli item, così come è definito dalla simulazione,coincide con l'ordine di difficoltà determinato dalle frequenzedí successo degli item reali. Essi mostrano inoltre clic que-st'analisi dei processi di soluzione si applica a tutta una classedi processi di ragionamento.

In sintesi, un test è una situazione di valutazione codifi-cata. Innanzitutto, questa situazione è standardizzata per mi-gliorare l'oggettività dell'osservazione effettuata: le risposte ein generale i comportamenti dei soggetti non potranno essereadeguatamente confrontati, a meno che non vengano ottenutiin situazioni il più possibile somiglianti e la loro valutazionesia la stessa indipendentemente dall'osservatore. Questa si-tuazione di valutazione è classificata anche in modo da collo-care il soggetto osservato all'interno della popolazione dí rife-rimento a cui appartiene. L'affidabilità della valutazione ef-fettuata può essere espressa con differenti coefficienti di fe-deltà. Infine, indagini sulla validità sono state condotte per ap-purare che si valuti proprio ciò che il test intende valutare.

Queste proprietà dei test sono state presentate riguardo aitest di intelligenza, ma esse caratterizzano anche i test di per-sonalità (sia che sí tratti dí autodescrizioni o di osservazionidel comportamento), i test sulle abilità scolastiche e i test diattitudine professionale.

NOTE, AI, CANTOLO SECONDO

' La correlazione è il grado di dipendenza tra due variabili. coefficientidi correlazione variano da +1 a --1. Un coefficiente di +I esprime una rela-zione diretta perfetta tra le due variabili. In questo esempio indicherà chetutti i soggetti che hanno superato l'item sono anche quelli che hanno il mi-glior punteggio alla prova. Un coefficiente di –1 esprime una relazione in-versa (i soggetti che hanno superato l'item sono quelli che hanno i punteggipiù bassi alla prova). Un coefficiente nullo traduce l'assenza di relazione trale due variabili. Coefficienti come quelli indicati, da 0,40 a 0,60, corrispon-dono ad una relazione diretta di forza moderata.

= La deviazione standard esprime la dispersione dei punteggi attornoalla media della distribuzione. Corrisponde -allo scarto medio dei punteggidei soggetti dalla media.

48 49

Page 25: i Test Intll.

' Questi valori sono convenzionali, ma mini sono scelti del tutto u caso:100 è per definizione il QI medio di un gruppo di età quando il Q1 è defi-nito dal quoziente dell'età mentale e dell'età cronologica, e 15 è approssi-mativamente il valore osservato dalle deviazioni standard delle scale di QI-Stem (con le fluttuazioni di cui si è discusso in precedenza). Scegliendo que-sti valori piuttosto che altri ci si assicura una certa corrispondenza tra il Q1individuato con una scala di tipo Wechsler e il QI rilevato con una scala ditipo Stern. lì per questo motivo, del resto criticabile, che si utilizza íl ter-mine QI per indicare il punteggio standard totale ottenuto con una scala ditipo Wechsler.

(AMIDI TERZO

LE, GRANDI CATEGORIE DEI TESTDI INTELLIGENZA

Esistono numerosi test di intelligenza e sarebbe noiosofarne una lista. Introdurremo invece 'alcuni criteri a partiredai quali è possibile distinguerli. Un test rappresentativo diognuna delle principali categorie sarà poi presentato detta-gliatamente in modo da poter capire in che cosa consiste,come è stato costruito e che cosa si propone di misurare.

I diversi tipi di test di intelligenza

A partire dalle loro condizioni di somministrazione, sipossono distinguere test collettivi e test a somminístrazioneindividuale. Nei test di gruppo, di cui le Matrici Progressivedi Raven sono un esempio, i problemi sono presentati informa scritta e il soggetto deve spesso scegliere una rispostatra numerose proposte. La somministrazione è semplice e lepossibilità di osservazione del comportamento limitate. Neitest individuali la somministrazione è più complessa. Lo psi-cologo deve spesso dare delle consegne durante tutto il test,controllare che siano comprese interamente, misurare deitempi, rilevare dei successi o dei parziali fallimenti, ecc. I testindividuali sono anche delle situazioni più ricche rispetto aitest di gruppo per quanto riguarda le opportunità di osser-vazione, e lo psicologo può attingere informazioni che nonsono computate nella valutazione della prestazione al test.

Dal punto di vista del contenuto delle prove, si distin-guono tradizionalmente i test verbali, che richiedono la com-prensione del linguaggio, e i test non verbali, nei quali il ruolodel linguaggio è minimizzato, sia nelle consegne sia nella pro-duzione della risposta. Un test come le Matrici Progressivedi Raven è un test non verbale (il che non significa che il suc-cesso in questo test sia indipendente dalle abilità verbali). Tra

50 51

Page 26: i Test Intll.

i test non verbali, quelli detti «di performance» S0130 quelli

nei quali il soggetto deve manipolare materiale concreto.Si possono anche distinguere i test a seconda che l'intel-

ligenza valutata sia concepita come una capacità globale (adesempio il Binet-Simon) o come un insieme di capacità chedevono essere considerate separatamente (ad esempio, i testfattoriali). Nel primo caso, il test è costituito in modo tale chela capacità globale, definita nella teoria di riferimento, si ma-nifesti in tutte le situazioni proposte per valutarla. Ma que-ste situazioni non hanno in se stesse un interesse particolare,non sono che dei pretesti per la manifestazione della capacitàglobale. Questa sarà stimata sommando le performance nellediverse situazioni. Si otterrà così un punteggio globale chepotrà avere la forma semplice dí un punteggio ponderato, ola forma più complessa di un QI, o ancora la forma di unostadio di sviluppo. Nel secondo caso, quando la prospettivaè analitica, si definiscono delle categorie di situazioni semprein riferimento ad una teoria, nelle quali collocare ogni abilità.Le performance non sono sommate che all'interno di ogniclasse. I risultati sí presentano allora sotto forma di un pro-

filo di abilità.Di fatto l'opposizione tra le concezioni globali e le con-

cezioni analitiche è meno marcata di quanto non sembri, perlo meno fino a che si rimane nel campo dell'intelligenzaverbo-concettuale. Nel quadro di una valutazione che sivuole globale, si può sempre procedere a delle valutazioni piùanalitiche (le vedremo con la scala Wechsler). Nel quadro diuna valutazione analitica, si può sempre, dato che esistonocorrelazioni positive tra le singole abilità, calcolare un pun-teggio che distingua gli individui sulla base di ciò che c'è dicomune tra tutte queste abilità (lo vedremo in seguito con itest fattoriali).

2. Le scale di intelligenza: l'esempio della WAIS

Le «scale» rientrano nella categoria dei test basati su unaconcezione globale di intelligenza. Questa concezione sarà il-lustrata sull'esempio dell'adattamento italiano della WechslerAdult Intelligence Scale (WAIS) che, come indica il nome, èuna scala di intelligenza concepita per l'esame degli adulti.

2.1..I principi generali di costruzione

La WAIS è stata messa a punto nella sua prima versione daDavid Wechsler nel 1939. Wechsler era psicologo e lavorava ínun ospedale psichiatrico di New York; si trovava a dover valu-tare le capacità intellettive dei suoi pazienti adulti. La Stanford-Binet, il test individuale di intelligenza più utilizzato a queitempi negli Stati Uniti, gli sembrava poco adatta all'esame dipazienti adulti per numerose ragioni.

Innanzitutto, gli item erano stati concepiti per essere fa-miliari a dei bambini ed alcuni di essi provocavano per questaragione un certo disagio negli adulti, a cui venivano proposti.Inoltre, Wechsler trovava che la Stanford-Binet valutasse le ca-pacità intellettive essenzialmente attraverso le verbalizzazionidei soggetti, il linguaggio. Gli sembrava opportuno equilibraregli item che facevano appello al linguaggio con item detti «diperformance», per i quali cioè la capacità di risolvere problemipotesse essere valutata attraverso la manipolazione di materialeconcreto, senza che il soggetto dovesse usare il linguaggio perdare la sua risposta. Infine, esprimere il risultato sotto formadi un quoziente di rapporto tra l'età mentale e l'età cronolo-gica non aveva alcun senso nel caso degli adulti.

La messa a punto della WAIS, prima scala di intelligenzaadatta all'esame degli adulti, mirava a risolvere questi pro-blemi. La concezione di intelligenza che ha ispirato Wechslerera molto vicina a quella di Binet: essa non si basava su unavera teoria dell'intelligenza, ma piuttosto su un approcciomolto pragmatico. Wechsler pensava, come Binet, che la valu-tazione dovesse riguardare processi complessi, come la memo-ria, l'attenzione e il ragionamento, integrando un certo numerodi abilità più elementari. Egli considerava appunto l'intelli-genza come una capacità di adattamento piuttosto globale, os-servabile più nel modo in cui le diverse funzioni cognitive sonocoordinate che nell'efficienza di tale o talaltra funzione ele-mentare. Egli era dunque sostenitore, come Binet, del cam-pionamento di varie situazioni per comporre la scala, con l'i-dea che l'intelligenza venga valutata come risultante globaledell'efficienza in questo insieme di subtest, piuttosto che perl'uno o l'altro dei successi puntuali.

Per rendere la scala più adatta a degli adulti Wechslercontrollato che il contenuto degli item fosse vicino a situazioniloro familiari. Per ridurre il peso del linguaggio, egli ha diviso

52 53

Page 27: i Test Intll.

la scala in due sottoscale di uguale importanza, l'una verbalee l'altra di performance, in modo tale che si potesse calcolareun QI verbale ed un QI di performance. Questa decisione re-lativizza la concezione globale dell'intelligenza che ispiravaWechsler, poiché ammette che si possa trovare un QI piut-tosto differente a seconda che lo si valuti in situazioni verbalio in situazioni non verbali. E, d'altronde, una delle proprietàdi questa scala quella di mettere in evidenza discrepanze delgenere.

Il problema relativo all'inadeguatezza della nozione dietà mentale era anch'esso delicato e difficile da risolvere.Nelle scale di intelligenza, le performance aumentano in ef-fetti con l'età fin verso i 16-20 anni, a seconda delle scale odelle prove, ma non si evolvono oltre, salvo con l'invecchia-mento, per cui si osserva un declino in certe prove. Nel corsodella loro vita gli adulti continuano certamente ad acquisireesperienza e ad accumulare conoscenze, specialmente nelloro ambito professionale. Ma come abbiamo sottolineato aproposito del test di Binet-Simon, i test di intelligenza fannoil minor riferimento possibile alle conoscenze scolastiche oprofessionali. 11 loro obiettivo non è di valutare il livello díistruzione o la competenza sviluppata in uno specifico set-tore, ma l'abilità di risolvere problemi, di apprendere, diadattarsi a situazioni nuove. Questa capacita cresce in fun-zione dell'età fin verso l'adolescenza, ma non oltre. Cíò nonimpedisce che una volta raggiunta l'età adulta, si riscontrinosignificative differenze individuali nel livello raggiunto inqueste scale di intelligenza.

La nozione di età mentale è dunque inutilizzabile con gliadulti. Abbiamo visto nel capitolo 2, a proposito delle distri-buzioni di punteggio, che Wechsler ha risolto il problema ca-ratterizzando i soggetti per la loro posizione all'interno delladistribuzione dei punteggi del loro gruppo di età. Trasfor-mando i punteggi dí ogni gruppo di età in modo tale che cisia una media di 100 e una deviazione standard di 15, è stataloro attribuita una distribuzione confrontabile a quella di unQl. Nel momento in cui non rappresenta più il quoziente dirapporto tra l'età mentale e l'età cronologica, il QI dellaWAIS non è più un indice di velocità di sviluppo, ma un in-dicatore del rango che occupa il punteggio ottenuto tra quellidella popolazione di riferimento.

2.2. Presentazione della scala

La scala messa a punto da Wechsler è stata adattata e rivi-sta diverse volte negli Stati Uniti. Essa è stata anche tradotta eadattata per la popolazione italiana. Quella presentata qui diseguito è la versione rivista (WAIS-R), nel suo adattamento ita-liano [Wechsler 19971. La WAIS-R si compone di undici sub-test, sei per la parte verbale e cinque per la scala di perform-ance. Farà seguito una breve descrizione di ognuno degli un-dici subtest con un esempio di itero simile a quelli del test veroe proprio'.

• La scala verbale– Informazioni: 29 domande di cultura generale, molto va-

rie, che un adulto ha in teoria avuto l'opportunità di acquisirenella nostra cultura; ad esempio: «Dove si trova il Messico?».

Memoria di cifre: come nel test di Binet-Simon, il sog-getto deve ripetere esattamente la serie di cifre elencata dallosperimentatore. Queste serie vanno da tre a nove cifre da ri-petere nello stesso ordine in cui sono state presentate e da trea otto cifre da ripetere nell'ordine inverso.

Vocabolario: 35 parole di difficoltà crescente sono pre-

sentate contemporaneamente a voce e per scritto, domandan-done il significato; ad esempio: «incenerire».

– Arihneika: 14 piccoli problemi sono proposti oralmentee devono essere risolti senza l'ausilio di carta e penna; ad esem-pio: «Se avete 4.800 lire e ne spendete 1.350, quante ve ne ri-mangono?».

– Comprensione: la prova propone 16 domande in cui sirichiede al soggetto di spiegare delle osservazioni della vitaquotidiana, dei proverbi; ad esempio: «Che cosa significa ilproverbio: non c'è fumo senza arrosto?».

– Somiglianze: 14 quesiti che richiedono di individuare inche cosa due elementi si assomigliano; ad esempio: «Mela-su-sina». Questa prova valuta la capacità di formare dei concettiastratti a partire dall'analisi delle somiglianze e delle differenzetra due oggetti.

• La scala di performance nuance– Completantento di figure: 20 immagini che il soggetto

deve esaminare attentamente per trovare la parte mancante.

54 55

Page 28: i Test Intll.

– Riordinamento di storie figurate: 10 iter") dí difficoltàcrescente che propongono ognuno una serie di immagini indisordine. Compito del soggetto è di ordinarli in modo taleche raccontino una storia. La figura 9 presenta un item diesempio.

– Cubi: 9 figure geometriche composte di parti rosse ebianche sono presentate una dopo l'altra. Compito del sog-getto è di ricostruire ognuna delle figure presentate con l'aiutodi 9 cubi colorati, di rosso su due facce, di bianco su due faccee di rosso/bianco sulle altre due facce.

— Ricostruzione di oggetti: pezzetti di cartone vengono pre-sentati ín disordine e il soggetto deve assemblarli in modo cheformino l'immagine di un oggetto familiare. La prova com-porta quattro item di questo tipo.

– Cifrarlo: si presenta al soggetto un foglio dove righe incui si succedono serie di cifre sono appaiate a righe in cui adogni cifra corrisponde un quadretto bianco. Al soggetto vienerichiesto dí riempire ogni quadretto bianco con il simbolo chesecondo il codice riportato in alto nella pagina corrisponde aquella cifra (il codice può ad esempio indicare sotto 1 il segno^, sotto 2 il segno +, e così via). li soggetto ha un minuto emezzo per, completare il maggior numero di casi possibili, met-tendo sotto ogni cifra il simbolo appropriato.

Nei cinque subtest della scala di performance appena de-scritti il punteggio finale tiene conto sia dei tempi di esecuzionesia dell'accuratezza della risposta.

2.3. Le qualità metriche della 1FAIS-R

L'adattamento della scala alla popolazione italiana ha ri-chiesto nón solo la traduzione del manuale, ma anche l'indi-viduazione, nei subtest più dipendenti dalla cultura, degliitem equivalenti. Alcune delle domande del subtest di infor-mazioni della versione americana, ad esempio, non sonoadatte alla cultura italiana e sono state sostituite. Inoltre, èstato necessario standardizzare la scala per la popolazioneitaliana. L'ultima standardizzazione della versione italianadella WAIS-R è stata fatta su un campione di 11.630 soggettiadulti rappresentativi della popolazione italiana, suddivisi in6 gruppi di età da 16 a 64 anni, ogni gruppo composto permetà di maschi e per metà di femmine. Questa standardíz-

o

oo

oo

.9

' e*

(.5

56

Page 29: i Test Intll.

nazione fornisce il gruppo di riferimento all'interno del qualeva situata la performance del soggetto esaminato.

• Attendibili/à. I coefficienti di attendibilità per l'adatta-mento. italiano sono stati calcolati con il metodo split-half, ot-tenuto calcolando le correlazioni tra le due metà del test com-poste dagli item pari e da quelli dispari (vedi cap. 2). Solo peri subtest Memoria di cifre e Cifrario le attendibilità sono statecalcolate con il metodo test-retest, ad una distanza di tempotra le due somministrazioni variabile da 5 a 15 giorni. I coeffi-cienti di attendibilità sono stati calcolati per ogni singolo sub-test, per ogni gruppo di età, per il QI performance, il QI ver-bale e il QI totale. Le attendibilità medie di questo campionevariarlo da 0,76 della Ricostruzione di oggetti a 0,95 del Voca-bolario. Le attendibilità medie dei subtest americani varianoda 0,68 della Ricostruzione di oggetti a 0,96 del Vocabolario.Ciò significa che, formando una metà della scala con gli itempari e un'altra metà con gli item dispari, í soggetti del campionesono classificati approssimativamente allo stesso modo con ledue metà del test così costruite e ottengono un QI abbastanzasimile (una corrispondenza perfetta corrisponderebbe ad uncoefficiente pari a 1).

• tidità . Poiché l'ultimo adattamento italiano dellaWAIS-R è molto recente [1997] non si dispone ancora di datirelativi alla sua validità. Le indicazioni sulla validità dellaWAIS-R riportate qui sono per la maggior parte ricavate dallaversione americana.

Uno dei modi per validare un nuovo test eli intelligenza èquello di verificare che le misure ottenute con il test correlinocon quelle che si ottengono proponendo agli stessi soggetti untest d'intelligenza validato. Proponendo la WAIS-R e lo Stan-ford-Binet a degli adolescenti, si è ottenuta una correlazione eli0,80 tra i QI delle due prove. Allo stesso modo è stata osservatauna correlazione di 0,70 tra il QI calcolato sulla scala di per-formance e il QI delle matrici progressive presentate nel capi-tolo 2. Si può quindi ritenere che la WAIS-R misuri approssi-mativamente la stessa cosa delle altre prove di intelligenza, ben-ché sia intuibile la circolarità di questa forma di validazione.

Un'altra forma di validazione empirica (cfr. cap. 2) consi-ste nel definire un criterio di intelligenza e verificare che esista

una correlazione tra il punteggio ottenuto al test e questo cri-terio. IL in questo modo che si sono ottenute correlazioni di

0,40 e 0,50 tra il QI della WAIS-R e il successo scolastico, instudenti di liceo, di università o di politecnici. Ma ci si può co-munque domandare se il successo scolastico sia un buon cri-terio di intelligenza. A rigore, si può soltanto concludere chela WAIS-R valuta degli aspetti di intelligenza utili per riuscirenegli studi. Nella ricerca sul ritardo mentale, il QI ottenuto allaWAIS-R si è rivelato un buon predittore della rapidità con laquale i soggetti potrebbero concludere gli studi e del loro suc-cessivo inserimento nel mondo del lavoro.

La validazione teorica consiste nel verificare se i risultatidel test corrispondano alle predizioni fatte sulla base della teo-ria che ha ispirato la sua costruzione. Abbiamo già osservatoche Wechsler non aveva una vera e propria teoria dell'intelli-genza nel momento in cui mise a punto questa scala, il che li-mita effettivamente le possibilità di validazione teorica. Egliriteneva che i differenti subtest mettessero in evidenza unastessa capacità globale. Se quest'idea è corretta, si dovrebberoottenere buone correlazioni tra le scale e l'analisi fattoriale diqueste correlazioni dovrebbe consentire di estrarre un fattoregenerale di successo. Le analisi fattoriali della WAIS-R hannochiaramente mostrato l'esistenza del fattore generale atteso,che spiega circa il 50% della varianza totale. Esse hanno an-che mostrato che una volta estratta la varianza di questo fat-tore generale, di gran lunga il più importante, si ottenevanotre fattori. Il primo raggruppa i subtest di informazioni, dicomprensione, eli vocabolario e di somiglianze; ciò significache queste quattro prove hanno più delle altre la tendenza adessere superate insieme. Questo primo fattore è generalmenteinterpretato come un fattore di comprensione verbale. Un se-condo fattore che raggruppa le prove di completamento di fi-gure, riordinamento di storie figurate, cubi e ricostruzione dioggetti, è generalmente interpretato come un fattore dí orga-nizzazione visuospaziale. Infine, un terzo fattore raggruppa laprova eli memoria di cifre, quella eli ragionamento aritmeticoe quella del cifrario e viene interpretato come un fattore di re-sistenza alla distrazione o eli attenzione. L'esistenza di questitre fattori relativizza la nozione di capacità generale e legittimain parte la distinzione che Wechsler aveva introdotto a prioritra una scala verbale e una scala di performance.

58 59

Page 30: i Test Intll.

2.4. L'inte•pretazione del risultati

Il manuale della WAIS-R fornisce indicazioni precise perattribuire un punteggio ad ogni singolo itero di ogni subtest.Sommando questi punteggi si ottiene un punteggio grezzo perogni subtest. La figura 10 rappresenta lo schema riassuntivodei punteggi di un soggetto di 60 anni ai differenti subtest della

WAIS-R.

TEST DI PERFORMANCE

Completamento .f5 9TABELLA RIASSUNTIVA

Punteggio Punteggiogrezzo standard

TEST VERBALI

di figureRiordinamento di 9 6storie figurateCubiq-1 44-Informazioni

Memoria 44' /10 Ricostruzione e q 7 7di oggettiCifrario 48di cifre

Vocabolario 3 8

-14 11Punteggio (li performance

Aritmetica

Comprensione 49 40

9.1 41 SCALA VERBALE 6'-

SCALA 1)1 PERFORMANCE 33402

97Somiglianze

996Punteggio verbale SCALA iotAil 95

lo. Tabella riassuntiva dei punteggi ottenuti alla WA1S-R.

I punteggi grezzi ai differenti subtest appaiono nella co-lonna di sinistra. Una tavola di conversione consente (li tra-sformare questi punteggi grezzi in punteggi standard, che sonoriportati nella colonna di destra. Al punteggio grezzo di 21nella prova di informazioni, ad esempio, corrisponde un pun-teggio standard di 12.1 punteggi standard vanno, per ogni sub-test, da 1 a 19. Corrispondono ad una suddivisione in 19 cate-gorie della distribuzione normalizzata dei punteggi grezzi os-servati nel campione di adulti utilizzato per la standardizza-zione del test (sulla nozione di distribuzione normalizzata, cfr.cap. 2, p. 34). Per ogni subtest la media dei punteggi standard

60

è 10 e la deviazione standard 3. Dire che un soggetto ha unpunteggio ponderato di 12 vale a dire che egli è nella dodice-sima categoria su 19, il che – tenuto conto delle proprietà delladistribuzione normale – significa che il 6.3% dei punteggigrezzi osservati nella standardizzazione erano inferiori e il 25%superiori a quelli della sua categoria.

La tappa seguente consiste nel sommare í punteggi pon-derati, considerando dapprima separatamente la parte verbalee di performance della scala. Questo produce un punteggio di62 per la parte verbale e di 33 per la performance (cfr. fig. 10).Un'altra tavola di conversione fornita dal manuale stabilisce iQI corrispondenti: un QI verbale di 102 e un QI performancedi 97.

Per lo stesso principio, si possono anche sommare i pun-teggi ponderati verbale e performance, che forniscono un to-tale di 95, di cui la tabella di conversione ci dà il QI globale,99. Sapendo che, in questo tipo di scala, il QI ha una media di100 e una deviazione standard di 15, avere un Q1 di 99 signi-fica che la prestazione del soggetto si colloca intorno alla me-dia del suo gruppo di età, e che il 50% circa dei soggetti delcampione di standardizzazione ha avuto dei punteggi più ele-vati, mentre il restante 50% ha avuto dei punteggi meno ele-vati.

Abbiamo detto che il soggetto si situava nella media delsuo gruppo di età e non nella media del gruppo degli adulti,poiché la conversione dei punteggi ponderati in QI si fa te-nendo conto del gruppo di età del soggetto. Ciò è reso neces-sario dal fatto che con l'età, l'efficienza nei differenti subtesttende a diminuire (in modo diverso a seconda dei subtest). Pos-siamo notare che un punteggio ponderato totale di 95, otte-nuto dal nostro soggetto di 60 anni, corrisponde ad un Qi di93 nel gruppo di 20-24 anni di età e ad un QI di 113 nel gruppodi 75-79 anni di età. Il QI ottenuto alla WAIS-R posiziona dun-que il soggetto all'interno del suo gruppo di età. Dire che il no-stro soggetto di 60 anni ho un QI di 99 indica che la sua effi-cienza intellettiva nella soluzione di problemi, quali appaiononella WAIS-R, lo situa nella media degli adulti di 60 anni. Laprima interpretazione dei risultati della prova consiste quindinel collocare, sulla base del Q1 ottenuto, l'efficienza intellet-tiva globale del soggetto in relazione a quella dei soggetti delsuo gruppo di età.

61

Page 31: i Test Intll.

La WAIS-R permette tuttavia di andare oltre indagando seesistono forme di eterogeneità tra le differenti parti della prova.Un'analisi classica consiste nel confrontare il QI verbale conil QI performance per vedere se l'efficienza intellettiva è equi-valente in questi due ambiti. Un altro esempio classico è il con-fronto tra subtest che resistono in maniera diversa al declinodovuto .all'età. Wechsler aveva in effetti notato che alcuni sub-test della scala «tengono bene» con l'età (informazioni e vo-cabolario per la scala verbale, ricostruzione di oggetti e com-pletamento di figure per la scala di performance), mentre al-tri «non tengono» (memoria di cifre e somiglianze per la scalaverbale, cifrario e cubi per la scala di performance).

Con questo tipo di analisi lo psicologo entra in un ap-proccio più clinico di interpretazione dei risultati. Per esserefondato, questo approccio deve poggiare su due tipi di ga-ranzia: l'eterogeneità analizzata deve essere significativa dalpunto di vista statistico e dal punto di vista teorico. Questi duepunti saranno illustrati con l'esempio della differenza tra QIverbale e QI performance.

Nel protocollo che ci è servito da esempio, il QI verbale èsuperiore di 5 punti al QI performance (vedi fig. 10). Questoscarto è statisticamente significativo? In altri termini, è suffi-cientemente rilevante da poter essere attribuito a cause diversedalle fluttuazioni dovute agli errori di misura sui due QI? Persaperlo bisogna fare riferimento alle tavole statistiche stabilitecon la standardizzazione del test e riportate dal manuale. Esseconsentono di vedere che, nel gruppo di età di questo sog-getto, una differenza tra il QI verbale e il QI performance nonè significativa, con una probabilità di rischio del .5%, se nona partire da 9 punti di differenza. Lo scarto osservato qui èquindi ordinario e sarebbe probabilmente un errore interpre-tarlo come un indice di un malfunzionamento cognitivo.

Nel caso in cui la differenza tra QI verbale e QI perform-ance si mostrasse sufficientemente importante da essere signi-ficativa, rimane da definirne il significato e la difficoltà derivadal fatto che ce ne possono essere diversi. Un QI verbale net-tamente inferiore ad un QI performance può essere, ad esem-pio, la conseguenza a lungo termine di disturbi nell'acquisi-zione del linguaggio, ma potrebbe anche essere indice di unalesione recente dell'emisfero sinistro (che è la sede deputataall'elaborazione del linguaggio). Tuttavia, si sa anche che

un'inferiorità relativa del Qi verbale rispetto al QI perform-ance è più frequente nei bambini cresciuti ín un ambiente so-cioculturale sfavorevole e anche in coloro che esercitano unaprofessione che fa poco appello alla comunicazione verbale,ecc. Il significato di tale risultato può dunque essere interpre-tato solo se messo in relazione con altri elementi informativiricavati dalla storia del soggetto o da test più specifici desti-nati a confermare o sconfermare l'una ci l'altra di queste in-terpretazioni. L'approccio diagnostico che viene qui descrittoè simile a quello del medico che cerca di interpretare un sin-tomo; la garanzia della diagnosi poggia sulla coerenza che l'in-terpretazione può dare ad un insieme di risultati: questo è ciòche noi abbiamo definito in precedenza il significato teorico.

La stessa logica può essere seguita nel confrontare i pun-teggi ponderati dei differenti subtest. Poiché tutti questi pun-teggi ponderati hanno la stessa media e la stessa deviazionestandard, essi possono essere direttamente confrontati ed èpossibile tracciarne un profilo da cui emergano i punti debolie i punti di forza dell'efficienza intellettiva del soggetto. Dinuovo, bisogna innanzitutto assicurarsi che gli scarti che sicerca di interpretare siano significativi. Nel protocollo del no-stro soggetto si nota (vedi fig. 10) un punteggio ponderato par-ticolarmente basso alla prova dei cubi. Nella relativa tavola delmanuale, si può osservare che con una soglia di rischio del15% (15% di probabilità di sbagliare), una differenza tra duepunteggi ponderati può essere considerata significativa a par-tire da 2,5 punti. C'è allora un senso nel cercare un significatoalla scarsa prestazione nella prova dei cubi, in relazione al-l'efficienza osservata nella maggior parte delle altre prove diperformance. E a questo punto che possono intervenire le os-servazioni più qualitative fatte dallo psicologo durante la som-ministrazione, relative al modo in cui il soggetto procede nellaprova, il suo metodo, il suo atteggiamento di fronte alle diffi-coltà, ecc., così come le conoscenze cliniche sul significato diun deficit specifico in tale prova o in tale gruppo di prove.

Questi aspetti dell'interpretazione dei risultati fanno am-piamente appello all'esperienza clinica e alla competenza pro-fessionale dello psicologo. Fanno chiaramente emergere cheun risultato considerato isolatamente, un QI, uno scarto tradue subtest, non ha di per sé alcun significato, ma deve essereinterpretato in funzione di un insieme di altri elementi di in-

62 63

Page 32: i Test Intll.

formazione che fanno appello alle competenze e conoscenzeacquisite nel corso della formazione al mestiere di psicologo edella sua pratica.

Il successo ottenuto dalla WAIS-R ha indotto a mettere apunto nel 1950 una versione per bambini, la Wechslerligence Scale for Children (WISC), adatta al periodo di etàdai 6 ai 16 anni, e, più recentemente, una versione adatta alperiodo tra í 4 e i 6 anni e mezzo, la Wechsler Preschool Eri-mary Scale of. Intellígence (WPPSI). La WISC e la WPPSIsono costruite esattamente sugli stessi principi della WAIS-Re hanno adattamento e standardizzazione per l'Italia.

3. I test fattoriali di intelligenza

Binet e Wechsler si rappresentavano l'intelligenza comeuna capacità globale e le loro scale avevano come obiettivoprincipale di fornire una valutazione riassuntiva di questa ca-pacità in un indice unico, età mentale o QI. Tuttavia, l'uti-lizzo di queste scale ha consentito cli notare che i successi neidiversi subtest potevano essere eterogenei e i profili così ot,tenuti potevano essere interpretati diversamente. Questa pra-tica ammette di fatto la multidimensionalità dell'intelligenza,che si manifesta anche nelle scale concepite all'origine per unasua valutazione globale.

I test detti «fattoriali», ai contrario, sono stati concepitiprincipalmente per mettere in evidenza il carattere multidi-mensionale dell'intelligenza. Essi sono detti «fattoriali», per-ché il metodo matematico sul quale sono basati è l'analisi fat-toriale, i cui principi generali sono stati presentati nel capi-tolo 1.

3.1. Un esempio di batteria di tesi fattoriali di intelligenza: ilPMA ili Thurstone

Per identificare i fattori comuni ad alcuni dei compiti co-gnitivi, fattori corrispondenti secondo lui alle abilità mentaliprimarie (Primary Mental Abilities, o PMA), Thurstone hamesso a punto una batteria di una sessantina di test differenti.Così come la costruzione delle scale eli intelligenza, la messaa punto di questa batteria di test è stata piuttosto empirica.

La varietà dei test introdotti nella batteria, e quindi il numeroe la natura dei fattori dell'intelligenza che possono essereestratti dipendono dall'idea che il ricercatore si è fatto del-l'intelligenza. In assenza di una teoria forte, non ci sono so-luzioni soddisfacenti al problema della scelta delle situazionida introdurre nella batteria. I sessanta test pensati da Thur-stone rappresentano quindi una parte dell'universo dei com-piti cognitivi, ma solo una parte.

Thurstone ha dapprima proposto questa batteria di testad un gran numero di studenti dei college americani, poi, inseguito ad alcune modifiche, l'ha successivamente proposta apiù di un migliaio di liceali. fattoriale richiede cheun certo numero di test venga proposto ad un numero abba-stanza elevato di soggetti, il che spiega la ragione per cui lamaggior parte dei test fattoriali vengono concepiti come delleprove brevi, di meno di dieci minuti, che vengono propostecarta e matita e collettivamente.

Le analisi fattoriali effettuate su questi sessanta test hannoconsentito di estrarre sette fattori primari abbastanza stabilie ben identificabili: comprensione verbale (V), fluidità ver-bale (W), abilità numerica (N), inferenza (I), abilità spaziale(S), velocità percettiva (P) e memoria (M). I test che hannomostrato le maggiori saturazioni in ognuno di questi fattorisono stati mantenuti a formare delle batterie più ridotte, CORI-prendenti un test per ogni fattore. La batteria fattoriale PMAtradotta e adattata in Italia è tratta da questo studio. Si com-pone di test carta e matita, a somministrazione collettiva, cor-rispondenti ad abilità primarie distinte da Thurstone.

3.2. Mese'? /azione dei test che compongono la batteria fattorialePAIA

Qui di seguito sono presentati i cinque test che compon-gono la batteria intermedia, il cui livello di difficoltà è adattatoad un'età compresa tra 11 e 17 anni. Ogni test è denominatosulla base del fattore di cui è rappresentativo.

• Fattore V significato verbale. Questo test valuta la com-petenza e la finezza di discriminazione dei significati verbali.Consiste di 50 item cli difficoltà crescente: si propongono unaparola bersaglio e, alla sua destra, 5 parole tra le quali è ri-

64

65

Page 33: i Test Intll.

chiesto di individuare quella con lo stesso significato della pa-rola target. Ad esempio:Rilucere a) crepitare b) cesellare e) brillare d) dipingeree) arrugginirsi.

Il tempo concesso è di 4 minuti e il punteggio è dato dalnumero di risposte corrette realizzate in questo lasso ditempo.

• Fattore S: abilità spaziale. Q uesto test valuta l'efficienzadelle operazioni spaziali. È composto da 20 itero di difficoltàcrescente composti ciascuno da un disegno target presentato asinistra. A destra vengono presentati sei disegni e tra essi biso-gna individuare quelli che non sono altro che l'itero dí sinistraruotato (gli altri sono rovesciati).

Il tempo concesso è di 5 minuti e il punteggio è dato dalnumero di risposte corrette ottenute.

e E

Qui bisogna barrare le figure A ed E

FIG. 1 1. Itero di esempio del test dell'area spaziale della batteria PNIA.

• Fattore E: ragionamento. 30 item di difficoltà crescente,in cui al soggetto viene chiesto di fornire il seguito di una se-rie di lettere. Questo test valuta l'efficienza dei processi di in-ferenza.

Ad esempio: abcdabceabcfabc?

• Fattore N: abilità numerica. L'abilità valutata è l'effi-cienza nella manipolazione dei numeri. Il test propone 70 ad-dizioni di quattro numeri di due cifre, sotto le quali è indi-cato un totale. il compito consiste nel determinare, perognuna, il più velocemente possibile se il totale è giusto o sba-gliato. Il punteggio è il numero dí risposte corrette fornito in6 minuti.

• Fattore W fluidità verbale. Questa prova valuta l'abilitàdi recuperare velocemente delle parole. Il compito consiste

nel produrre, in un tempo limitato, il maggior numero di pa-role che cominciano con una lettera data, ad esempio, nelloscrivere in 5 minuti tutte le parole che cominciano per «p»che vengono in mente. Il punteggio è dato dal numero di pa-role diverse trovate.

3.3. Le qualità metriche della batteria PMA

• Standardizzazione. manuale dell'adattamento italianodella batteria PMA IThurstone e Thurstone 1982; 1986] for-nisce una standardizzazione sulla base dei risultati ottenuti altest da un campione di 844 studenti dai 12 ai 15 anni fre-quentanti le tre classi della scuola media inferiore (prima, se-conda e terza) con al massimo un anno di ritardo . rispetto aduna scolarità normale. Circa metà del campione è compostoda maschi e l'altra metà da femmine. Vengono fornite le me-die per età e per scolarità dei cinque test. Inoltre, sulla basedella distribuzione dei punteggi in percentili, è possibile col-locare un soggetto in relazione ai soggetti della sua età delcampione di riferimento. Ad esempio, se un soggetto di 12anni ha un punteggio alla prova di significato verbale di 15risposte corrette si situa, secondo la tabella, al 40° percentile.Questo indica che circa il 35% dei soggetti ha avuto un pun-teggio inferiore e circa il 55% uno superiore.

• Validità. Poiché l'adattamento italiano della batteriaPMA riporta scarsi dati relativi alla sua validità, in questoparagrafo faremo riferimento alla validità calcolata sulla ver-sione francese della batteria.

La validità empirica della batteria PMA è stata indagataconsiderando diversi criteri. Utilizzando il punteggio totaleche integra i diversi test della batteria si è ottenuta una cor-relazione dell'ordine di 0,70 con altre misure di intelligenza.Si sono osservate anche correlazioni significative tra ogni sin-golo test della batteria, preso singolarmente, e il suo omologoin altre batterie fattoriali. Ad esempio, in uno studio in cui560 soggetti di 12 anni hanno fatto il PMA ed un'altra bat-teria fattoriale (la. GATB), le correlazioni sono state dí 0,77tra i due test verbali, di 0,51 tra i due test spaziali, 0,68 tra idue test di ragionamento e 0,65 tra i due test numerici (nellaGATB non c'è un test di fluidità verbale).

66

67

Page 34: i Test Intll.

Un altro dei criteri di validazione empirica utilizzati è statoil successo scolastico. Uno degli studi, ad esempio, ha calco-lato in un campione di 600 liceali le correlazioni tra i punteggial PMA e i punteggi ottenuti, tre anni più tardi, ad una batte-ria di test sulle conoscenze scolastiche, Iowa Tests of Educa-tional Development. Tre anni dopo, le correlazioni di ogni testcon il punteggio totale della batteria sulle conoscenze scolasti-che sono le seguenti: 0,68 con il test verbale, 0,23 con il testspaziale, 0,54 con il test di ragionamento, 0,38 con il test nu-merico e 0,33 con il test di fluidità verbale. Come si può os-servare, i test verbale e di ragionamento sono i migliori pre-díttori del successo scolastico tre anni dopo. Ciò induce ad uti-lizzare, per pronosticare il successo scolastico, un punteggiocomposto che combina questi due test attribuendo un pesodoppio ai punteggi del test verbale secondo la formula 2V -i- R.Questo punteggio correla circa 0,70 con il punteggio totale diconoscenza scolastica. Le correlazioni con le valutazioni scola-stiche date dai professori sono un po' meno forti, dell'ordinedi 0,50. Ciò si può spiegare sulla base del Fatto che i voti datidagli insegnanti sono meno fedeli (comportano maggiori fontidi variazione incontrollate) rispetto ai punteggi ai test cli co-noscenza. Benché questa batteria sia concepita per valutareabilità diverse, è frequente che si utilizzi un punteggio totalecome indice globale di intelligenza confrontabile con il Laragione è che esistono correlazioni tra questi cinque test e che– come è stato evidenziato a proposito dell'analisi fattoriale –si può anche estrarre un fattore generale di intelligenza che sa-tura queste cinque prove in misura variabile (vedi cap. i ).

Nel caso dei test fattoriali, la validità teorica si può ottenereattraverso la verifica della corrispondenza tra la struttura otte-nuta con l'analisi fattoriale di questi test e la struttura attesa. Inaltre parole, i test che si considerano come rilevanti per unostesso fattore devono essere maggiormente saturati da questofattore che dagli altri e i test che si considerano rilevanti per fat-tori differenti devono essere saturati da questi fattori differenti.Si può verificare che ciò è quanto successe per questi cinquetest nelle analisi fattoriali eseguite da Thurstone quando mise apunto tale batteria [Thurstone e Thurstone 19411. Questo pas-saggio diventa realmente ipotetico-deduttivo nel momento incui lo psicologo crea un nuovo test concepito per essere un in-dicatore di uno dei fattori. La valídazione teorica consiste allora

nel verificare che, introducendo il test insieme ad altri in un'a-nalisi fattoriale, esso è ben saturato dal fattore atteso. A titoloesemplificativo, la prova di significato verbale della batteriaPMA, che consiste nel trovare un sinonimo, è fortemente satu-rata dal fattore verbale (0,68) e per nulla dal fattore di fluiditàverbale (0,01). Thurstone ha costruito una nuova prova di flui-dirà verbale nella quale si chiede al soggetto di trovare tre si-nonimi per ogni parola data. Egli faceva l'ipotesi che nonostantela somiglianza di questa prova con quella di significato verbale(trovare un sinonimo), il test mettesse in gioco la fluidità ver-bale poiché richiede che il soggetto fornisca più parole di unacategoria data. Nell'analisi fattoriale in cui questa nuova provaè stata introdotta, essa aveva effettivamente una saturazione di0,51 con il fattore fluidità verbale e una saturazione nulla con ilfattore significato verbale', il che validava l'ipotesi di Thurstonesulla natura di questo nuovo test.

3.4. 1,Intepretazirme dei risultati

(interpretazione dei risultati si fonda sulla standardizza-zione che consente di collocare il punteggio del soggetto in cia-scuno dei test in rapporto ai punteggi osservati nella popola-

' zione di riferimento. L'interesse delle batterie fattoriali è dipermettere di stabilire un profilo dí abilità che si può espri-mere graficamente su un asse cartesiano (vedi fig. 8). Il profilopermette di osservare con un colpo d'occhio se le diverse abi-lità sono omogenee o no, dove sono i punti forti e i punti de-boli, ecc. Abbiamo visto a proposito della WAIS che l'analisidei profili di punteggio è fatta anche con le scale di intelligenza.La differenza è che le batterie fattoriali sono state costruite permettere in evidenza delle dimensioni differenti dell'intelli-genza, mentre questo non è il caso dei subtest delle scale di in-telligenza. La conseguenza è che le interpretazioni basate suiprofili dei punteggi hanno maggior fondamento con le batte-rie fattoriali.

4. I test ispirati da teorie pià recenti

Nei loro principi teorici, i test presentati nei paragrafi pre-cedenti sono stati concepiti ormai circa mezzo secolo fa. Da al-

68

69

Page 35: i Test Intll.

lora sono stati oggetto di numerose revisioni con l'obiettivo dirianalizzare il loro contenuto e ristandardizzarli, mai concettidi intelligenza che ne hanno ispirato la costruzione sono datati.Da allora le idee sull'intelligenza si sono evolute. Nuove teoriesono apparse e sí può dire che abbiano rivoluzionato la con-cezione dei test. In ogni caso, per poco che siano stati rivisti eristandardizzati (vedi quadro 1), i vecchi test hanno resistitonel tempo. Sono ancora i più utilizzati nella pratica e conti-nuano ad essere utili nella diagnosi di disfunzioni cognitive enelle previsioni di successo negli apprendimenti.

QUADRO 1.

-11, LIVELLO SALE

Alcuni item devono essere ri-visti periodicamente. Ciò succedead esempio per gli item del sub-test delle informazioni delle scaleWechsler, il cui contenuto è perdefinizione dipendente dal pe-riodo storico. Ma i test di intelli-genza devono essere anche perio-dicamente ristandardizzati, poi-ché il livello medio di perform-ance tende ad aumentare con legenerazioni. Le ragioni di questofenomeno sono complesse daanalizzare e sono oggetto di di-scussione. Possono essere dovutea degli errori (come ad esempio ilcambiamento di tendenza difronte al compromesso tra velo-cità e correttezza della risposta), a

Una delle ragioni della resistenza al tempo da parte dei vec-chi test riguarda soprattutto l'approccio molto pragmatico deiloro autori. Binet, Wechsler e Thurstone hanno utilizzato si-tuazioni di valutazione che si sono rivelate buoni indicatori del

funzionamento cognitivo a dispetto del fatto che non avevanouna conoscenza precisa dei meccanismi sottostanti. Le teorieapparse successivamente hanno poi permesso di capire meglioperché questo o quell'item fossero buoni indicatori di questoo quell'aspetto dell'intelligenza, ma solo in rari casi hanno con-sentito di costruire test radicalmente diversi da quelli appenapresentati.

C'è comunque qualche notevole eccezione a questo. Pre-

senteremo qui di seguito alcuni esempi di test di intelligenzaelaborati a partire da concezioni teoriche più recenti, i test pia-

getiani e il K-ABC.

4.1. I test «piagellani»

La teoria di Piaget è senza dubbio quella che ha rinnovatopiù profondamente le idee sullo sviluppo dell'intelligenza I.Piaget 1970, per una presentazione generale]. Questa teoriavuole rendere conto sia della genesi della conoscenza scienti-fica nella storia dell'umanità (epistemologia genetica) sia dellagenesi del pensiero logico nel bambino (psicologia genetica).La teoria di Piaget è strutturalista e costruttivista. Strutturali-sta nella misura in cui Piaget riteneva che l'uomo compren-desse il mondo assimilandolo alle proprie strutture mentali.Costruttivista nella misura in cui pensava che queste strutturecognitive, questi strumenti mentali della conoscenza, non fos-sero né innati né derivati dall'esperienza, ma si costruissero at-traverso il coordinamento delle azioni. Insomma, agendo sulmondo per trasformarlo, il soggetto costruisce, con la coordi-nazione delle sue azioni, dei sistemi di trasformazione: schemid'azione messi in pratica nel periodo sensomotorio, poi schemid'azione interiorizzati nel momento in cui il bambino diventacapace di rappresentazione. Questi schemi d'azione interioriz-zati diventano allora delle «operazioni» di pensiero. Una buonaparte dell'opera di -Piaget è consistita nell'identificare le strut-ture «operatorie» costruite successivamente dal bambino, manmano che cresce. La costruzione di ognuna di queste strutturesegna uno stadio di sviluppo e questi diversi stadi sono per-corsi con un ordine invariante. I grandi stadi di sviluppo delpensiero logico che Piaget ha identificato nel bambino sono lostadio sensomotorio (da O a 18 mesi o due anni circa), lo sta-

dio preoperatorio (da 2 -a 7-8 anni circa), lo stadio operatorio

degli effetti di familiarizzazionecon le situazioni (dovuti ad esem-pio alla diffusione di giochi ana-loghi a quelli del test), o ancora areali incrementi delle capacità in-tellettive con l'evoluzione dellasocietà (effetti dell'aumento dellascolarizzazione, della moltiplica-zione delle fonti di informazione,delle occasioni di stimolazione in-tellettuale, ecc.). Si possono tro-vare esempi di indagini che mo-strano questo aumento del livellodi performance col progrediredelle generazioni e interpreta-zioni contraddittorie del feno-meno [ad esempio, Baudelot eEstablet 1989; Midler, Jantz eKop 1989; Flynn 1987].

70 71

Page 36: i Test Intll.

concreto (da 8 a 10-11 anni circa) e lo stadio formale (a partireda 11-12 anni circa). Questi grandi stadi di sviluppo sono a lorovolta suddivisi in sottostadi e a ciascuno di essi corrisponde unastruttura cognitiva che gli è propria e caratterizza in quel deter-minato momento il ragionamento del bambino.

Piaget non si è interessato ai test e nemmeno alle differenzeindividuali. Il suo obiettivo è stato innanzitutto di descrivere lestrutture cognitive e le leggi generali della loro costruzione. Perfar ciò, egli ha immaginato una moltitudine di situazioni, spessomolto ingegnose, destinate a mettere in evidenza gli stadi di svi-luppo del pensiero logico. Altri psicologi hanno ripreso questesituazioni adattandole a situazioni test che permettessero di va-lutare lo stadio di sviluppo del pensiero logico. Un esempio clitest italiano di questa categoria è il test OLC, Operazioni Logi-che e Conservazione, messo a punto da Vianello e Marin I1997].Il test OLC fa riferimento in particolare alle operazioni logico-aritmetiche e alle nozioni di conservazione e valuta il passaggioda uno stadio preoperatorío ad uno stadio operatorio concreto.La struttura del test prevede 4 aree (seriazione, numerazione,classificazione e conservazione) per ciascuna delle quali sonopredisposti 6 item. Ogni item ha una valutazione dicotomica (su-perato o non superato, I o 0) e il punteggio totale massimo èperciò di 24. Ad esempio, un item della seriazione richiede alsoggetto, date 7 bottiglie, di far corrispondere ad ogni bottigliaun bicchiere dei 7 disponibili: verrà attribuito il punteggio di 1se il soggetto avrà correttamente svolto il compito. Gli item sonopresentati in ordine di difficoltà, dal più semplice al più difficile.Il test OLC è concepito per bambini dai 4 agli 8 anni e consentedi tradurre il punteggio del soggetto in un'età mentale ed anchein un Ql.

Un test piagetiano adatto invece a soggetti di età più elevataè la scala di sviluppo del pensiero logico (EDPL) messa a puntoda Fransois Longeot [19691. Questa scala riprende cinque dellesituazioni utilizzate da Piaget nelle sue ricerche. Queste situa-zioni hanno come obiettivo di mettere in evidenza la strutturadel ragionamento in differenti ambiti della conoscenza: logica,fisica e rappresentazione dello spazio. A titolo esemplificativo,la prova che riguarda la fisica valuta lo stadio di ragionamentodel soggetto nello sviluppo della nozione di conservazione. Se-condo Piaget, una delle manifestazioni dello strutturarsi delleoperazioni concrete è il ragionamento che permette di capire che

72

le trasformazioni degli oggetti lasciano alcune delle loro pro-prietà invariate: date due palline di pasta da modellare A e B deltutto simili, il cambiamento della pallina B (appiattimento, tra-sformazione in rotolo, trasformazione in pezzetti) modifica il suopeso in relazione a quello della pallina A? E queste trasforma-zioni modificano il suo volume in relazione a quello della pal-lina A? L'EDPL è stata concepita per il periodo di età dagli 8-9anni ai 15-16 anni, cioè per il periodo di sviluppo che va dallostadio delle operazioni concrete a quello delle operazioni for-mali.

In relazione ai test di intelligenza classici, i test piagetianihanno varie componenti di originalità:

1. il livello di sviluppo cognitivo del soggetto non è più de-finito dal suo rango nella distribuzione dei punteggi della po-polazione di riferimento, ma in riferimento ad un criterio teo-rico: lo stadio di sviluppo al quale il suo modo di ragionare cor-risponde;

2. il comportamento del soggetto nelle prove può essere in-terpretato in riferimento ad una teoria esplicita dello sviluppocognitivo;

3. il livello di sviluppo cognitivo del soggetto è valutato at-traverso una caratteristica, il suo stadio, che è transitoria. In que-sto, lo stadio è comparabile all'età mentale, ma sí distingue dalQI che caratterizza il soggetto in modo relativamente stabile;

4. l'esistenza di una sottostante teoria sufficientemente pre-cisa evita di dover definire la standardizzazione della sommi-nistrazione del test in modo rigido, come con le prove di ori.gine più empirica. È minore qui la necessità di comportarsi allostesso modo con ogni soggetto, mentre è importante dare i«suggerimenti» appropriati per vedere fin dove il soggetto puòarrivare con il suo ragionamento. Questo metodo critico di in-dagine è quello che utilizzava Piaget e il principio è stato con-servato nei test piagetiani a somministrazione individuale;

5. la validazione teorica del test si appoggia principalmentesul metodo di analisi gerarchica. Glí item corrispondenti ai dif-ferenti stadi di ragionamento devono essere superati nell'or-dine previsto dalla teoria. Questa coerenza con l'ordine teori-camente atteso può essere valutata da un indice che va da 0,quando l'ordine di successo degli item non è diverso da quelloatteso sulla base del caso, a 1 quando l'ordine osservato corri-sponde esattamente all'ordine atteso. Nell'EDPL, la scala di

73

Page 37: i Test Intll.

Longeot, gli indici gerarchici delle diverse prove sono tutti su-periori a 0,90, il che indica che gli item corrispondenti ai diffe-remi stadi si ordinano praticamente come atteso sulla base dellateoria. Nelle prove collettive, invece, questi indici sono dell'or-dine di 0,70, che è meno soddisfacente.

Tenuto conto della loro originalità, che dipende in buonaparte dal loro ancoraggio teorico, si sarebbe potuto credere chei test piagetiani avrebbero soppiantato i test di intelligenza clas-sici, di concezione più empirica. Non è stato così. Ci sono nu-merose ragioni che possono spiegare questo fatto ma noi qui nepresenteremo solo una. L'utilizzo di questo tipo di test ha fattoemergere velocemente che un soggetto poteva essere caratte-rizzato da stadi di sviluppo diversi nelle differenti prove checompongono il test [cfr. Lautrey 1980b]. Non era dunque pos-sibile caratterizzare un soggetto sulla base del suo stadio di svi-luppo cognitivo, al singolare. Si è quindi giunti a calcolare unpunteggio globale che, per convenzione, collocava il soggettoad uno stadio; lo stadio così definito non è più comunque moltodiverso da un Qi. Tanto più che la correlazione tra il punteg-gio totale dei test «piagetiani» e il QI ottenuto alle scale di in-telligenza classiche si è mostrata molto forte: varia da 0,70 a 0,80a seconda delle ricerche, il che fa pensare che l'abilità valutatada questi due test non sia poi molto diversa. Nella stessa logica,se si sottopongono gli item di test piagetiani ad un'analisi fat-toriale si trovano all'incirca gli stessi fattori che con i test fatto-riali [Lautrey, Rieben e de Ribaupierre 1986]. Di conseguenza,benché elaborati a partire da una teoria dello sviluppo cogni-tivo nuova, i test piagetiani non hanno rinnovato profonda-mente i test di intelligenza. Si sono rivelati particolarmente ap-propriati nella valutazione dello sviluppo del pensiero logico,ma non hanno detronizzato le scale di sviluppo a più largo spet-tro.

4.2. Il .K-A BC

Il K-ABC (Kaufman-Assessment Battery for Children) è unascala di valutazione dello sviluppo dell'intelligenza concepita peril periodo dai 2 anni e mezzo ai 12 anni, che è stata pubblicatanegli Stati Uniti da Alan e Nadeen Kaufman nel 1983 e adattatain Francia nel 1993 [Kaufman e Kaufman 1983], mentre in Ita-lia è stata solo proposta in via sperimentale presso alcuni centri,

ma non è mai stata standardizzata. Il quadro teorico che sottendela costruzione della scala si fonda su studi di neuropsícologia edi psicologia cognitiva che hanno evidenziato la necessità di di-stinguere tra due grandi tipi di processi mentali: i processi se-quenziali e i processi simultanei. Per sostenere questa distinzionegli autori si riferiscono aí lavori dí Lucia, che collocava la sededelle elaborazioni sequenziali dell'informazione nelle regionifronto-temporali del cervello e quello delle elaborazioni simul-tanee nelle regioni parieto-occipitali. Essi si rifanno anche ai la-vori di neuropsicologia e di psicologia cognitiva che hanno mo-strato una specializzazione dell'emisfero sinistro del cervello neltrattamento «analitico» delle informazioni e una specializza-zione dell'emisfero destro nel trattamento «globale». La varietàdelle denominazioni e delle localizzazioni cerebrali a cui ci si ri-ferisce nei diversi lavori di ricerca lascia pensare che. a questionedella localizzazione cerebrale dei vari processi è probabilmentepiù complessa di quanto non si sia creduto. Nel mettere a puntoquesta nuova batteria, l'obiettivo dei Kaufman era di rinnovarei test dí intelligenza da un doppio punto di vista: creare una scalaorientata alla caratterizzazione dei processi mentali (sequenziale,simultaneo) piuttosto che ad ambiti di contenuto (verbale, spa-ziale) e dar loro dei fondamenti teorici più solidi di quelli dellescale precedenti. A questo scopo essi hanno costruito una bat-teria composta di tre subscale ben distinte: l'una valuta l'effi-cienza dei processi sequenziali, l'altra quella dei processi simul-tanei e la terza le conoscenze. I processi sequenziali sono quellimessi in atto quando i differenti aspetti dell'informazione sonoelaborati l'uno dopo l'altro, in sequenza nel tempo. I processi si-multanei sono invece quelli messi in atto quando i differentiaspetti dell'informazione disponibile sono elaborati in parallelo,nello stesso tempo. Le prime due subscale sono esclusivamenteorientate alla valutazione dell'efficienza di queste due grandi ca-tegorie di processi mentali. La terza subscala che valuta a partele conoscenze è ben distinta da queste prime due, come non av-viene nel Binet-Simon o nella WATS, in modo tale che si possaben distinguere la quantità e la qualità delle conoscenze acqui-site, da una parte, rispetto all'efficienza dei processi grazie aiquali esse sono state acquisite, dall'altra.

Nella subscala dei processi sequenziali, si trova una provadi ripetizione dí cifre, il cui principio è lo stesso che nel Binet-Simon e nella WATS, una prova di ricordo di parole, di natura

74 75

Page 38: i Test Intll.

simile, e una prova più originale, ispirata al lavoro di Luria, checonsiste nel mostrare al soggetto una successione di movimentidella mano che egli deve riprodurre (vedi fig. 12).

I tre movimenti di base da riprodurre nelle diverse sequenze sono la Man() piatta(M), di lato (C) e il pugno (P). Il soggetto deve qui riprodurre i cinque movimenti(M, P, C, M, C). Il numero dei movimenti presentati varia da 2 a 6 a seconda dell'etàdel soggetto.

FIC..1. 12. Esempio di item analogo a quello della prova di movimento della manonel K-ABC.

La subscala dei processi simultanei comporta un numeropiù elevato di prove. Alcune sono similia subtest della scala diperformance della WAIS o della \V.lSC (ad esempio il test se-rie di fotografie che è analogo alla prova di riordinamento di sto-rie figurate della WAIS, eccetto che gli elementi in disordine apartire dai quali bisogna ricostruire la storia sono delle foto-grafie e non delle figure). Altre sono più nuove, ad esempio laprova di riconoscimento di forme, nella quale il soggetto devericonoscere l'oggetto di cui gli viene presentata un'immaginedegradata (vedi fig. 13).

La forma da riconoscere è qui quella di un uccello. Le immagini sono degradate eliminando una parte più o meno rilevante del tratto.

FIG. 13. Itero di esempio della prova cli riconoscimento di [orme del K-ABC.

Le prove della terza subscala, quella delle conoscenze, sonoconcepite sulla base dello stesso principio delle prove di in-formazioni, di vocabolario o di aritmetica della WAIS o dellaWISC e comportano anche prove di comprensione della let-tura. Esse vengono presentate ín una forma accattivante eadatta a bambini piccoli. Ad esempio, la prova di informazioninon è proposta sotto forma di domande come nella WAIS onella WISC, ma mostrando ai bambini delle fotografie dí per-sonaggi o monumenti celebri che devono riconoscere (adesempio, la foto della torre "Eiffel).

I punteggi grezzi di queste tre subscale sono trasformati inpunteggi standard e i punteggi standard in QI, secondo glistessi principi della WAIS. Si possono così confrontare i pun-teggi ottenuti ai diversi subtest e stabilire dei profili. Le qua-lità metriche di questa batteria sono del tutto confrontabili conquelle delle scale precedenti e l'analisi fattoriale dei differentisubtest che la compongono conferma che le prove sequenzialie simultanee sono saturate da fattori diversi.

Mettendo l'accento sulla valutazione dell'efficienza dei duetipi di processi, sequenziali e simultanei, questa nuova scala harealmente rinnovato la concezione dei test di intelligenza e con-sentito di valutare aspetti differenti dai test precedenti? Ab-biamo bisogno di fare un passo indietro per dirlo. Possiamonotare infatti che le tre scale del 'K-ABC valutano tre aspettidell'intelligenza che sono simili a quelli ottenuti con l'analisifattoriale della WAIS: un fattore verbale che satura subtest si-mili a quelli della scala di informazioni del K-ABC; un fattorevisuo-spaziale che satura le prove di performance simili a quelledella scala dei processi simultanei; e infine un fattore che sa-tura soprattutto la prova di ripetizione eli cifre e il cifrario, in-terpretato come un fattore dí resistenza alla distrazione o eli at-tenzione, il cui contenuto è quindi confrontabile con quello deiprocessi sequenziali del K-ABC. Inoltre, la correlazione tra il()I ottenuto al K-ABC e il QI ottenuto ad altre scale di intelli-genza è abbastanza forte (circa di 0,70), il che indica che la ca-pacità generale valutata da questa scala è abbastanza legata aquella valutata dalle scale di intelligenza già esistenti.

in sintesi, i test costruiti a partire dalle teorie dell'intelli-genza più recenti hanno cercato di analizzare il funzionamentocognitivo da un angolo diverso. I test piagetiani Sono interes-sati alle strutture attraverso le quali, secondo Piaget, si articola

76 77

Page 39: i Test Intll.

lo sviluppo del pensiero logico. il K-ABC ha come obiettivo lavalutazione dell'efficienza di due forme diverse di elaborazionedell'informazione: simultanea e sequcnziale. Ciascuno di que-sti nuovi approcci arricchisce il lavoro degli psicologi di possi-bilità di diagnosi più sensibili e articolate. Rimane il fatto che,per buona parte, questi test ispirati a teorie recenti valutano lestesse abilità dei test classici. Da un certo punto di vista, il fattoche queste prove concepite a partire da quadri teorici piutto-sto diversi valutino all'incirca la stessa cosa delle prove ante-riori contribuisce alla validazione teorica – a -posteriori – del-l'approccio empirico e pragmatico dei primi ideatori dei testd'intelligenza.

NOTE AL CAPITOLO TERZO

' La pubblicazione di item di test pone un problema particolare. Nelmomento in cui gli item di un test sono divulgati, alcuni dei soggetti chefanno il test possono averli conosciuti e non si trovano quindi più esatta-mente nelle stesse condizioni degli altri soggetti, particolare che non sod-disfa uno dei principi di costruzione dei test. Per superare questa difficoltà,utilizzeremo gli esempi che vengono dati ai soggetti a titolo dimostrativoprima del test stesso o, quando tali esempi non esistono, un item fittizio,analogo in teoria agli item del test.

Ci teniamo a precisare, per il lettore che ha qualche nozione di analisifattoriale, che si tratta di un'analisi in fattori obliqui, nella quale esistonocorrelazioni tra i fattori (questa tecnica ha l'effetto di contrastare le satura-zioni nei due fattori).

CAPITOLO QUARTO

L'UTILIZZO DEI TEST DI INTELLIGENZA

Fin dall'inizio del secolo, i test vengono utilizzati, più omeno frequentemente a seconda dei paesi e dei problemida affrontare, in diversi settori della vita sociale. Si possonodistinguere due grandi classi di utilizzo: l'aiuto diagnosticoe il contributo all'inserimento sociale. Nelle situazioni diaiuto diagnostico, lo psicologo cerca di comprendere la na-tura del problema della persona che ha di fronte e che cercadi aiutare. Possono essere seri disturbi della condotta, dif-ficoltà scolastiche, incertezze relative alle decisioni da pren-dere e alle strategie da mettere in atto nell'ambito dell'o-rientamento scolastico o professionale, o ancora di disagionelle situazioni della vita quotidiana, familiare o professio-nale. In tutti questi casi, appare utile, tra gli altri strumentidi indagine, applicare dei test e, eventualmente, dei test diintelligenza.

L'utilizzo dei test come contributo al processo di inse-rimento sociale è di natura completamente differente. Que-sta modalità di utilizzo si incontra essenzialmente nell'am-bito educativo (selezione scolastica) e del lavoro (recluta-

mento del personale). Si ritiene quindi che il test forniscadelle informazioni che, associate ad altre, permetteranno didecidere riguardo all'inserimento di individui in percorsi diformazione o in impieghi particolari. Le domande che sipossono formulare sull'uso dei test non sono naturalmentedella stessa natura né della stessa rilevanza in questi due tipidi situazioni.

Esamineremo in questo capitolo i dibattiti e le polemi-che di cui i test d'intelligenza sono stati oggetto, l'utilizzoche oggi ne viene fatto e alcune questioni di ordine etico edeontologico che nascono di conseguenza.

78

79

Page 40: i Test Intll.

1. I dibattiti e le polemiche sull'uso dei test in ambito sociale

Le domande relative ai test e le critiche che essi hanno su-scitato sono tra loro differenti; alcune risalgono all'originestessa dei test, mentre altre hanno assunto forme diverse neidifferenti contesti nazionali.

1.1. De tipologie di domande

I test d'intelligenza possono essere esaminati e anche criti-cati da un punto di vista filosofico, psicologico e sociale.

I primi test sono apparsi all'inizio del secolo, all'interno diuna psicologia nascente che, rompendo con la tradizione filo-sofica, si avvicinava alle scienze naturali e si proponeva non sol-tanto di studiare i fenomeni psicologici, analizzandoli a partiredai comportamenti osservabili, ma anche di misurarli. Oppo-nendosi così frontalmente alle posizioni idealiste dominanti,questa psicologia ha evidentemente incontrato forti resistenze.Il rifiuto dei test corrispondeva allora ad una presa di posizionefilosofica: non si pesano le anime! Questo dibattito è oggi su-perato. La psicologia oggettiva è diventata una disciplina rico-nosciuta, i cui apporti sono considerati significativi. Ma si tro-vano sempre persone, e a volte anche personalità eminenti, cheaffermano che l'intelligenza umana è così complessa che è inu-tile cercare di comprenderla obiettivamente e di misurarla.Nessuno contesta la complessità dei fenomeni che si evocanocon il termine «intelligenza»: è chiaro che la psicologia non puòche fornirne delle rappresentazioni parziali e approssimative (ècosì anche per molti aspetti del reale che non riguardano la psi-cologia).il vero problema è sapere se queste rappresentazionisiano o no suscettibili di miglioramento: le discipline empiri-che, e questo è il fondamento della loro esistenza, sono impe-gnate ad ottener misure sempre più soddisfacenti.

i test sono stati oggetto di critiche in seno alla psicologiastessa. Queste sono di due tipi: riguardano sia la portata delleosservazioni, e sono allora di ispirazione «comportamcntista»1,sia il loro significato, e sono allora di ispirazione «cognitivista»2.Se il soggetto viene caratterizzato dalla sua performance al test,ciò vale per un ampio insieme di situazioni (intendendo che iltest è collocabile su un'ampia dimensione) o per un gruppo cir-coscritto di situazioni prossime a quella del test (e allora è col-

locabile su una dimensione ristretta)? Se si considera che il com-portamento degli individui sí esprime principalmente attraversole proprietà delle situazioni in cui essi sono inseriti e per gli ap-prendimenti specifici che hanno avuto l'occasione di realizzare,li si potrà distinguere solo relativamente a queste situazioni eapprendimenti specifici. Sí potrà parlare allora di differenze diintelligenza, ma soltanto per una situazione data o un gruppodi situazioni simili. I test d'intelligenza intendono invece spessocaratterizzare i soggetti in maniera generale. Si può quindi, inquesta prospettiva, ritenerli delle generalizzazioni improprie.Nell'ambito di questa critica generale, è stato talvolta sottoli-neato il carattere scolastico delle situazioni test, particolarmenteevidente con i test carta e matita. L'intelligenza misurata dai testsarebbe allora un'intelligenza scolastica, messa in atto da indi-vidui isolati in situazioni artificiali.

La critica può anche riguardare il significato delle per-formance osservate. Questo tipo di critica sottolinea le ambi-guità delle performance individuali rilevate alla somministra-zione di un test. È vero che i test classici ci forniscono soltantoinformazioni sulla performance del soggetto (l'abbiamo vistonel cap. 2 con il test delle Matrici Progressive). Una stessa per-formance non avrà necessariamente lo stesso significato se è ot-tenuta mettendo in atto processi mentali diversi. Di conse-guenza, l'informazione fornita dai test perderà parte del suo in-teresse,

Queste critiche, diversamente da quelle filosofiche, sonointerne al campo della psicologia. L così possibile tenerneconto nella costruzione dei test. Nel capitolo precedente ab-biamo riferito di due sostanziali evoluzioni in materia dí misu-razione dell'intelligenza: il passaggio da concezioni unidimen-sionali a concezioni pluridimensionali e la considerazione dei,processi cognitivi responsabili dell'elaborazione della risposta.Quest'ultima tendenza è stata evocata a proposito della valu-tazione dei processi sequenziali e simultanei nel K-ABC. Essaè ancora più sviluppata all'interno di un filone di ricerca chetenta di costruire modelli dei processi cognitivi che il soggettomette in atto nella risoluzione degli item del test. Un esempiodi lavoro realizzato in questo ambito di ricerca è stato descrittoalla fine del capitolo 2 a proposito delle componenti del pro-cesso di soluzione degli item delle Matrici Progressive di Ra-ven.

80 81

Page 41: i Test Intll.

Il terzo tipo di problema riguarda le funzioni che i test pos-sono rivestire nella nostra società e concerne principalmente lequestioni relative all'inserimento sociale degli individui e leconclusioni sull'organizzazione della vita sociale che si possonotrarre dalle osservazioni fatte per mezzo dei test. Il problemaè stato sollevato principalmente da valutazioni che si pongononel campo delle politiche educative (come interpretare le di-seguaglianze in materia di educazione? come organizzare il si-stema di formazione?) e secondariamente da problemi di la-voro o di impiego. Queste domande conducono ad alcune os-servazioni politiche. Due temi ritornano costantemente: quellodell'equità delle differenziazioni operate dai test e quello delleorigini delle differenze individuali, tra cui la questione delruolo dell'eredità. Dopo aver richiamato qualche dato storico,esamineremo la forma assunta dal dibattito e dalle polemichesulla funzione sociopolitica dell'impiego dei test negli StatiUniti, nell'ex Unione sovietica e in Francia.

1.2. La nascita dei test e la loro diffusione

I test sono nati dall'incontro tra una domanda sociale e unanecessità della psicologia scientifica. Fin dalla loro origine ci sipuò quindi interrogare sulle loro funzioni sociali e sui loro fon-damenti scientifici. Alla fine del XIX secolo e all'inizio del XX,la necessità di disporre di procedure di valutazione dell'effi-cienza cognitiva degli individui si manifesta in numerosi settoridella vita sociale. Questa domanda è apparsa dapprima, all'i-nizio del XIX secolo, in alcuni asili che accoglievano i ritardatimentali gravi, dove si cominciava a nutrire preoccupazione ri-guardo-alla loro educazione. La richiesta diagnostica era moti-vata dal desiderio di ottenere delle stime dei livelli di deficit, alfine di affinare i metodi di riabilitazione e di costituire gruppiomogenei. Apparve più tardi anche nelle scuole con l'esten-sione dell'insegnamento primario. Un po' più tardi, l'esigenzadi misure di questo tipo si manifestò nelle fabbriche. Si trat-tava di migliorare le procedure di reclutamento degli operai,non soltanto al fine di aumentare la produzione ma anche la si-curezza (le prime indagini riguardarono í conducenti dei tram).L'orientamento professionale apparirà sulla scia dei primi ten-tativi di selezione professionale al fine di poter disporre di va-lutazioni delle abilità che consentivano un buon adattamento

alla professione. Tra queste abilità ce ne sono alcune che con-tribuiscono a determinare l'intelligenza.

Con Binet, il lavoro sui test resta circoscritto a finalità edu-cative essenzialmente legate all'educazione speciale e -all'inse-gnamento primario. La partecipazione degli psicologi alla pre-parazione dell'esercito americano, in seguito al coinvolgimentodegli Stati Uniti nella prima guerra mondiale nel 1917, avrebbestimolato una considerevole estensione del lavoro sui test. Testcollettivi furono costruiti e proposti a più di tre milioni di re-clute che furono di conseguenza, sulla base dei risultati otte-nuti ai test, destinati a funzioni diverse nell'esercito. Venneromesse a punto procedure speciali per il reclutamento di pilotie di personale necessario al buon funzionamento dell'esercito.Il fatto che gli americani si fossero trovati tra i vincitori del con-flitto fu considerato di conseguenza una sufficiente validazionedei test! All'indomani della guerra, i test cominciarono ad es-sere utilizzati in quasi tutti i settori della società: nelle scuolesecondarie e nelle università, nelle imprese e nelle amministra-zioni, nel mondo giudiziario, e naturalmente si continuò ad uti-lizzarli nell'esercito. Benché con minore ampiezza che negliStati Uniti, il lavoro e l'interesse per i test (si parla di psicotec-niche) si sviluppò anche nella maggior parte dei paesi indu-strializzati [Zurfluh 19761. In Europa, l'Inghilterra è il paeseche mostrò il maggior interesse (i test cominciarono ad essereutilizzati negli anni Venti). Ma questo sviluppo e i dibattiti chelo accompagnarono assunsero forme differenti a seconda deipaesi.

1.3. I dibattiti sui test di intelligenza negli Stati Uniti: eredità einfluenze culturali

Nel periodo tra le due guerre, i dibattiti sui test riguarda-rono le conclusioni da trarre dai risultati osservati nel gigante-sco testing del 1917 (i risultati furono pubblicati nel 1921). Ledifferenze tra gruppi, osservate come è noto tra neri e bianchi,furono sistematicamente interpretate come delle differenzeereditarie. La superiorità media ai test deí neri del nord rispettoa quelli del sud, ad esempio, non venne interpretata in rela-zione a fattori ambientali piuttosto evidenti come il tasso discolarizzazione. Si preferì inventare la tesi delle migrazioni se-lettive secondo la quale i neri più intelligenti del sud sarebbero

82 83

Page 42: i Test Intll.

emigrati al nord. L'applicazione di norme per lo meno discuti-bili conduceva a concludere che il 37% della popolazioneaveva un ritardo mentale! Queste affermazioni erano ben lon-tane dall'essere irrilevanti, ma diedero argomentazioni agli eu-genisti, che raccomandavano restrizioni della vita sessuale deiritardati mentali nonché la loro sterilizzazione, agli xenofobi,partigiani di una politica di immigrazione selettiva, e ai razzi-sti. Se il punto di vista «ereditarista» era maggioritario, nonc'era tuttavia unanimità tra gli psicologi, da cui derivarono unaserie di controversie. La più viva oppose, nel 1922-1923, Ter-

man, adattatore del test di Binet e partigiano delle tesi eredi-tari te che abbandonerà qualche anno più tardi, e Lippman.Lippman non metteva in discussione l'interesse dei test di in-telligenza, ma criticava severamente la soglia scelta per definireil ritardo mentale e, soprattutto, affermava che l'intelligenzanon poteva essere valutata indipendentemente dagli apprendi-menti e rifiutava perciò l'idea di un'intelligenza «pura», unasorta di sostanza misteriosa impermeabile alle influenze edu-cative. Molte delle polemiche e dei dibattiti successivi nonhanno fatto che riprodurre questo contrasto iniziale [Cron-

bach 1975; Gould 1983; Paicheler 19921. Si può notare chetutte queste discussioni riguardano i test di intelligenza, e piùin particolare i test collettivi, indipendentemente dalla stan-dardizzazione utilizzata che diventa del tutto secondaria. Ora,dato che i risultati aí test sono nella maggior parte dei casiespressi in quoziente intellettivo, si è arrivati a credere, so-prattutto attraverso i media, che è il QI a dover essere criticato,anche nel momento in cui i problemi sono gli stessi che si uti-lizzi o meno la nozione di QI.

Le critiche di Lippman non riguardavano í test, ma sol-tanto l'interpretazione delle osservazioni fatte per mezzo (leitest. All'indomani della seconda guerra mondiale, si sviluppa-rono invece critiche che riguardavano i test stessi. Eels e colle-

ghi [1951], sociologi di Chicago, misero in discussione l'im-parzialità apparente dei test. Essi sostenevano che i bambinidegli ambienti popolari non sono necessariamente meno intel-ligenti dei bambini delle classi agiate ed è piuttosto evidenteche i test, per il loro contenuto familiare ai bambini delle classiagiate, favoriscono questi bambini a svantaggio di quelli delleclassi popolari. Eels e colleghi, per validare la loro tesi, esami-narono i test allora in uso e tentarono di costruire un test «so-

cialmente equo», impresa che alla fine sí sarebbe rivelata quasiimpossibile. La critica di Eels e colleghi fu all'origine di un'im-portante corrente di ricerca sulle influenze culturali nei testsulla quale torneremo in seguito.

Il dibattito sul ruolo dell'ereditarietà nella spiegazionedelle differenze individuali è un dibattito permanente. L'anno1969 ne segna un momento di grande forza. Ci si interrogasull'efficacia dei grandi programmi socioeducativi promossiper la lotta contro la povertà e per l'integrazione delle mino-ranze nere e ispaniche. L allora che uno psicologo dell'Uni-versità di Berkeley, Arthur Jensen, pubblicò un lungo articoloin cui tentò di mostrare che: 1) i programmi socioeducativi nonsono efficaci; 2) l'intelligenza e il successo scolastico nella po-polazione bianca sono determinati principalmente dalla com-ponente ereditaria; e 3) anche le differenze di prestazione trabianchi e neri a scuola e nei test si spiegano attraverso la com-ponente ereditaria, Non rimane quindi, secondo Jensen, chemettere fine ai programmi socioeducativi. In altri scritti, Jen-sen sviluppò l'idea che ci siano due forme di intelligenza, l'unanobile e creativa, l'altra semplicemente associativa, che questeforme di intelligenza siano determinate dall'eredità, che laprima sia più frequente nella popolazione bianca mentre l'al-tra in quella nera, e che quindi sia opportuno prevedere duemodalità di insegnamento. :fensen ricevette qualche parere asostegno della sua ipotesi: è noto quello di Eysenck, uno psi-cologo che fu per lungo tempo la personalità più rappresenta-tiva della scuola psicometrica inglese, di tradizione galtoniana.Le sue tesi, comunque, che ancora una volta non riguardavanoi test ma la loro interpretazione, ebbero tra gli psicologi un'at-tenzione limitata (in Francia, ad esempio, nessuna personalitàconosciuta nel mondo della psicologia assunse pubblicamentela posizione eli Jensen). Un altro periodo intenso nel dibattitosul ruolo dell'ereditarietà nell'origine delle differenze indivi-duali è stato quello relativo alla pubblicazione nel 1994 di TheBell Curve con la firma di Herrnstein, uno psicologo che avevagià mostrato il suo sostegno a Jensen nel 1971, e di Murray, unesperto di scienze politiche. Questi autori hanno riattualizzatole posizioni di Jensen affermando che la differenziazione so-ciale, negli Stati Uniti operava su una base cognitiva e che ledifferenze cognitive tra individui e tra gruppi erano largamentedipendenti dal patrimonio ereditario.

84 85

Page 43: i Test Intll.

Le posizioni difese da jensen, Herrnstein e Murray sonoespressione di un certo darwinismo sociale. Esse affermano chele diseguaglianze sono naturali; non vale quindi la pena dí cer-care di riformare la società per ridurle, ma è preferibile orga-nizzarla di conseguenza. Queste posizioni poggiano su due po-stulati: il carattere unidimensionale (che con-sente di farla coincidere con la stratificazione sociale) e il ruolomassiccio delle determinanti ereditarie. Oggi è ben chiaro chel'intelligenza è pluridimensionale e che, tenuto conto dei fe-nomeni di interazione tra il patrimonio genetico e i fattori am-bientali, non ha senso cercare di quantificare il peso rispetti-vamente dell'eredità e dell'ambiente nel determinare le diffe-renze individuali. Malgrado i tentativi di un certo numero dimezzi di informazione di importare queste polemiche, esse eb-bero un'eco relativamente debole in Europa dove, in generale,per ragioni sia storiche sia sociologiche, le relazioni tra le co-munità sono viste in termini radicalmente diversi. Si può an-che notare, e ci ritorneremo, che l'uso dei test è molto più li-mitato nel sistema scolastico europeo (francese ed italiano, adesempio) e che, soprattutto, le pratiche dí selezione non sonofondate sui test di intelligenza, ma in particolare sui risultatiscolastici.

1.4. I test in Unione Sovietica: dall'entusiasmo al rifiuto

All'indomani della rivoluzione d'ottobre il governo sovie-tico incoraggiò lo sviluppo delle psicotecniche, consideratecome una disciplina scientificamente fondata e del tutto adattaa contribuire alla costruzione del socialismo. Nel 1931 si tennea Mosca il settimo congresso di psicotecnica e i congressisti oc-cidentali rimasero impressionati dagli strumenti di cui venneroa conoscenza e invidiarono i mezzi di cui disponevano i lorocolleghi sovietici che operavano in completo accordo Con il go-verno del loro paese avendo coscienza di partecipare alla co-struzione di una psicologia, marxista.

Ma questa bella armonia non sarebbe durata. Dall'iniziodegli anni Trenta cominciarono a nascere critiche contro i teste diventarono via via sempre più vive. Nel 1936 una risoluzionedel comitato centrale del partito comunista relativa ai «cam-biamenti nei commissariati dell'educazione» vietò molto sem-plicemente i test. Vennero forniti due tipi di giustificazione. Le

prime riguardavano quelli che sí potrebbero chiamare gli ef-fetti perversi dei test nel sistema educativo. Si rimproverava in-fatti agli psicologi dell'età evolutiva clic utilizzavano test di es-sere responsabili del moltiplicarsi delle classi speciali e di averpreso il potere nelle scuole a danno degli insegnanti. Le se-conde, di gran lunga le più importanti, erano esclusivamentedí ordine ideologico. Le ricerche sui test e la pratica psicotec-nica furono giudicate incompatibili con il marxismo e di con-

seguenza «borghesi» e «antiscientifiche» (come la geneticamendeliana, la fisica quantistica e la psicoanalisi). La legisla-zione che organizzava il lavoro degli psicologi venne soppressa,l'insegnamento dei test abolito e i libri sull'argomento distrutti.Gli animatori del movimento dei test scomparvero dalla scena.Interi filoni della psicologia sovietica furono infatti liquidati enon rimase che un pavlovismo ufficiale che riduceva lo studiodel comportamento alla possibilità dí evidenziarne il condizio-namento. I test riapparvero in Unione Sovietica negli anni Set-tanta. Questa critica ideologica dei test sarebbe stata ripresaanche in Francia da numerosi intellettuali, particolarmente psi-cologi appartenenti al movimento comunista.

1.5. .11 dibattito sui test in Francia: la «giusta selezione» e la le-gittimazione delle diseguaglianze.'

TI movimento dei test in Francia fu influenzato da due fortipersonalità: Alfred Binet ed Edouard Toulouse. L'influenza diBinet, scomparso prematuramente nel 1911, si è essenzial-mente esercitata attraverso il suo test. Quella di Toulouse, ben-ché egli fosse meno conosciuto, è stata ben più profonda. Tou-louse (1865-1947) era uno psichiatra che nel corso della suavita condusse ricerche fondamentali (particolarmente sul rap-porto tra il genio e la neuropatia) e creò numerosi laboratori,proponendo soluzioni ai problemi sociali (in particolare nel-l'ambito della salute mentale). Toulouse era un appassionatosostenitore dei metodi oggettivi, quindi dei test. Preoccupatodi spiegare i comportamenti a partire dai fenomeni psicologicielementari e dalla fisiologia, egli aderì alle posizioni riduzioni-ste adottate dalla maggior parte degli psicologi all'inizio del se-colo (ad eccezione di Binet). I primi test elaborati da Toulousee dai suoi collaboratori nel 1904, che assomigliavano molto allesituazioni che si incontravano nei laboratori di psicologia spe-

8687

Page 44: i Test Intll.

rimentale, riguardavano la valutazione dei processi psicologicielementari. Toulouse era anche profondamente impegnatonella sua epoca e propose delle riforme ispirate alla filosofiapositivista che riprendevano le rivendicazioni egualitarie deimovimenti sociali del momento. -Fino agli anni Quaranta e Cin-quanta, alcuni allievi di Toulouse, Henri Laugier, Jean-MauriceLahy, Henri Pieron, furono i più ardenti promotori della psi-cotecnica [Huteau 19961

Per Toulouse e i suoi allievi l'utilizzo dei test non era soloun mezzo per razionalizzare la vita sociale, ma anche per pro-muovere di più la giustizia. Essi erano convinti che gli psico-tecnici dovessero giocare un ruolo di esperti nell'ambito dellavoro, determinando per mezzo dei test le abilità necessarieall'esercizio delle professioni, orientando le politiche di for-mazione professionale, riformando le condizioni di lavoro eindagando sulle cause degli scioperi. L'obiettivo prefisso eraquello di ripartire più equamente il «compito sociale» tra glioperai e i padroni. Toulouse e i suoi allievi videro anche in unorientamento professionale fondato su misure di abilità unmezzo per correggere le diseguaglianze di accesso all'educa-zione. Più sostanzialmente, essi si proclamarono senza riserveper una scuola unica (fino alla seconda guerra mondiale ci fu-rono infatti due scuole: la scuola primaria, con un prosegui-mento alla scuola primaria superiore, frequentata da bambinidi origine popolare, e le classi primarie dei licei con il liceocome proseguimento naturale, riservate ai bambini delle classiagiate) e proposero, all'uscita da un «tronco» comune, «unagiusta selezione» fondata su misure di abilità oggettive. Neglianni Venti e Trenta vennero presentate numerose proposte dilegge per organizzare il sistema di insegnamento in questa pro-spettiva.

L'uso dei test in questo modo proposto, dall'inizio clel se-colo all'indomani della seconda guerra mondiale, s'inscrive nelquadro di una politica rivolta a riformare in senso progressistail sistema sociale. Ciò spiega il fatto che i test siano stati per-cepiti come strumenti al servizio del progresso sociale nel mo-vimento sindacale e nel movimento socialista, e come tecnichepericolose, di cui si contestava la validità, nell'ambiente bor-ghese conservatore. Questi dibattiti non avevano molto a chevedere con quelli che si stavano sviluppando pressoché nellostesso momento oltreoceano. Malgrado il loro ardore, Tou-

88

louse e i suoi allievi non riuscirono se non parzialmente ad im-porre il proprio punto di vista. Certamente i test furono sem-pre più utilizzati nella selezione e soprattutto nell'orientamentoprofessionale, ma la selezione scolastica continuò ad avvenireprecocemente e su una base sociale. Il progetto psicotecnicorimase un'utopia.

All'indomani della seconda guerra mondiale, il paesaggiocambiò radicalmente: le critiche più vive rivolte ai test non ven-nero più dai settori conservatori dell'opinione pubblica ma da-gli intellettuali e dagli psicologi membri o simpatizzanti delpartito comunista, che trovavano perfettamente giustificate lemisure prese in Unione Sovietica nel 1936 (gli echi e le in-fluenze di questo dibattito si sarebbero fatti sentire anche inItalia). I test vennero presentati come un mezzo «per confer-mare, per legittimare, e anche per far accettare le disegna-glianze dell'ordine sociale» («La Raison», 1952, n. 4). Met-tendo in primo piano la funzione ideologica attribuita ai test,non si insisteva sul fatto che lo scarto tra bambini cresciuti inambienti favorevoli o sfavorevoli fosse minore con i test checon i voti scolastici. Gli psicologi degli anni Trenta che pensa-vano di contribuire al progresso sociale promuovendo l'uso deitest vennero considerati degli idealisti ingenui. Intorno al 1.968numerose opere avrebbero ripreso queste tesi, attenuandole oradicalizzandole [Salvat 1969; 'fon 19741.

Come negli Stati Uniti, ín Gran Bretagna questi dibattiti epolemiche riguardarono soprattutto la scuola e la selezionescolastica. Ma a differenza di ciò che si è visto in questi duepaesi, in Francia e in Italia essi hanno mantenuto un carattereaccademico e astratto che deriva dall'assenza di un vero scoposociale. Si trattava cioè di mettere in gioco delle questioni ideo-logiche piuttosto che delle pratiche sociali. In effetti, in Fran-cia i test non sono mai stati utilizzati come mezzo di selezionescolastica (ad eccezione dell'insegnamento «speciale» per iportatori di handicap). I test sono stati massicciamente utiliz-zati nell'insegnamento secondario dalla fine degli anni Cin-quanta all'inizio degli anni Ottanta, ma gli orientamenti sonosempre stati basati sulla valutazione scolastica.

I dibattiti più vivaci sui test, quelli condotti da un punto divista sociopolitico, non riguardavano i test come metodi di os-servazione, bensì l'origine delle differenze individuali e l'equitàdelle procedure di inserimento sociale. Queste domande non

89

Page 45: i Test Intll.

ebbero risposte scientifiche soddisfacenti, primo perché ]e co-noscenze scientifiche non erano sufficienti, e secondo perchéla questione riguardava una scelta di valori, che ha suscitato di-battiti con una forte componente ideologica, opponendo con-cezioni globali dell'uomo e della società [Lemaine e Matalon1985]. Da allora, non è sorprendente che questi dibattiti nonsi siano conclusi e che a seconda del contesto sociostorico ab-biano preso forme diverse.

1.6. 11 dibattito sui test in Italia

La discussione sui test di intelligenza è notoriamente stataassociata a dibattiti sulle differenze in razze diverse, in uominie donne, in individui di ambienti differenti, e anche in Italia èstata condotta, sia pur in maniera meno massiva che in altripaesi, sul fondamento dell'uso dei test.

Soprattutto negli anni successivi al 1968, i test di intelli-genza venivano messi in discussione in quanto strumenti uti-lizzati dalla società «borghese», e venivano attaccati proprioper questa ragione. In quegli anni, per esempio, il sistema echi-cativo italiano si era organizzato in modo sistematico. preve-dendo classi diverse non solo per bambini con gravi difficoltà,ma anche per bambini con difficoltà più lievi che tuttavia sem-bravano abbisognare cli un percorso educativo particolare. Si,parlava nel primo caso di classi speciali e nel secondo caso diclassi differenziali.

Per le classi speciali era prevista una diagnosi basata so-stanzialmente sui test di intelligenza; per le classi differenzialiquesto uso era meno diffuso, ma poteva comunque esserepresente. E noto che le classi speciali e le classi differenzialicostituivano una modalità di isolamento e di ghettizzazionedi certi bambini. In Italia si era infatti sviluppato un movi-mento pionieristico contro questa segregazione, e quindicontro uno degli strumenti cli questa segregazione, il test diintelligenza.

Tra l'altro a quell'epoca si rilevava come esistesse unachiara relazione tra svantaggio socioculturale e basso punteg-gio ai test di intelligenza. Questo tipo di rapporto era stato tro-vato non solo in altri paesi del mondo ma anche ín eaveva appunto portato alla sottolineatura dei test «culture fair»per i quali la valenza socioculturale era meno presente. Un par-

ticolare caso, localizzato ma estremamente interessante, di que-sta attività di segregazione svolta usando il nome di prestigiodi una cosiddetta scienza, è rappresentato dalla discrimina-zione operata sulle comunità culturali.

Se questo può essere avvenuto in Italia su bambini parti-colarmente svantaggiati o su bambini di minoranze culturali elinguistiche, la discriminazione più clamorosa riguardò invecei bambini figli dí italiani che erano all'estero. Alcuni studiosiitaliani rilevavano come i figli di italiani in Germania finisseroquasi tutti in classi che avevano le caratteristiche simili alleclassi speciali o differenziali italiane proprio in base al fatto cheavevano ottenuto punteggi bassi ai test di intelligenza.

Emerse in modo evidente che i test di intelligenza eranofortemente caratterizzati dal punto di vista linguistico e i bam-bini che non conoscevano bene la lingua tedesca chiaramentefallivano. Era molto amaro constatare che uno strumento natoper fini di sviluppo di conoscenze offrisse una modalità peremarginare minoranze non gradite. In seguito a questi eventici furono molte iniziative in Italia contro i test di intelligenza,comparvero diversi lavori sia in libri sia in riviste scientifichenon solo riferite alla comunità strettamente psicologica, ma an-che a comunità píù ampie. Per esempio la rivista «Sapere» pub-blicò interventi contro questo uso dei test di intelligenza. Cadi,Padovani e Trentini riconoscono due correnti di pensiero re-lative ai test di intelligenza all'interno della psicologia sociale,l'una contraria, dei «clinici», e l'altra favorevole, degli «psico-metristi» [Cadi 1972].

La critica ai test, che partiva da fondamenti giusti ma chia-ramente faceva riferimento solo a questi cattivi usi degli stru-menti, si allargò a tal punto che in quegli anni l'uso degli stru-menti divenne sempre più raro e per parecchio tempo fu con-siderato scientificamente inappropriato e anche politicamentereazionario fare riferimento al concetto di intelligenza asso-ciato all'uso di strumenti.

Oggigiorno le posizioni non sono più così estreme e la cri-tica è molto meno aspra. Il test ha acquistato di nuovo una va-lenza priva di connotazioni ideologiche che lo definisce comestrumento di diagnosi più o meno apprezzato nel campo dellapsicologia. Il problema a cui si è più sensibili non è tanto la«bontà» o meno dell'utilizzo del test, ma l'uso corretto delleinformazioni che fornisce.

90 91

Page 46: i Test Intll.

2. Le pratiche attuali

In diversi paesi del mondo i test di intelligenza sono utiliz-zati con obiettivi abbastanza differenti nei tre grandi settori diapplicazione della psicologia: ambito educativo, sanità e lavoro.

2.1. L'utilizzo dei test di intelligenza in ambito educativo

Quando l'importanza dei problemi lo giustifica, lo psico-logo può fare un esame psicologico del bambino, chiedendonaturalmente l'autorizzazione ai genitori.

L'esame psicologico comporta in generale numerosi ele-menti, variabili secondo la natura del problema posto: collo-qui con i genitori, colloqui con il bambino, test di conoscenzascolastica, prove di personalità, ecc. Tra questi elementi, i testdi intelligenza occupano un posto preponderante, special-mente per l'uso di scale a somministrazione individuale.

In ambito scolastico in Italia i test di intelligenza veri e pro-pri non sono largamente utilizzati, soprattutto quando ven-gono presentati come tali, per la diffidenza che esiste in rela-zione alla misurazione dell'intelligenza e anche per l'indica-zione spesso presente di evitare di pervenire a misure che ri-guardano la sfera più personale dello studente.

Questa situazione però cambierà con l'introduzione dellopsicologo scolastico che potrebbe essere incaricato di mansionipiù strettamente psicologiche e anche impegnato ad esami ap-profonditi dello studente.

D'altra parte già adesso nell'ambito della scuola figurequali lo psicopedagogista o lo psicologo in convenzione pos-sono collaborare nella raccolta di informazioni relative ad abi-lità cognitive specifiche che in qualche modo costituisconocomponenti dell'intelligenza.

Per esempio in alcuni casi è stato usato il test di intelligenzaPMA che offre informazioni relative a componenti distinte, fai-torialmente isolate, dell'intelligenza quali il ragionamento, leabilità visuospaziali, le competenze semantiche, ecc.

Inoltre i Servizi che collaborano con la scuola sono spessochiamati a esami dei bambini che coinvolgono la misurazionedell'intelligenza.

Per esempio per la diagnosi cli handicap mentale si procededi routine a una valutazione dell'intelligenza per vedere se ef-

fettivamente il bambino presenta un potenziale intellettivo cheè al dí sotto del valore critico di soglia (di solito posto a 70).

Similmente, per la valutazione dei disturbi specifici dí ap-prendimento, quali per esempio la dislessia, la discalculia, í dis-turbi di attenzione, si procede di routine ad escludere la pos-sibilità che le difficoltà del bambino siano associate ad un de-ficit intellettivo vero e proprio.

Sia per la diagnosi dí ritardo mentale, sia per la diagnosi didisturbo specifico di apprendimento, si procede pertanto allavalutazione dell'intelligenza e lo strumento più utilizzato inquesto caso è costituito dalla scala WISC.

In 'Francia le più utilizzate sono le scale di Wechsler, le piùnote anche in Italia (WPPSI a livello prescolare e WISC a li-vello di scuola elementare), la nuova scala metrica dell'intelli-genza (adattamento del test Binet-Simon ad opera dí R. Zazzoe collaboratori) e, molto più raramente, scale ispirate alla teo-ria piagetiana o il K-ABC. I risultati a questi test sono inter-pretati nel quadro di una diagnosi clinica, messi in relazione al-l'insieme di informazioni raccolte nel corso dell'esame psico-logico.

Le informazioni fornite dal test di intelligenza si rivelanoparticolarmente utili nel momento in cui lo psicologo vuole sa-pere se le difficoltà incontrate dal bambino sono riferibili adun ritardo globale dello sviluppo intellettivo o a dei disturbistrumentali più specifici, ad esempio disturbi nell'apprendi-mento della lettura, della scrittura o del calcolo, o ancora a deidisturbi relazionali, con la famiglia o l'insegnante. Le indica-zioni numeriche come il QI o la posizione nel gruppo di etàdanno dei riferimenti il cui significato dipende da altri elementiraccolti nel corso dell'esame, ma anche da osservazioni fattenel corso della somministrazione del test di intelligenza: atteg-giamento di fronte alla novità, atteggiamento di fronte al falli-mento, reazioni emotive, comunicazione, ecc.

Le soluzioni proposte dallo psicologo per ridurre í pro-blemi che hanno portato alla consultazione possono esseresemplici consigli agli insegnanti o ai genitori, indicazioni di ri-educazione o sostegno appropriato ai disturbi specificamentediagnosticati (dislessia, discalculia, disturbi psicomotori, ecc.),operati da un gruppo di lavoro (comprendente lo psicologo,riabilitatori e insegnanti di sostegno che intervengono in un set-tore scolastico). In Francia, mediante i test viene valutata l'am-

92

93

Page 47: i Test Intll.

missione a classi di insegnamento speciale (mentre in Italia leclassi speciali sono state quasi completamente abolite e il pun-teggio di QI è stato invece spesso utilizzato per l'assegnazioneal bambino di un insegnante di sostegno). L'inserimento inclassi speciali è valutato in Francia da una commissione dipar-timentale per l'insegnamento speciale, o da un organo locale,che ha come interlocutori i genitori dell'allievo. I risultati ai testdi intelligenza, interpretati dagli psicologi scolastici, sono unodegli elementi determinanti su cui la commissione si basa pervalutare l'opportunità di inserimento in una classe speciale. Ladomanda sociale che aveva motivato Binet a costruire il primotest di intelligenza esiste ancora oggi e i test che discendono daquella prima scala di intelligenza rispondono tuttora a quelladomanda.

La questione dell'utilizzo dei test di intelligenza si pone inmodo del tutto diverso nell'ambito dell'orientamento scola-stico e professionale. In Francia si contano circa 4.000 espertidi orientamento-psicologi che intervengono soprattutto nel-l'insegnamento secondario. Il loro compito principale è di aiu-tare i giovani a decidere riguardo al proprio futtiro scolasticoe professionale. Questo aiuto nella formazione delle scelte enella decisione avviene, ben inteso, con l'apporto di informa-zioni sulla rete scolastica, le professioni, il mercato del lavoro,ma anche con l'apporto di informazioni utili a far prendere co-scienza al soggetto stesso delle proprie potenzialità e dei pro-pri interessi. Tra le differenti tecniche che il consiglio di orien-tamento può utilizzare per raccogliere informazioni relative aquesti ultimi aspetti (passatempi, questionari sugli interessi,scale di maturità «vocazionale», ecc.) figurano anche i test diintelligenza, il cui utilizzo in questo ambito è divenuto tuttaviapiuttosto marginale.

Non è comunque sempre stato così. I test sono stati utiliz-zati in modo piuttosto massiccio e sistematico dai «consigli sul-l'orientamento» in un periodo che va dalla metà degli anni Cin-quanta circa agli inizi degli anni Ottanta. Questo periodo è statoquello dell'estensione dell'insegnamento secondario a fascesempre più numerose di giovani. Sulla linea di idee della «giu-sta selezione» che hanno ispirato lo sviluppo della corrente psi-cometrica nella scuola francese, ci si è serviti dei test di intelli-genza per individuare tra gli studenti i cui risultati scolastici la-sciavano a desiderare quelli con scarse possibilità di successo

nella scuola secondaria. I test utilizzati erano batterie fattorialicollettive del tipo della batteria PIVI A che è stata presentata nelcapitolo precedente.

Questo impiego massiccio dei test, motivato da buone in-tenzioni, si è rapidamente trasformato in abuso, con l'appari-zione, ad esempio nella regione parigina, dei mezzi informaticidi correzione. Si è verificato che gli esperti di orientamento pas-savano da una classe all'altra con le loro valigie di test collet-tivi, inviando i protocolli al centro di calcolo del - servizio acca-demico, e ricevendo indietro delle liste che fornivano per ogniallievo un profilo di abilità. Ciò da una parte portava ad an-nientare il numero di casi esaminati, dall'altra si perdeva in ric-chezza di informazioni raccolte su ogni individuo e la discus-sione con gli insegnanti avveniva su una base Molto povera.Emerse presto che l'accordo tra esperti di orientamento e in-segnanti sull'interesse dei test, quando esisteva, poggiavaspesso su un malinteso. Mentre gli esperti di orientamento cer-cavano di rivedere í casi di disaccordo tra i risultati ai test e irisultati scolastici, gli insegnanti si soffermavano sui casi di ac-cordo – molto più numerosi – nei quali vedevano una legitti-mazione della classificazione scolastica.

Questa pratica sistematica dei test collettivi di abilità è di-minuita rapidamente a partire dalla fine degli anni Settanta perscomparire poi quasi completamente. Il movimento di conte-stazione dei test ha senza dubbio giocato un ruolo importantein questo rapido riflusso, tanto più che l'organizzazione degliesami collettivi era effettivamente suscettibile di critiche da nu-merosi punti di vista. Ma in particolare questo riflusso ha co-inciso con una profonda ristrutturazione del ruolo dell'espertodi orientamento. Da un lato, la ricerca di talenti nascosti nonaveva più interesse a partire dal momento in cui si era acqui-sita la generalizzazione dell'insegnamento secondario; dall'al-tro, gli esperti di orientamento si sono sempre più identificatiin una funzione educativa di aiuto allo sviluppo personale e allaformazione delle scelte.

2.2. L'utilizzo dei tesi di intelligenza in ambito sanitario

In ambito sanitario, in tutto il mondo, è frequente l'utiliz-zazione dei test di intelligenza, al fine di ottenere una informa-zione complessiva dell'efficienza intellettiva dell'individuo o

94 95

Page 48: i Test Intll.

per venire incontro a scopi specifici. Si,è già menzionato, in re-lazione all'ambito scolastico, come i Servizi sociosanitari pos-sano essere impegnati in una valutazione dell'intelligenza chepermetta di meglio riconoscere le caratteristiche sottostanti aduna difficoltà di apprendimento.

Per quanto concerne l'ambito dell'adulto, in tutti i casi incui il funzionamento cognitivo di un individuo pone delle pro-blematiche, può essere opportuno associare una valutazione in-tellettiva, e questo può per esempio riguardare le difficoltà chepresentano certi anziani, per meglio comprendere la natura diun eventuale deterioramento senile. In questo caso ai classicitest di intelligenza si associano test più semplici e direttamentefinalizzati all'esame dell'anziano. Per esempio, una procedurarapida che permette di riconoscere la permanenza di certe fun-zionalità cognitive, anche in presenza di un indubbio deterio-ramento, è rappresentata dal Mini-Mental State che offre unainformazione complessiva sullo stato dell'anziano e viene uti-lizzato di frequente nella realtà psichiatrica italiana, proprio perle sue caratteristiche di semplicità d'uso e rapidità. Obiettivi edesigenze analoghe possono presentarsi infatti in ambito psi-chiatrico ove spesso si è ricorso, e si ricorre tuttora, alla rac-colta di informazioni sullo stato generale del paziente, valen-dosi anche del test di intelligenza.

Anche in questo caso lo strumento conseguente alle pro-cedure ideate da Wechsler, si tratta allora del WAIS, può esseredi ampia utilizzazione.

In ambito più strettamente neo ropsicologico esiste unamarcata preferenza per una diagnosi che si riferisca alla speci-fica lacuna del soggetto, che spesso è ben localizzabile o co-munque dissociabile da altre componenti intellettive che invecehanno un buon funzionamento. Tuttavia anche in questo casoun esame di fondo può prevedere l'uso di un test di intelligenza.

In Italia e in Francia si contano diverse migliaia di psico-logi attivi in ambito sanitario. Hanno una specializzazione inpsicologia clinica e intervengono in vari quadri istituzionali:ospedali psichiatrici, ospedali generali, associazioni, collettivitàterritoriali (ad esempio, circoscrizioni sanitarie e sociali), casedi cura private, istituzioni giudiziarie, ecc.

Nel settore psichiatrico, le consulenze a livello dell'etàevolutiva hanno spesso origine da problemi di adattamentoscolastico. L'impiego di test di intelligenza nell'esame psico-

logico assume allora le stesse funzioni che per gli psicologi sco-lastici. Nelle consulenze con adulti, l'esame psicologico av-viene in ambito psichiatrico. L'inclusione di test di intelligenzanell'esame psicologico può essere motivata dal problema dia-gnostico incontrato. Si può ad esempio operare una distin-zione tra turbe psichiche e ritardo mentale generale, definireun ipotetico deterioramento mentale in una persona anziana,conoscere la misura in cui l'evoluzione di un disturbo psi-chiatrico ha colpito la funzionalità intellettiva, ecc. Lo psico-logo che compie l'esame può ricorrere a un test di intelligenzaper avere un'idea generale di come il soggetto si comporta difronte a un compito da risolvere, del modo con cui Io affronta,del suo atteggiamento di fronte alle difficoltà, delle sue rea-zioni emotive.

Nell'ambito non psichiatrico, i test di intelligenza vengonoutilizzati nelle consultazioni di neuropsicologia, tra i diversistrumenti impiegati per fare il bilancio dei danni neurologiciconseguenti a lesioni cerebrali. Nei servizi di medicina gene-rale, essi possono essere utilizzati nel caso in cui si tratti di va-lutare le eventuali ripercussioni di un disturbo somatico sullosviluppo intellettivo (se ad esempio un disturbo della crescitafisica ha o meno delle ripercussioni sullo sviluppo intellettivodel bambino). Un test di intelligenza può anche aiutare a pre-cisare la parte di realtà e la parte di sofferenza psicosomaticanel caso in cui un paziente lamenti che le sue capacità intellet-tive non sono più come prima (e la diagnosi in questi casi puòdiventare terapeutica). Nell'ambito giudiziario, un esempio diimpiego dei test di intelligenza è quello volto ad apprezzare lacredibilità di una testimonianza.

La varietà dei casi in cui i test di intelligenza possono ap-portare informazioni utili nell'esame psicologico lascia pensareche il loro impiego sia abbastanza frequente in ambito sanita-rio. Un'indagine recente condotta in Francia lo conferma [Ca-stro, Meljac e Joubert 19961. Tra gli psicologi clinici interro-gati, l'88% considera l'utilizzo dei test indissociabile dalla loropratica. Tra i dieci test più usati cinque sono test di intelligenza(la WISC, la WAIS, la WPPSI, il K-ABC e la scala di Brunet-Lézine, che è una scala di sviluppo per la prima infanzia). Que-sta situazione è del tutto simile a quella che si è potuta osser-vare su scala mondiale in una ricerca riguardante i test più uti-lizzati in 44 paesi [Oakland e Hu 1992], dove è emerso che fra

96

97

Page 49: i Test Intll.

i primi dieci test più utilizzati cinque sono di intelligenza: 1)\XTISC, 2) Matrici Progressive di Raven, 3) scala Stanford-I3i-net, 4) test di attitudini differenziali, 5) WAIS, mentre gli altricinque sono test di personalità.

Il movimento di critica dei test che ha caratterizzato glianni Settanta aveva anche provocato una riduzione nell'im-piego di prove standardizzate, tra gli psicologi clinici. In que-sto ambito è stato essenzialmente sulla base della psicoanalisi,sulla quale è principalmente fondata la psicologia clinica inFrancia, che si è sviluppato questo movimento critico. L'in-chiesta a cui si è fatto riferimento in precedenza mostra che lasituazione è decisamente cambiata: «Per lungo tempo perce-piti come gli strumenti servili della classificazione a tutti i co-sti o come degli ostacoli inutili sulla via della relazione con l'al-tro, e quindi considerati come «gli oggetti cattivi dello psico-logo», i test nella nostra indagine sembrano aver ritrovato illoro posto nell'attività valutativa quotidiana dello psicologo cli-nico» [Castro, Meljac e joubert 1996, 76].

2.3. .L'utitízzo dei test di intelligenza nel lavoro

Nell'ambiente del lavoro, i test sono talvolta utilizzati nelcorso di procedure di reclutamento o di orientamento, talora, piùraramente, anche come aiuto nella decisione sulle competenze.

L'uso dei test di intelligenza ín ambito lavorativo è ampia-mente diffuso anche in Italia. Per esempio, nella selezione delpersonale si ricorre frequentemente alla misura dell'intelli-genza generale, misura che si dimostra discretamente o alta-mente predittiva della capacità lavorativa della persona che ri-chiede di essere assunta, in base alla sottostante indicazione chepersone più intelligenti riescono comunque ad essere in gene-rale, anche se non sempre, migliori lavoratori.

Va aggiunto che in processi di selezione meglio mirati nonci si basa su un'assunzione di abilità intellettiva generale unica,ma invece sulla considerazione di abilità differenziate, nell'i-potesi che per certi compiti sia meglio che il lavoratore presentiabilità in certe componenti e per altri in altre.

Per esempio, se si deve assumere un impiegato che deveessere abile nell'esaminare carte e nel produrre documenti, leabilità linguistiche possono essere più importanti di quelle vi-suo-spaziali, cosa che al contrario può essere richiesta nella se-

lezione di operatori per mansioni come potrebbero esserequelle legate nell'orientamento nello spazio.

Due casi un po' a margine dell'ambiente di lavoro, che peròcostituiscono esempi significativi di utilizzazione dei test di in-telligenza, sono rappresentati dal mondo militare e dall'esamedi guida.

In ambito militare l'uso dei test di intelligenza è stato sem-pre amplissimo, tanto che le somministrazioni più estese e lestandardizzazioni con elevati numeri di soggetti hanno inte-ressato l'esercito.

Anche l'esame di guida può richiedere l'uso di test cogni-tivi, per valutare la capacità della persona ad affrontare situa-zioni particolari; tuttavia in questo caso generalmente si sotto-linea l'importanza di usare test più specificamente legati aicompiti della guida, come per esempio prove di attenzione.

In Francia un caso interessante che mostra l'applicazionedei test al mondo del lavoro è quello che riguarda le impresedi trasporti. In queste aziende, i test erano inizialmente utiliz-zati solo per il reclutamento degli autisti o dei macchinisti. Ne-gli anni Sessanta, in Francia, il loro utilizzo si è esteso al reclu-tamento per altre mansioni di sicurezza, poi, negli anni Set-tanta, alle funzioni commerciali e infine al reclutamento pertutte le mansioni. Questa rivoluzione della politica di recluta-mento è avvenuta in completo accordo con i sindacati.

Da allora, í candidati all'impiego nelle ferrovie francesi(SNCF), che sono diverse migliaia ogni anno, sono sottopostia una batteria composta di test di intelligenza, test psicomotorie test di personalità. Questa batteria viene proposta anche nelcorso della carriera per ragioni di riorientamento o di promo-zione. I test di intelligenza sono test fattoriali analoghi al PMApresentato nel capitolo precedente; corrispondono ai fattoriprincipali classicamente individuati nelle analisi fattoriali dicompiti intellettivi: verbale, numerico, spaziale, di ragiona-mento e percettivo. La batteria è composta anche da qualchetest più specifico che valuta l'efficienza in compiti di confronto,caratteristici di attività di ufficio, o in compiti di attenzione (ge-stione simultanea di diversi stimoli) tipici di certi impieghi nelcampo della sicurezza.

La somministrazione di queste prove è informatizzata edura circa un'ora e trenta minuti. Questo tipo di somministra-zione ha vantaggi di flessibilità e consente una correzione au-

98 99

Page 50: i Test Intll.

che colloca la prestazione delsoggetto in relazione a quelladella sua popolazione di riferi-mento. L'informatizzazione dellasomministrazione razione può infinedare informazioni sui tempi di ri-sposta ai differenti item e più ingenerale sulla gestione del temponel corso della prova.

Un secondo livello di uti-lizzo delle risorse informaticheconsiste nel rendere la sommini-strazione interattiva. In questocaso, il computer è programmatoper adattare gli item da proporrealle risposte del soggetto. Ciòconsente di determinare abba-stanza rapidamente, con do-mande critiche, il livello di diffi-coltà che un soggetto è in gradodi superare e, una volta definitoquesto limite, di determinare illivello di efficienza all'interno.Questa somministrazione perso-nalizzata, che riduce rapida-mente il campo degli item utili,consente di ridurre i tempi disomministrazione conducendoad una diagnosi più sensibile.

Il terzo livello di utilizzodelle risorse informatiche consi-ste nel formulare un modello deiprocessi cognitivi in gioco nellasoluzione del test e concepire su

questa base la situazione di test(insieme degli item concepiti perisolare i diversi processi ipotiz-zati) e gli indici comportamentali(caratteristiche dei tempi di ri-sposta e degli errori) che per-metteranno di caratterizzare al-l'interno di questo modello i pro-cessi messi in atto da ogni sog-getto. A questo livello non sitratta più soltanto di inserire itest esistenti su di un supportoinformatico per utilizzarli inmodo più efficace, ma di conce-pire nuovi test in funzione dellenuove possibilità aperte dall'in-formatica per l'analisi dei pro-cessi cognitivi. L'informatizza-zione fornisce i mezzi per analiz-zare in tempi reali una grandequantità di informazioni graziealle quali è possibile creare unmodello della dinamica del com-portamento del soggetto nelcorso della risoluzione del test. Itentativi fatti a questo livellosono ancora molto rari. Gli osta-coli sono soprattutto teorici: lenostre conoscenze sui processicognitivi umani consentono perora di creare solo modelli piut-tosto grossolani della dinamicadi soluzione di problemi di unsoggetto.

tomatica. La batteria è stata standardizzata su un campione di7.000 soggetti. La validazione non ha riguardato alcuna delleprove prese singolarmente, ma la globalità della prova, più Omeno favorevole al reclutamento in una mansione specifica,che lo psicologo fornisce a partire dall'insieme delle informa-zioni raccolte. Per quanto riguarda i test di intelligenza, lo psi-cologo si interessa solitamente dell'andamento del profilo diabilità e del suo adeguamento alla funzione postulata. A titolod'esempio, un profilo in cui dominano le abilità verbali è giu-dicato più compatibile con le funzioni commerciali che un pro-filo nel quale queste abilità costituiscono un punto debole.profilo di abilità viene valutato anche dal punto di vista dellasua coerenza – o della sua incoerenza – con la formazione delsoggetto o il suo diploma. Le questioni che nascono dalla re-lazione tra i risultati al test ed altri elementi di informazionecostituiscono gli argomenti di colloquio con il candidato. L'e-same psicologico comporta in effetti due colloqui, uno primadella somministrazione dei test, l'altro sulla base dei risultati.Nel corso del colloquio finale, lo psicologo indica al candidatoil giudizio più o meno favorevole sulla mansione richiesta, chetrasmetterà alla persona incaricata dell'assunzione del perso-nale (il parere dello psicologo non è che uno degli elementipresi ín considerazione per la decisione di assunzione). Se ilcandidato lo desidera, lo psicologo gli fornisce anche un reso-conto sui punti forti e deboli del suo profilo di risultati e, al-l'occorrenza, un consiglio per l'orientamento.

QUADRO 2.

L'INFORMATIZZAZIONE DEI "l'Est

Si possono distinguere tregrandi livelli di utilizzo dell'in-formatica nella testistica. Laprima consiste nel presentare sudi tino schermo gli item cheprima erano mostrati su carta efar scegliere la risposta correttacon la tastiera o il mouse piutto-sto che segnando con la matita.Uno dei vantaggi dell'informa-

tizzazione è quello di evitare al-cune delle costrizioni della som-ministrazione collettiva, permet-tendo ad ognuno di procederesecondo il suo ritmo sulla sua po-stazione di lavoro. Un secondovantaggio non trascurabile èquello di automatizzare la corre-zione: è possibile avere alla finedella somministrazione il listato

L'utilizzo dei test è tradizionale e sistematico anche nell'e-sercito, nelle procedure di selezione delle giovani reclute. Perselezionare e orientare le 400.000 reclute che l'esercito chiamaogni anno, in Francia è stata messa a punto una procedura incui i test di intelligenza hanno un ruolo importante. I test uti-lizzati sono dei test fattoriali di abilità del tipo eli quelli delPMA e dei test psicomotori. Come in tutti i casi in cui si debba

100

101

Page 51: i Test Intll.

esaminare un gran numero di soggetti, l'esercito si è orientatoverso l'informatizzazione della somministrazione. Nel quadro2 si possono trovare alcune precisazioni sull'evoluzione chel'informatizzazione ha provocato nel mondo dei test.

Il sistema ESPACE (impiego di un sistema di sommini-strazione automatica e di correzione degli esami) messo apunto dall'esercito si situa al secondo dei livelli di utilizzo del-l'informatica, con l'ambizione di evolvere verso il terzo di que-sti livelli, almeno sul piano della ricerca. La batteria di test in-clude i test psicomotori e i test fattoriali di intelligenza corri-spondenti alle principali abilità. Ogni soggetto svolge le provein una cabina chiusa che lo pone in condizioni d'isolamentoanaloghe a quelle che egli potrebbe sperimentare ad esempionella cabina di pilotaggio di un carro armato. Egli è di frontead una postazione di lavoro che possiede dei dispositivi per iquali può ricevere informazioni (uno schermo e degli altopar-lanti) e dei dispositivi con i quali rispondere (bottoni, manigliee pedali). La somministrazione è interattiva. Ad esempio, se leprime informazioni fornite per iscritto sono comprese male efanno sospettare un problema dí analfabetismo, le informa-zioni vengono presentate oralmente nel corso dell'esame. Se-condo la medesima logica, la somministrazione è organizzatain modo che il soggetto raggiunga in ognuna delle prove il li-mite delle sue capacità dí apprendimento e delle sue capacitàattentive (aggiungendo, una volta raggiunto il tetto di appren-dimento, un numero crescente di compiti concorrenti che de-vono essere svolti contemporaneamente).

I profili di abilità nella batteria dei test vengono utilizzatiper inserire le reclute nelle otto grandi categorie di impiego de-finite dall'esercito (ad esempio, addetto alle armi da combatti-mento, tiratore con armi di grosso calibro, ecc.). Le predizionifatte sulla base dei test sono state validate prendendo come cri-terio il successo in diversi impieghi.

La validazione dei test utilizzata in procedure di selezioneprofessionale pone spesso un problema difficile nella misura incui non può poggiare che sui risultati dei soggetti selezionati. Icoefficienti di validità tra í risultati ai test all'ingresso e l'ulte-riore successo professionale, o il successo ulteriore in una for-mazione selettiva, sono spesso deboli per la debole dispersionedelle performance al test di coloro che vengono selezionati (poi-ché la selezione ha favorito solo quelli con i punteggi più ele-

vati). L'ideale sarebbe scegliere i soggetti completamente a caso,senza tenere conto dei test, per poter validamente calcolare inseguito la correlazione tra un certo profilo ai test e il successoin diverse categorie di professioni. Questa opportunità è stataofferta ai servizi psicotecnici dell'esercito, a titolo sperimentaleín alcune unità dell'esercito, per validare la procedura dí sele-zione ESPACE (stando attenti affinché i soggetti non venganoin alcun modo danneggiati da questa procedura, e vengano ri-assegnati secondo le loro abilità dopo un periodo di prova).

Questi esempi di utilizzo sistematico dei test di intelligenzacome elementi considerati ai fini del reclutamento non devonofar pensare che questa pratica sia diffusa. In Francia le proce-dure di reclutamento nelle imprese sí basano essenzialmente sulcurriculum vitae (come in Italia), su un colloquio non struttu-rato e, spesso, sull'analisi grafologica. La grafologia è una pe-culiarità francese [Levy-Leboyer 994] tanto più sorprendentese si considera che studi metodologicamente rigorosi non hannomai mostrato una qualsiasi validità di questa forma di valuta-zione. Secondo le indagini che hanno riguardato i metodi di se-lezione utilizzati dalle imprese o dalle agenzie di reclutamento,la percentuale di selezioni in cui è utilizzata la grafologia, quasinulla negli altri paesi del mondo, in Francia va dal 93% [Bru-clion-Schweitzer e FerfiCLIX 1991] al 49% dei casi [Shackletone Newell 1991]. I test cognitivi e i questionari di personalitàsono utilizzati in modo simile, nel 30% dei casi circa.

Nel settore del lavoro, test fattoriali d'intelligenza vengonotalvolta utilizzati anche per l'orientamento ad una formazionequalificante. Questo tipo di impiego è abbastanza sistematicopresso l'Associazione per la formazione professionale degliadulti (AFPA), che propone diversi stage di formazione agliadulti con l'obiettivo di fornire una qualificazione o un reinse-rimento professionale. I profili ottenuti ad una batteria di testfattoriali di abilità è uno degli elementi che vengono presi inconsiderazione per l'orientamento dei candidati nella scelta deidiversi stage proposti dall'AIDA: stage preparatori piuttostoche direttamente una formazione qualificativa e, in questo se-condo caso, tra le diverse formazioni qualificative.

I test di intelligenza sono talvolta utilizzati anche in centri«di bilancio delle competenze». Questi centri sono stati istituitiin Francia da una legge del 1991 che ha aperto a tutti i dipen-denti delle aziende, e più in generale a tutti i volontari, il di-

102

103

Page 52: i Test Intll.

ritto di analizzare le proprie competenze professionali e per-sonali ed anche le attitudini e le motivazioni al fine di definireun progetto di formazione e/o un progetto professionale.Chiunque lo desideri può chiedere di beneficiare di un bilan-cio di competenze, il cui costo può essere addebitato alla voce«piano di formazione» sia della sua ditta, sia di un organismosimile. Non è raro che le persone che chiedono di beneficiaredi questo servizio esprimano, agli psicologi che lavorano inquesto centro e li aiutano a fare il bilancio delle loro compe-tenze, il desiderio di includere test di intelligenza tra gli ele-menti di valutazione.

Riassumendo, questa presentazione dei principali impieghidei test di intelligenza, soprattutto in Francia, mostra che, nel-l'ambito dell'educazione e della sanità, i test sono principal-mente utilizzati per l'aiuto diagnostico, mentre, nell'ambito dellavoro, essi sono impiegati soprattutto per l'inserimento so-ciale. Nel primo caso sono utilizzate soprattutto le scale di in-telligenza a somministrazione individuale, mentre nel secondocaso i test fattoriali a somministrazione collettiva, con un inte-resse marcato per l'analisi del profilo di abilità. In questo se-condo caso, l'informatizzazione dei test e la somministrazioneindividuale su di un terminale video tendono a rimpiazzare lasomministrazione in gruppo nella forma carta e matita.

3. Etica e deontologia

La preoccupazione di disporre cli test affidabili ed equi hacondotto a definire rigide norme per la loro costruzione e ap-plicazione, accordando, soprattutto negli Stati Uniti, un postoparticolare all'individuazione di eventuali errori (biases) cultu-rali. In parallelo, mentre gli psicologi elaboravano codici deon-tologici, è stata messa a punto in numerosi paesi una regola-mentazione alle pratiche di testing, al fine di fornirne un qua-dro anche giuridico.

3.1. Norme e «biases» culturali

Definite da gruppi di psicologi di riconosciuta competenza,essenzialmente tecnici e professionisti, le norme forniscono cri-teri per valutare la qualità dei test (non semplicemente i test di

intelligenza ma anche, naturalmente, i test di conoscenza scola-stica e i questionari di personalità) e le pratiche che li riguar-dano. Tutti gli studiosi e gli utilizzatori dei test sono invitati aconoscerle. Alcune di queste norme sono molto dettagliate.Quelle pubblicate negli Stati Uniti e adattate regolarmente dal19.54, gli Standards for Educational and Psycbological Testing, chgran lunga le più complete, riempiono un buon centinaio di pa-gine. Per quanto riguarda la costruzione dei test, le norme ri-chiamano le esigenze della metodologia psicometrica. Si insistenaturalmente sulla necessità di disporre di informazioni riguar-danti la validità delle prove (validità teorica e validità empiricain relazione agli obiettivi proposti) e la loro fedeltà. Si racco-manda anche di procedere a periodiche revisioni dei test. Que -

ste devono infatti poter beneficiare delle ricerche condotte sullaversione precedente ed è necessario dunque verificare periodi-camente che siano sempre adeguate agli obiettivi preposti. Sisottolinea infine che è assolutamente necessario disporre dipunteggi standardizzati il più possibile attuali e rispettare pro-cedure precise nel momento in cui si confrontano punteggi ot-tenuti con prove diverse o in condizioni diverse. Le norme ri-guardano anche le modalità di utilizzo dei test distinguendo di-versi settori di applicazione: la pratica clinica, la psicologia sco-lastica, l'orientamento, la selezione, l'utilizzo dei test per la cer-tificazione professionale (non si tratta più in questo caso di testd'intelligenza in senso stretto) e per la valutazione di programmieducativi e sociali. Si insiste sulle competenze richieste a chivuole impiegarli e sulla natura delle informazioni di cui devonodisporre (fornite dai manuali che accompagnano le prove) alfine di fare dei test il miglior uso. Infine, le norme trattano pro-blemi particolari posti dal testing delle minoranze linguistichee dei gruppi che vivono in condizioni piuttosto difficili, il checi pone la questione dei biases culturali.

Questa questione è stata sollevata, l'abbiamo visto, fin dal-l'inizio degli anni Cinquanta da Eels e collaboratori. Essa haforti implicazioni pratiche nella misura in cui i test, se distorti,sottostimano il «merito» di alcuni gruppi rispetto ad altri. Que-ste implicazioni sono forti in tutti i paesi in cui si utilizzano testa fini di selezione poiché ovunque si incontrano differenze so-ciali, di natura etnica, socioeconomica o sessuale, che possonodare origine a biases. Negli Stati Uniti, giuristi e psicologihanno dato a questa questione un'attenzione particolare, in se-

1.04

105

Page 53: i Test Intll.

guito alla legge sui diritti civili, nel 1964, il cui obiettivo era dieliminare tutte le forme di discriminazione.

Dalla fine degli anni Sessanta, i tribunali hanno avuto a chefare con numerose lamentele di persone e di gruppi che si ri-tenevano lesi dalle procedure di valutazione attraverso i test.Alcuni processi sono stati ampiamente commentati dallastampa e sono divenuti celebri. Alcuni genitori hanno conte-stato il fondamento dell'inserimento dei loro bambini in classiper ritardati, alcuni candidati all'iscrizione all'università hannoritenuto la loro non-ammissione del tutto ingiustificata, pro-fessionisti alla ricerca di un impiego hanno creduto di esserestati ingiustamente scartati. Benché le norme giuridiche nonsiano perfettamente coerenti, in numerosi casi i test sono statimessi sotto accusa e i loro autori ingiunti a produrre modalitàdi valutazione non distorte.

Si è così sviluppata una corrente di ricerche sui biases. Inmodo molto generale, si afferma che c'è un bias quando i pun-teggi ad un test non hanno lo stesso significato, la stessa validita per individui appartenenti a gruppi diversi. Nell'ambitodelle operazioni di selezione, questa differenza di significatopuò condurre a penalizzare un gruppo. Prendiamo un esem-pio fittizio. Ci sono due gruppi: un gruppo favorito F e ungruppo sfavorito D. I punteggi di F sono superiori a quelli diD in un test. Se si utilizza la correlazione positiva tra questotest e un criterio (l'efficienza professionale ad esempio) perprocedere ad una selezione, sí sceglierà per forza un maggiornumero di persone del gruppo F. Ma può anche darsi che nonesistano differenze tra il gruppo F e il gruppo D al criterio (seemerge che in media i soggetti del gruppo D hanno gli stessipunteggi di quelli del gruppo F). Il test può, in effetti, predireaccuratamente il successo al criterio all'interno di ogni gruppo,ma non le differenze di successo tra i gruppi. In questo esem-pio, una selezione fondata sui punteggi al predittore penalizzaingiustamente il gruppo D ed è in questo senso distorta a fa-vore del gruppo F.

In linea di principio, l'origine dei biases può essere diversa,la stessa caratteristica psicologica può non avere lo stesso si-gnificato nei due gruppi se interagisce con altre caratteristichedei soggetti di tali gruppi (si può pensare, ad esempio, che l'in-telligenza misurata da uno stesso test non abbia lo stesso si-gnificato a seconda che i soggetti sappiano leggere o meno). La

modalità di somministrazione e di correzione del test può avereeffetti diversi a seconda dei gruppi (se i test sono proposti dadonne, questo può influenzare diversamente ragazzi e ra-gazze?). La struttura interna delle risposte può non essere lastessa da un gruppo all'altro.

Le ricerche sull'eventuale presenza di diversi biases ha mo-strato che i test attuali non sono o sono poco distorti. Un testpuò dunque distinguere dei gruppi senza per questo essere di-storto. Questa affermazione non è tuttavia condivisa unanime-mente: per alcuni la sola differenza tra due gruppi testimoniaun bias, o, in altri termini, tutte le differenze tra gruppi sono ef-fetto di un errore di misura o di un artefatto. Tale ipotesi è dif-ficile da verificare, soprattutto quando si tratta di gruppi che,in seno ad una data cultura, non dispongono delle stesse op-portunità per sviluppare le loro capacità [Lautrey 1980a1.

Certamente, sarebbe augurabile, che gli individui di diffe-rente origine sociale fossero ugualmente rappresentati nei di-versi settori della società; che, ad esempio, all'interno dell'uni-versità ci fosse la stessa percentuale di figli di operai e di figlidi dirigenti. Per approssimarsi ad un tale obiettivo si può pra-ticare una discriminazione positiva a favore dei gruppi svan-taggiati e permettere così ad alcuni dei loro membri di supe-rare le barriere di selezione. In alcune università americane, adesempio, sono stati imposti dei livelli percentuali di rappre-sentatività per assicurare un'equa presenza di bianchi e di neri.Così facendo, in funzione dei valori, si cambiano i criteri di se-lezione. Il criterio meritocratico classico – a ciascuno secondole proprie capacità – è ponderato da un criterio più collettivo– fare in modo che la società guadagni in coesione –. I benefi-ciari della discriminazione positiva saranno senza dubbio sod-disfatti, ma gli altri si riterranno lesi e sosterranno, eventual-mente davanti a un tribunale, che non è stato equo escluderlia favore di altri, meno capaci. Questi problemi di inserimentosociale corrispondono a delle dinamiche sociopolitiche di por-tata maggiore che superano la questione posta dai test, anchese i test contribuiscono ad esplicitarle e formalizzarle.

3.2. Codice deontologico e legislazione

La riflessione sull'etica, che individua dei valori, e la deon-tologia, che concerne la morale professionale, si è sviluppata

106

107

Page 54: i Test Intll.

tra gli psicologi all'indomani della seconda guerra mondiale. Iprimi codici deontologici elaborati dalle organizzazioni pro-fessionali di psicologi si collocano intorno agli anni Cinquanta-Sessanta. In Francia, la Società francese di psicologia pubblicòil suo codice deontologico nel 1961 (un nuovo codice, stabilitoin collaborazione con altre organizzazioni di psicologi, è statoadottato nel 1996). In Italia un codice deontologico è in vigoredal 16 febbraio 1998, a seguito di un referendum condotto sututto il territorio nazionale. I codici deontologici riguardanol'insieme delle pratiche psicologiche. Possono essere generalio centrati più in specifico su di un ambito (la psicologia scola-stica, del lavoro o la ricerca). I codici non hanno valore legalema esprimono semplicemente delle regole di condotta (vediquadro 3). Le organizzazioni professionali che li hanno prepa-rati non soltanto invitano i loro membri a rispettarli, ma assi-curano loro sostegno nel caso in cui sia difficoltoso metterli inpratica nel loro ambiente di lavoro. Tutti i codici si collocanoin una prospettiva umanista: lo psicologo deve rispettare i di-ritti fondamentali delle persone, là loro libertà e la loro dignità.I codici insistono anche sulla necessità di utilizzare, in manierailluminata, delle tecniche valide Wourguign.on 1994; Dupont1994; Levy-Leboyer 1987; Schlegel 19941.

Il recente codice deontologico italiano risulta ispirato aquattro imperativi. Il primo è quello della tutela del rapportofiduciario che intercorre tra lo psicologo e chi si avvale dellesue prestazioni. Il rispetto delle persone, della loro dignità edella loro vita privata è assicurato dal segreto professionale,dalla confidenzialità con cui è trattato anche l'accesso alle in-formazioni raccolte e dalle limitazioni alle possibili indagini.Lo psicologo è in principio tenuto al segreto professionale. ilbeneficiario del servizio psicologico è il proprietario e l'unicodestinatario dei risultati dettagliati dell'indagine. Nel caso dicollaborazione con altri soggetti tenuti al segreto professionalelo psicologo può condividere solo le informazioni strettamentenecessarie al tipo di collaborazione.

Il secondo imperativo è dato dalla necessità di possedereuna competenza specifica all'abilità professionale; ciò implical'obbligo di fornirsi di questa competenza e di aggiornarla ade-guatamente. La qualità delle prestazioni offerte dagli psicologidipende a sua volta dalla loro qualifica e dai loro metodi. InItalia il titolo di psicologo viene attribuito dopo cinque anni di

formazione universitaria e deve essere seguito da un anno di ti-rocinio e da un esame di stato per l'autorizzazione ad eserci-tare la professione.

Le indicazioni fornite dal codice deontologico rimangonotuttavia spesso piuttosto vaghe e la loro applicazione è talvoltaproblematica. Cosa si intende per una tecnica scientificamentevalida se non ci si riferisce a delle norme? Qual è l'informa-zione veramente pertinente da cercare in una diagnosi o in unaprocedura di selezione? Nel contesto dell'aiuto agli altri è pro-babilmente più facile rispettare il codice deontologico, anchese le problematiche sollevate sui test e in particolare sui test diintelligenza investono questo ambito con tutta la loro forza. Inaltri ambiti comunque la situazione è anche peggiore. La pri-vacy è messa in discussione nelle procedure di selezione: lo psi-cologo è obbligato a fornire informazioni sul candidato perchéè pagato per questo!

QUADRO 3.

LA DEONTOLOGIA DELL'USO DEI TESI

Ecco alcuni articoli del co- abilità o sulla personalità degli in-

dice francese del 1996 che riguar- dividui quando appunto queste

dano le modalità tecniche dell'e- conclusioni possono avere un'in-

sercizio della professione, moda- fluenza diretta sulla loro esi-

lità che includono l'impiego dei

stenza» (articolo 19).

test. «La pratica dello psicologo

Anche il codice deontolo-

non si riduce ai metodi e alle tec- gico italiano riporta in alcuni ar-

niche che egli mette in atto. Essa ticoli indicazioni sull'uso di stru-

è indissociabile da una valuta- menti e sulla loro interpreta-

zione critica e da un'analisi teo- zione. Tali indicazioni, però, vo-

rica di queste tecniche» (articolo

lendo essere generali e applicatili

17). «Le tecniche utilizzate dallo ad ambiti diagnostici e di ricerca,

psicologo per la valutazione, a fini

perdono parte della potenziale

diretti di diagnosi, di orienta- incisività presente invece negli

mento o di selezione, devono es- articoli francesi. In particolare

sere state scientificamente vali- nell'articolo 5 troviamo che «Lo

date» (articolo 18). «Lo psico- psicologo usa strumenti teo-

logo è consapevole del carattere rico-pratici per i quali ha acqui-

relativo delle sue valutazioni e in- sito adeguata competenza .

terpretazioni. Non trae conclu- Lo psicologo impiega meiodolo-

sioni riduttive o definitive sulle gie delle quali è in grado di indi-

108

109

Page 55: i Test Intll.

care le fonti e i riferimenti scien-tifici, e non suscita, nelle attesedel cliente e/o utente, aspettativeinfondate». Mentre nell'articolo7 viene sottolineata l'importanzadell'attendibilità e validità dei

dati: «lo psicologo valuta atten-tamente, anche in relazione alcontesto, il grado di validità e diattendibilità di informazioni,dati e fonti su cui basa le con-clusioni raggiunte».

CONCLUSIONI

NOTE AL CAPITOLO QUARTO

' Tl comportamentismo è una corrente teorica che, nelle sue forme piùradicali, limita la psicologia alla ricerca di leggi che legano ad un compor-tamento un determinato stimolo, rifiutando il ricorso a variabili secondarieche intervengono tra l'entrata (stimolo) e l'uscita (la risposta).

= Il cognitivismo si oppone al comportamentismo per il fatto che con-sidera l'esistenza di attività interne, quelle che si articolano tra lo stimolo eil comportamento, come parte integrante della psicologia scientifica.

Un test è un dispositivo d'osservazione concepito per va-lutare certe caratteristiche psicologiche degli individui, collo-cando le loro condotte in relazione a quelle che sono state os-servate in seno alla popolazione alla quale gli individui appar-tengono. Per compiere questa funzione un test deve esserestato standardizzato, e le misure che il test consente di racco-gliere devono essersi mostrate valide ed affidabili. L'intelli-genza non è l'unica caratteristica psicologica che possa esserevalutata dai test: esistono infatti test di conoscenza di vari do-mini, test psicomotori, test dí personalità, ecc. La particolaritàdei test di intelligenza è di valutare un'abilità piuttosto gene-rale di adattamento cognitivo a situazioni nuove. Questo me-todo di valutazione dell'intelligenza ha mostrato il suo inte-resse, ma anche i suoi limiti.

Due tipi di limitazione dei test d'intelligenza devono esseretenuti in considerazione nel loro utilizzo. Uno riguarda il livellodi generalità effettivo della capacità di adattamento cognitivovalutata, l'altro riguarda la molteplicità dei determinanti dellaperformance osservata.

Sul primo punto, bisogna innanzi tutto osservare che la va-lidità di un test d'intelligenza è limitata alla cultura in seno allaquale il test è stato concepito. L'intelligenza umana si sviluppaattraverso l'uso di linguaggi, di simboli, di rappresentazioni chesono gli strumenti del pensiero e danno significato alle situazioni.il funzionamento dell'intelligenza umana è inscindibile daglistrumenti simbolici e concettuali sui quali si basa. La situazionetest nel suo insieme (la relazione individuale con l'esaminatore,il materiale utilizzato, il tipo di problema posto, ecc.) non con-sente di valutare le capacità di adattamento del soggetto testatoa meno che tale situazione non abbia per lui un senso.

Immaginiamo per un istante che il problema della diagnosidel ritardo mentale si sia posta nella società pigmea. Gli item

110

111

Page 56: i Test Intll.

che un collega di Binet avrebbe scelto come «marcatori» delledifferenti tappe dello sviluppo cognitivo dei bambini pigmeisarebbero stati ben diversi da quelli di Binet e Simon. Avreb-bero riguardato problemi significativi nella società pigmea e re-lativi ad ambiti importanti per l'adattamento in questa società.La scala di Binet-pigmeo avrebbe potuto articolarsi in item ri-guardanti la costruzione o l'utilizzo efficiente cli un arco, diorientamento in uno spazio su grande scala, ecc. E verosimileche le performance di piccoli occidentali in una scala di que-sto tipo non sarebbero altrettanto predittive del loro successoscolastico del Binet-Simon, non più di quanto la performanceal Binet-Simon dei bambini pigmei sarebbe un buon predittoredella capacità di adattamento cognitivo alla società pigmea. Itentativi di costruzione di test di intelligenza indipendenti dallacultura non hanno avuto successo. Anche quando ci si sforzadí ridurre il ruolo delle conoscenze, del linguaggio, risulta chela condotta del soggetto dipende dalla rappresentazione cheegli si è fatto di ciò che ci si aspetta da lui in questa situazione,e tale rappresentazione dipende dal contesto culturale in cuil'individuo è stato educato. La contestualizzazione dell'intelli-genza limita necessariamente la «generalità» della capacità diadattamento cognitivo valutata e rende priva cli senso l'ideastessa di intelligenza indipendente dalla cultura. I test descrittiin quest'opera non hanno dunque validità che con gli indivi-dui cresciuti in società i cui modi di pensare sono sufficiente-mente prossimi a quelli dove í test sono stati concepiti.

Un secondo limite di carattere generale della capacità diadattamento cognitivo valutata da questi test riguarda ciò che,anche in una cultura come la nostra, essi non valutano, in altreparole tutte le categorie di situazioni che richiedono una dif-ferente forma di intelligenza. Ad esempio, la capacità di inter-pretare le disposizioni d'animo e i sentimenti degli altri versose stessi da indici comportamentali non verbali (espressioni delviso, gesti, posture, ecc.), la capacità di controllare l'espres-sione delle proprie emozioni, la capacità di influenzare gli al-tri sono delle componenti cli ciò che è stato definito intelligenzasociale o intelligenza emozionale. Questa intelligenza gioca unruolo importante nell'adattamento alla vita in società. La ca-pacità di influenzare gli altri, ad esempio. è probabilmente digrande importanza nell'ambito commerciale o in quello poli-tico. Nei test classici non vi è valutazione di questa forma di in-

telligenza, bensì il test è essenzialmente verbo-concettuale. Di-versi tentativi di costruzione di test di intelligenza socialehanno dato risultati ancora incerti: la validità e la fedeltà di que-sti test si sono dimostrate inferiori a quelle dei test di intelli-genza verbo-concettuale. Certe componenti dell'intelligenzasociale sono in correlazione con l'intelligenza verbo-concet-tuale, mentre altre no, il che limita, ancora una volta, la gene-ralità dell'intelligenza misurata dai test descritti in quest'opera.Questi test valutano soprattutto la forma d'intelligenza neces-saria per andare bene a scuola, e, più generalmente, per ap-prendere nel contesto di un insegnamento esplicito. Si trattadell'intelligenza che si chiama talvolta «accademica» o «geo-metrica». Non bisogna sottostimare l'importanza di questaforma di intelligenza, né la relativa generalità del suo utilizzonella nostra società. Essa gioca in effetti un ruolo primordialenelle società complesse in cui l'acculturazione passa in buonaparte attraverso una trasmissione scolastica dei saperi. Ma, aldi là di questo, essa non esaurisce la diversità delle risorse co-gnitive umane.

In seno all'intelligenza stessa che noi abbiamo chiamatoverbo-concettuale, le analisi fattoriali dei test hanno permessodi distinguere diverse dimensioni corrispondenti ad abilità re-lativamente differenziate (verbale, numerica e spaziale). Il fattoche esistano delle correlazioni positive tra tutti questi test lascia tuttavia spazio ad un fattore generale di successo nell'in-sieme dei test. C'è un consenso abbastanza ampio, in epoca re-cente, su di un modello gerarchico della struttura fattoriale del-l'intelligenza costruito a sua volta da un fattore generale di in-telligenza e da fattori di gruppo corrispondenti ad abilità di-stinte. Si può dunque effettivamente parlare di un fattore di in-telligenza generale, ma soltanto se si tratta di un fattore dí in-telligenza verbo-concettuale.

Un secondo tipo di limite dei test di intelligenza riguardala molteplicità delle determinanti della performance osservata.Una stessa performance in un test può essere ottenuta con mec-canismi diversi, strategie diverse; il soggetto può essere più omeno familiare con il contenuto del test; uno stesso punteggio,uno stesso QI, uno stesso scarto tra OI verbale e Qi perform-ance possono avere significati diversi. Il risultato ad un test diintelligenza deve essere messo in relazione con l'insieme delleinformazioni raccolte nel corso dell'esame psicologico per po-

112

113

Page 57: i Test Intll.

ter essere interpretato. Questa ambiguità' della performancerende alquanto discutibili le pratiche in cui, alla semplice vistadel risultato al test, sí danno consigli o si prendono decisionirelative all'inserimento sociale degli individui.

La standardizzazione dei test fa in modo che, con un ap-prendimento ridotto, quasi chiunque possa somministrare untest di intelligenza. Da qui a ritenere che non abbia importanzachi interpreta il risultato del test il passo è breve e, ahimè, tal-volta lo si fa. Si manifestano periodicamente pressioni affinchél'utilizzo dei test non sia solo riservato ai detentori del titolo dipsicologo. Nello stesso ordine di idee, ora si propone su In-ternet di testare da sé la propria intelligenza, o più grave an-cora, di testare da sé l'intelligenza del proprio bambino. Que-sta tendenza ci sembra pericolosa in quanto solo la formazionepsicologica consente di conoscere i diversi limiti dei test di in-telligenza e i problemi deontologici posti dal loro utilizzo.

L'interesse della corrente di ricerca sui test è di mirare astabilire dei fatti che siano ripetibili per chiunque si ponga nellestesse condizioni. Questo obiettivo è centrale di ogni tentativodi misurazione e deve quindi essere anche al centro di ogni ten-tativo di valutazione oggettiva dell'intelligenza. La standardiz-zazione mira a rendere la valutazione il meno dipendente pos-sibile dalla persona che la effettua e dunque a renderla ripeti-bile, pubblica e trasparente. Il coefficiente di stabilità indicainoltre in che misura questa valutazione è ripetibile nel tempo.I dispositivi che assicurano la ripetibilità della valutazione sonolontani dall'essere perfetti e sono essi stessi suscettibili di evo-luzione. Ci si può ad esempio immaginare modalità più soddi-sfacenti di standardizzare la somministrazione di un test chenon mettere tutti i soggetti strettamente nella stessa situazione.Ma l'esigenza sottostante deve essere mantenuta. Essa ha comeobiettivo quello di rendere la valutazione accessibile ad una ve-rifica e all'analisi critica di ognuno.

Il metodo dei test permette anche di inscrivere la proce-dura di valutazione nella direzione di una verifica vera e pro-pria dell'approccio scientifico. Stabilire la validità teorica di untest di intelligenza non è diverso dal sottoporre a verifica le con-cezioni che hanno ispirato la sua costruzione. Le concezionidell'intelligenza che hanno guidato la costruzione dei primi testnon erano certamente delle teorie molto elaborate, ma i suc-cessivi sviluppi teorici hanno consentito di comprendere me-

glio perché certi item, che erano stati scelti in partenza in unaprospettiva pratica, erano buoni indicatori dell'efficienza co-gnitiva. Alcuni esempi di questi ritorni della teoria sui test sonostati forniti in quest'opera, proprio a proposito della reinter-pretazione degli item delle matrici progressive nel contesto dimodelli di elaborazione dell'informazione. All'inverso, la co-struzione di test che operazionalizzano una teoria dell'intelli-genza ha talvolta contribuito a metterla in questione. È così chel'elaborazione di test ispirati alla teoria di Piaget ha contribuitoa scuotere la concezione degli stadi di sviluppo cognitivo chesi fondavano su questa teoria.

- Se la costruzione dei test di intelligenza si è inscritta fin dal-l'inizio in questo percorso di mutuo scambio tra elaborazioneteorica e verifica empirica, ci si può tuttavia rammaricare delfatto che la relazione tra ricerca di base e la sua applicazione èstata a lungo molto limitata. Ci sono per questo delle ragionistoriche. Per Binet, la riflessione teorica sull'intelligenza e lamessa a punto di una scala destinata a misurarla erano due mo-menti strettamente articolati di uno stesso percorso. Il successodei test è stato tale per il fatto che la risposta ad una domandasociale ha richiamato i ricercatori dalle loro questioni teoriche.Bisogna aggiungere a questo che, anche se l'avessero voluto,difficilmente gli psicologi che utilizzavano i test di intelligenzaavrebbero avuto modo di rinnovarli teoricamente nella fase diricerca in psicologia in cui ha dominato il comportamentismo.Lo sviluppo del cognitivismo, che ha preso slancio a partire da-gli anni Settanta, offre un quadro più favorevole al rinnova-mento delle idee sul funzionamento dell'intelligenza. Le ricer-che hanno per ora rivolto il loro interesse alla rappresentazionedei processi di elaborazione dell'informazione in gioco nellasoluzione degli item dei test esistenti piuttosto che all'elabora-zione di nuovi test [Huteau 1995; Huteau e Lantrey 1978; Lau-trey 1995; Lautrey e Huteau 1990]. La situazione attuale sem-bra tuttavia più favorevole di quella passata ín quanto la ricercadi base suí differenti aspetti del funzionamento intellettivo e lacostruzione di strumenti che consentano di valutarli pratica-mente camminano parallelamente e con uno stesso passo.

114 115

Page 58: i Test Intll.

LETTURE CONSIGLIATE

Il lettore che intenda approfondire i temi affrontati nel volumequi di seguito troverà segnalati alcuni titoli in edizione italiana.

Per quanto riguarda la definizione del concetto di intelli genza ele teorie ad esso collegate utili approfondimenti si trovano nelle operedi Stenberg: R.J. Stenberg, Teorie dell'intelligenza, Milano, Bompiani,1987; R.J. Stenberg e L. Spear-Sweding, Le tre intelligenze. Come po-tenziare le capacità analitiche, creative e pratiche, Trento, Erickson,1997 e in II. Gardner, Formae mentir. Saggio sulla pluralità della in-telligenza, Milano, Feltrinelli, 1991.

In ambito della teoria dei test il volume di L. Boncori, Teoria etecniche dei test, Torino, Bollati Boringhieri, 1993 offre assieme aquello di A. Anastasi, I test psicologici, Milano, Angeli, 1995" un'am-pia rassegna dei test disponibili sul mercato con una descrizione delleloro qualità metriche e di contenuto. Il volume della Boncori privile-gia la letteratura europea e i test prodotti da autori italiani, mentrequello della Anastasi si concentra principalmente sulla realtà anglo-sassone e americana in particolare.

Sulle caratteristiche metriche dei test di utile consultazione sonoV. Rubini, Test e misurazioni psicologiche, Bologna, H Mulino, 1984 eil più recente L. Pedrabissi e M. Santinello, I test psicologici, Bologna,Il Mulino, 1997. Entrambi i volumi forniscono le basi per valutare laqualità di un test e le indicazioni indispensabili per comprendere imanuali che accompagnano ciascun reattivo psicologico.

Infine, sui test di intelligenza WAIS-R e WISC e sull'interpreta-zione dei risultati da essi ottenuti: M. Lang, C. Nosengo e C.M. Xella,La scala WATS Uso clinico e valutazione qualitativa, Milano, Cortina,1996; A. Orsini, WTSC-R. Contributo alla taratura italiana, Firenze,Organizzazioni Speciali, 1993; A. Orsini, WAIS-R. Contributo alla ta-ratura italiana, Firenze, Organizzazioni Speciali, 1997 e F. Padovani,L'interpretazione psicologica della WAIS-R, Firenze, OrganizzazioniSpeciali, 1999.

119