Acquiescence och Social Desirability: Psychometric Bogeymen
En annan (och mindre välkänd) hobgoblin som påstås förstöra personlighetstestens giltighet är förmåga att svara på svar (ibland kallat ja-säger). Acquiescence avser tendensen att komma överens med alla personlighetsartiklar, oavsett innehållet i objektet. Om förmåga att försvara svar fungerar är det lätt att se hur detta skulle ogiltiga resultatet av ett test. Istället för att selektivt stödja uttalanden som faktiskt gäller dem, accepterande svarande instämmer på ett kritiskt sätt med alla uttalanden, och därför misslyckas det med att beskriva deras distinkta personlighet egenskaper.
Efter mer än 30 år i personlighetsbranschen tänker jag normalt inte så mycket på psykometriska bogeymen, till exempel social önskvärdhet och förmåga att ha svar. När allt kommer omkring fick jag lära mig på forskarskolan att forskare som Jack Block (Utmaningen med responsuppsättningar, 1965) och Leonard Rorer "Myten om den stora responsstilen" Psykologisk Bulletin(1965) för länge sedan lade ryktet om svar förspänning bogeymen. De som fortsätter att tro på svarfördomar idag är som barn som håller fast vid irrationell rädsla för monster.
Det enda problemet med den ursprungliga IPIP-NEO är att den är lång. Väldigt länge. Vid 300 artiklar är det ännu längre än den 240-artiklar NEO PI-R som den baserades på. Det är därför jag konstruerade en kortare version genom att identifiera 120 av de ursprungliga 300 artiklarna som tycktes kunna representera de fem breda domänerna och 30 fasetter utan mycket drop-off i tillförlitlighet. Granskarna och redaktören för mitt manuskript tyckte att denna kortare inventering, som jag kallar IPIP-NEO-120, hade god potential, men de hade en allvarlig reservation: Jag hade inte gjort ett försök att identifiera lika många positivt formulerade och negativt formulerade artiklar för alla 30 fasetter. Till exempel hade fasensskalan Ångest alla positivt formulerade artiklar, där överenskommelse representerar närvaron av ångest: "Oroa dig för saker." "Rädsla för det värsta. "" Jag är rädd för många saker. "Och" Få betonade lätt ut. "Jag kunde ha inkluderat negativt formulerade artiklar från den ursprungliga IPIP-NEO som" Är inte lätt besväras av saker. "Och" Är avslappnad för det mesta. "Men det gjorde jag inte. (Anledningen till att jag inte gjorde det var för att jag var mer bekymrad över att skapa skalor med högsta grad av intern-konsistenssäkerhet.)
Lyckligtvis gav redaktören och granskarna mig ut. De föreslog ett förfarande för att undersöka huruvida förmåga att försvinna svar eller obalans mellan positivt och negativt formulerade artiklar påverkade IPIP-NEO-120 negativt. Om du är intresserad av de tekniska detaljerna i förfarandet kan du hitta en beskrivning i bilagan till en artikel av Soto, John, Gosling och Potter, publicerad 2008 i Journal of Personality and Social Psychology (Vol. 94, pp. 718-737). Men i princip innebär proceduren att skapa ett Acquiescence Index (AI), ett mått på individernas tendenser till förmåga att få svar, och sedan se om korrigering för AI ger högre giltighetskoefficienter och en tydligare faktorstruktur.
Så jag följde proceduren och gissa vad? IPIP-NEO-120 skalor som, när de fick ett normalt resultat, hade korrelerat signifikant med relevant kännedom betyg kunde nu inte korrelera med betyg när poäng justerades för att få svar partiskhet. Och den genomsnittliga faktorkongruensen mellan IPIP-NEO-120 och föräldrarnas NEO PI-R var 0,93 när skalorna fick ett normalt resultat; efter korrigering för friskhet minskade den genomsnittliga kongruensen till 0,70. Kort sagt, korrigering för förmån för svarande minskade giltigheten för IPIP-NEO-120-poängen. Min slutsats? Förvärv av förvärvssvar är en psykometrisk bogeyman. Liksom alla imaginära monster ignoreras det bäst.
Principen oroar sig från dem som tar sociala önskvärda fördomar på allvar är att vissa människor bryr sig mer om att göra ett bra intryck på ett personlighetstest än att objektivt beskriva sina faktiska tankar, känslor och beteenden. Olika forskare har olika åsikter om hur många människor som drabbas av denna förspänning. En av de ursprungliga sociala önskvärtsteoretikerna, Allen Edwards, var förtjust i att påpeka frekvensen av överenskommelse med personlighetsföremål som korrelerade 0,80 eller mer med de oberoende betygsatta sociala önskemålen för artiklarna, vilket kan innebära att för alla sannolikheten för att komma överens med ett föremål bestämdes nästan fullständigt av den sociala önskvärdheten för föremålet.
Ändå erkänner de flesta forskare sociala önskvärdsförskjutningar som en individuell skillnadsvariabel, med vissa påverkas starkt av den och andra, mindre. Edwards själv skapade en social önskvärd skala från MMPI-artiklar för att mäta skillnader i partiskhet. Ett annat allmänt använt mått på social önskvärdhet är Marlowe-Crowne Social Desirability Scale. Medan Edwards-skalan är mycket belastad med psykopatologi, hänvisar Marlowe-Crowne-artiklar till ovanliga men socialt önskvärda beteenden. Ytterligare en välkänd åtgärd är skalan Good Impression från Kaliforniens psykologiska inventering. Denna skala skapades genom att en grupp ämnen svarade på en uppsättning objekt två gånger - först när de vanligtvis skulle, och sedan med instruktioner att svara som om de försökte skapa ett så gynnsamt intryck som möjlig. Objekt som svarade annorlunda mellan de två tillfällena blev skalan Good Impression. Slutligen, förmodligen den mest sofistikerade ansträngningen att mäta social önskvärdhet i dag är en uppsättning skalor författad av Del Paulhus, kallad Balanced Inventory of Deseful Responding (BIDR). BIDR innehåller två skalor, en för att bedöma oavsiktliga tendenser att presentera en överdriven positiv bild av sig själv och en sekund för att bedöma avsiktliga, medvetna tendenser för att skapa en positiv intryck. Paulhus beskriver sitt mått liksom Edwards Social Desirability Scale, Marlowe-Crowne och Good Impression i en 1991 bok kapitel.
Som ni ser har det gjorts en avsevärd mängd forskning under de senaste 50 åren om sociala önskvärden. Många forskare tar fortfarande social önskvärdhet som ett allvarligt hot mot personlighetsskalans giltighet. Ofta när en ny personlighetsåtgärd införs, kommer människor att vilja veta hur starkt skalan korrelerar med ett av de ovannämnda måtten på social önskvärdhet. Om sambandet är för högt kommer forskare att säga att skalan är "förorenad" av social önskvärdhet, vilket innebär att respondenterna kan svara i termer av önskvärt snarare än innehållet i poster.
Nu har du hört oro från forskare och utövare om social fördröjning. Om du inte hade tänkt på det här problemet tidigare, kan du komma att hålla med om att denna partiskhet utgör ett allvarligt hot mot personlighetsresultatens giltighet. Och du bör åtminstone överväga möjlighet att ett sådant hot existerar eftersom det är rimligt att tänka på social önskvärdhet som en potential hot. Det är lätt att föreställa sig arbetssökande som besvarar frågor på sätt som de tror kommer att få dem att se ut som den typ av person som skulle bli anställd, snarare än den typ av person de är. Och vad skulle hindra dem från att göra detta?
Låt mig nu ta upp några punkter som kan få dig att tänka två gånger på om potentialen för partisk reaktion faktiskt uppstår i verkliga testsituationer. (Jag kommer inte att diskutera konstgjorda laboratorieinställningar, där det är lätt att få konstgjorda resultat.) Låt oss börja med den situationen där många psykologer tror att folk mest troligt kommer att försvara sina svar på ett socialt önskvärt sätt: personal urval. Här är frågan jag skulle vilja ställa: när arbetssökande deltar i en ansikte-till-ansikte-intervju, svarar de på intervjuaren frågor med trubbig, ointresserad, objektiv ärlighet, eller försöker de skräddarsy sina svar på sätt som de tror kommer att få dem att se ut Bra? Uppenbarligen alla intervjuade med åtminstone ett socialt modik intelligens kommer att försöka se bra ut. Så den verkliga frågan är inte om jobbsökande försöker skapa ett gott intryck på personlighetstest (naturligtvis de är), men huruvida deras svar är mer eller mindre giltiga än svar från en arbetssökande i en ansikte-till-ansikte-intervju.
De som oroar sig för social önskvärdhet i testet kan spekulera i att det är lättare att säga osanna saker på ett personlighetstest eftersom i en liveintervju kan intervjuaren jämföra sökandens verbala och icke verbala beteende för att avgöra hur sanningsenlig den sökande är varelse. Men det är bara spekulation. Man kan lika lätt antaga att det kan vara fokus för intervjuernas några spetsiga frågor få en sökande att vara ännu mer bekymrad över att säga vad han eller hon tror att intervjuaren vill höra. Å andra sidan, när man tar en personlighetsinventering (särskilt en lång) finns det så många frågor att svara på att det blir betungande att försöka räkna ut det ”önskvärda” svaret. Det är mycket lättare att gå med dina automatiska reaktioner, som återspeglar dina vanliga (dvs typiska, giltiga) personlighetstendenser.
Du kanske vill överväga möjligheten att svara på artiklar i en personlighetsinventar inte är så annorlunda än att prata med människor i vardagen. När vi interagerar med människor i vardagen är vårt huvudmål vanligtvis att inte kommunicera listor med objektiva, vetenskapliga fakta om oss själva. Istället försöker vi uppnå en mångfald av interpersonella mål som att underhålla andra så att de kommer att gilla oss, imponera på potentiella romantiska partners, få fram hjälp när vi känner oss svaga eller ohälsosamma, övertygande rivaler att vi är smartare eller tuffare än de är, och så vidare. En persons "personlighet" representerar hans eller hennes vanliga, typiska strategier - både verbala och icke verbala - för att sträva efter mål som är viktiga för personen. I flera decennier har jag föreslagit att personlighetsobjektens svar är en förlängning av en persons vanliga interpersonliga stil, inte en fristående, ointresserad, objektiv rapportering av beteende. Här är en tidig artikel om ämnet; här är en nyare.
Slutsatsen som jag har dragit om social önskvärdhet är att människor varierar mycket i den sociala önskvärdheten i sin vardag beteende, och dessa skillnader tenderar att återspeglas på motsvarande sätt i den sociala önskan av deras svar på personlighet poster. (Det kan finnas undantag från detta, diskuterat intelligent av Del Paulhus i avsnittet Framtida forskningsinstruktioner i hans bokkapitel.) Detta betyder att om vi försöker ta bort sociala önskvärden statistiskt, kommer vi att minska giltigheten för personlighetsresultat, och det är exakt vad McCrae och Costa (1983) hittades. Precis som när jag tog bort förmån för svar från IPIP-NEO-120. Kunskap och socialt önskvärt? Bogeymen.