Skolan och dess bortglömda genetiska komponent (Del 1)
Hur pass mycket förklarar det genetiska arvet individuella skillnader i utbildningsnivå och kan social rörlighet förklara skillnader i ärftligheten mellan länder?
Välkommen till en ny serie där vi gör en djupdykning i den senaste beteendegenetiska utbildningsforskningen. Under våren kommer vi att utforska hur våra gener, miljöfaktorer och slumpen förklarar varför vi presterar olika i skolan, väljer olika typer av utbildningar och uppnår olika nivåer av socioekonomisk status i vuxen ålder.
I detta inledande brev riktas strålkastaren mot ett specifikt utfall, nämligen individers högsta uppnådda utbildningsnivå. Under seriens gång kommer vi att gräva djupare och belysa faktorer som förklarar individuella skillnader i tidigare skolprestationer, specifika ämnesbetyg och val av studieinriktning.
Varför skulle gener påverka utbildningsutfall?
Även om vi i senare delar av den här serien kommer att göra en djupdykning i frågan, är det redan nu värt att understryka att våra gener inte påverkar våra utbildningsutfall på ett direkt sätt. Det är inte som så att nyfödda barn har sina framtida skolresultat inprogrammerade i sin arvsmassa. Det finns på så vis ingen koppling mellan barnens arvsmassa och Skolverkets betygskriterier.
Genetisk variation förklarar emellertid en betydande andel av våra individuella skillnader i kognitiva förmågor (intelligens), koncentrationssvårigheter, impulsivitet, aggression, olika typer av personlighetsdrag, samt förmågor att etablera och upprätthålla sociala relationer. När vi konstaterar att utbildningsprestationer delvis är ärftliga menar vi att ärftligheten fångar upp dessa typer av individegenskaper, som i sin tur förklarar prestationsskillnaderna.
Den första tvillingstudien
Den amerikanske ekonomen Paul Taubman (1939–1995) blev under 1970-talet något av en pionjär inom beteendegenetik då han med ett stort tvillingmaterial började att studera hur deltagarnas genetiska arv och miljöinfluenser förklarade deras variation i utbildningsnivå och inkomster i vuxen ålder. Resultaten av analyserna presenterades i artikeln “The Determinants of Earnings: Genetics, Family, and Other Environments: A Study of White Male Twins” som publicerades i American Economic Review (1976).
Den klassiska tvillingmodellen bygger på två centrala antaganden:
Enäggstvillingar delar samtliga sina genetiska skillnader, medan tvåäggstvillingar i genomsnitt delar hälften av sina genetiska skillnader.
Samtliga tvillingpar delar sina tidiga uppväxtmiljöer; givet att de inte blev separerade vid födseln.
Om vi samlar in data från ett större antal tvillingar kan vi med hjälp av den klassiska tvillingmodellen dela upp variationen, eller de individuella skillnaderna, i ett givet utfall såsom utbildningsnivå i följande tre kategorier av influenser:
Ärftliga faktorer: Genetiska faktorer som gör tvillingar inom samma familjer mer lika varandra med avseende på det studerade utfallet.
Delade miljöfaktorer: Samtliga icke-genetiska faktorer som gör tvillingar inom samma familjer mer lika varandra med avseende på det studerade utfallet. Dessa kan, men behöver inte nödvändigtvis, inkludera barnuppfostran, låg socioekonomisk status under uppväxten, föräldrar med substansbruksyndrom, och dysfunktionell grundskola (i den mån tvillingarna gick i samma grundskola.)
Unika miljöinfluenser: Samtliga icke-genetiska faktorer som är unika, eller individ-specifika, och som bidrar till att deltagarnas utfall skiljer sig ifrån deras tvillingsyskon. Dessa kan men behöver inte nödvändigtvis inkludera specifika traumatiska upplevelser (exempelvis utsatthet för våld, hjärnskador och trafikolyckor), olika kamratnätverk, eller aktiviteter som inte delas mellan tvillingsyskonen.
De unika miljöfaktorerna inkluderar även mätfel. Enkätundersökningar kan ge upphov till felaktiga resultat om respondenter svarar på ett socialt önskvärt sätt, exempelvis genom att överdriva sin utbildningsnivå. Missförstånd eller inneboende syftningsfel av enkätfrågor kan leda till att respondenter undervärderar sin utbildningsnivå, exempelvis kan somliga med universitetsexamen uppge att de enbart har gymnasial kompetens för att de arbetar inom yrken som inte kräver universitetsexamen. I registerbaserade studier kan mätfel uppstå på grund av ofullständiga data. Ett exempel på detta är om en individ har slutfört högre studier utomlands utan att det har rapporterats till svenska myndigheter. Utöver mätfel kan slumpfaktorer också bidra till tvillingars olikheter. Tillsammans kan mätfel och slumpfaktorer artificiellt förstärka olikheter mellan tvillingar, utan att miljöfaktorer nödvändigtvis är involverade. Det är av dessa skäl viktigt att inte övertolka de unika miljöinfluenserna.
Datamaterialet som Taubman använde sig av hade samlats in inom ramen för ett större tvärvetenskapligt forskningsprojekt vars syfte var att samla in data från ett slumpmässigt urval av manliga tvillingar. För att ingå i studien skulle deltagarna vara födda mellan 1917 och 1927, ha en “vit” etnisk bakgrund, samt ha tjänstgjort under andra världskriget. Deltagarna skulle därtill ha en tvillingbroder med samma tjänstgöringserfarenhet. Efter att målgruppen hade identifierats skickade forskarna ut enkäter med relativt omfattande innehåll till de tilltänkta deltagarna per post. Långt ifrån alla mottagare var intresserade av att delta i studien, vilket ledde till ett relativt stort bortfall.
Taubman insåg att urvalet även av andra skäl inte var särskilt slumpmässigt. Kriterierna som användes för att bestämma vilka som skulle få ingå i studien innebar exempelvis att deltagarna som hade förlorat sin tvillingbror under tjänstgöringen inte kunde delta i studien. Detsamma gjorde sig gällande för deltagarna vars tvillingbröder inte bedömdes ha en tillräcklig funktionsförmåga för att alls få tjänstgöra.
Studiens urval bestod i slutändan av 1019 enäggstvillingspar och 907 tvåäggstvillingpar. Utfallet av intresse, antal utbildningsår (eng. years of schooling), var i genomsnitt tämligen likvärdig mellan tvillinggrupperna (varierade mellan 13,3 och 13,5 år).
Taubman valde inledningsvis att undersöka graden av likhet, eller korrelationen, i utbildningsnivå hos de ingående enäggstvillingarna i materialet. Om samtliga enäggstvillingar hade samma utbildningsnivå som sina tvillingbröder hade korrelationen varit perfekt (r=1,0). Om det inte alls fanns någon likhet mellan tvillingbrödernas utbildningsnivåer hade korrelationen istället varit noll (r=0,0). Resultatet visade att korrelationen var tämligen stark (r=0,76).
Är det bara genetiken som gör att enäggstvillingarna är så pass lika varandra med avseende på deras utbildningsnivå? Den slutsatsen kan man inte dra enbart på basis av dessa resultat. Anledningen är att enäggstvillingar delar såväl genetik som sina tidiga miljöinfluenser med varandra. För att ta reda på hur pass mycket arvet och de delade miljöinfluenserna förklarar behöver vi således en kontrollgrupp. Det är här tvåäggstvillingar kommer in i bilden.
Tvåäggstvillingar delar i likhet med enäggstvillingarna sina tidiga miljöinfluenser men i genomsnitt delar de enbart hälften av sina genvarianter. När Taubman undersökte samma korrelation som ovan mellan tvåäggstvillingar noterade han att deras korrelation var betydligt lägre, nämligen 0,54.
Det är nu det börjar att bli lite spännande. Korrelationerna ger oss tillräcklig information för att vi med Falconers formler1 ska kunna göra en grov uppskattning av ärftligheten för utbildningsnivå i Taubmans material. Ärftligheten kan på så vis definieras som skillnaden i korrelationerna för utbildningsnivå mellan enäggs- (r=0,76) och tvåäggstvillingar (r=0,54) multiplicerat med två. I Taubmans material var ärftligheten för utbildningsnivå således 44 procent (2*[0,76-0,54]=0,44.) Av de individuella skillnaderna i utbildningsnivå kunde således 44 procent tillskrivas ärftliga faktorer.
Hur pass mycket förklarade miljöinfluenserna som delades mellan tvillingarna? Till skillnad mot vad somliga gör gällande behöver man inte inkludera tvillingar som separerades vid födseln för att kunna mäta effekten av den delade miljön. Vi kan istället ta korrelationen för utbildningsnivå mellan enäggstvillingarna i materialet (r=0,76), vilket förklaras av en kombination av bidragen från ärftligheten och de delade miljöinfluenserna, och subtrahera ärftligheten (0,44) från den för att behålla effekten av den delade miljön, vilket i det här fallet är 32 procent (0,76-0,44=0,32.)
Om ärftligheten förklarade 44 procent av variationen i utbildningsnivå och den delade miljön ytterligare 32 procent innebär det att samtliga övriga faktorer som inte delades mellan tvillingarna, eller de “unika miljöinfluenserna”, förklarade den kvarvarande variationen (1-0,44-0,32=0,24 eller 24 procent.)
Ärftligheten är specifik för populationer, inte individer
Ett vanligt misstag som icke-beteendegenetiker gör är att tolka ärftligheten som en individegenskap. Om vi tar de ovannämnda resultaten som exempel kan de göra tolkningen att orsaken till varför en given individ har en viss utbildningsnivå till 44 procent beror på dess genetiska anlag. Det är dock en helt felaktig tolkning.
Ärftlighetsmåttet baseras på hur individer i en given population skiljer sig ifrån varandra och hur pass mycket av sådana individuella skillnader kan förklaras av genetiska faktorer. Annorlunda uttryckt kan man säga att ärftligheten utgör något av ett index för hur pass mycket genetiska faktorer förklarar variationen i ett givet utfall för en given population. Detta innebär således att ärftligheten inte är något statiskt (oföränderligt) utan varierar av ett flertal skäl. Exempelvis kan ärftligheten påverkas av:
Demografiska faktorer. Inom ett givet land kan ärftligheten för specifika utfall variera mellan olika demografiska grupper (exempelvis mellan män och kvinnor eller mellan socioekonomiska grupper.)
Generationskohorter. Ärftligheten kan också variera mellan generationer av individer födda i samma land. Detta kan bero på förändringar i miljöfaktorer, livsstilsmönster eller den genetiska sammansättningen i befolkningen över tid.
Geografiska faktorer. Skillnader i ärftligheten förekommer även mellan länder, vilket potentiellt skulle kunna förklaras av variationer i den genetiska sammansättningen mellan befolkningar, men även i miljöinfluenser, inklusive kulturella normer.
Det är här viktigt att ha i åtanke att ärftlighetsskattningar enbart är informativa för att beskriva skillnader inom populationer, inte skillnader mellan populationer.
En del kritiker har gjort gällande att ärftlighetsmåttet skulle vara tämligen meningslöst just med anledning av att den är specifik för populationer och av det skälet kan variera. Kathryn Paige Harden, professor i psykologi vid University of Texas at Austin, bemötte det här argumentet genom att jämföra ärftlighetsmåttet med ett annat ojämlikhetsmått, nämligen Gini-indexet som också är populationsspecifikt (Harden, 2021, s. 122):
But we don’t treat other population statistics about inequality as unimportant because of their specificity to a particular time and place. The Gini index, for instance, is a measure of income inequality. A country where every one makes the exact same income has a Gini index of 0; a country where one person makes all the money and everyone else has nothing has a Gini index of 1. Just as a trait doesn’t have a single heritability, a country doesn’t have a single Gini index — it changes over time with economic and political changes. If someone used the Gini to describe the inequality that people in a particular society experienced at a particular moment in historical time, we would not rush to dismiss the information as “only” population specific.
En annan intressant aspekt av den här diskussionen är att dessa typer av attacker tenderar att vara reserverade för sociala utfall även om exakt samma mekanismer föreligger för många somatiska sjukdomar.
Hur varierar ärftligheten för utbildningsnivå?
För ett antal år sedan publicerade Amelia Branigan, forskarassistent i sociologi vid University of Maryland, och hennes medförfattare artikeln “Variation in the Heritability of Educational Attainment: An International Meta-Analysis” i den samhällsvetenskapliga tidskriften Social Forces (2013).
Forskarna hade identifierat samtliga tvillingstudier som vid tillfället hade undersökt utbildningsnivå som utfall. Datamaterialet inkluderade studier från ett tiotal länder och födelsekohorter med en tidsmässig spännvidd på över 100 år. Materialet meta-analyserades, vilket innebär att resultaten från de enskilda studierna sammanvägdes.
Nedan presenteras resultaten för de enskilda ärftlighetsskattningarna och den sammanvägda skattningen:
På vänster sida av grafen kan vi utläsa vilka länder och könskategorier som ärftlighetsskattningarna härstammar från. Rektanglarnas varierade storlekar avser studiernas relativa urvalsstorlekar. De horisontella linjerna anger skattningarnas konfidensintervall, vilket kan sägas vara ett mått på skattningarnas precision, där snävare linjer avser ökad precision. Den vertikala linjen anger den sammanvägda ärftlighetsskattningen.
Resultaten från den aktuella studien visade en liknande grad av ärftlighet (40 procent) som Taubmans första tvillingstudie (44 procent.) På liknande vis fann de heller inte några nämnvärda skillnader i de relativa bidragen av de delade miljöinfluenserna i den aktuella studien (36 procent) jämfört med Taubmans klassiska studie (32 procent.) De unika miljöinfluenserna, vilka även inkluderade mätfel och slumpfaktorer, förklarade 24 procent av variationen i båda studierna.
En större tvillingstudie
Ett antal år senare ledde Karri Silventoinen, professor i sociologisk demografi vid Helsingfors universitet, och hans kollegor ett ännu större forskningsprojekt där de hade samlat in utbildningsdata från strax under 200 000 tvillingar från 16 olika länder. Artikeln, “Genetic and environmental variation in educational attainment: an individual-based analysis of 28 twin cohorts” publicerades i tidskriften Scientific Reports (2020).
Silventoinen och hans kollegor fann att den sammanvägda ärftlighetsgraden för utbildningsnivå var 43 procent. Delade miljöfaktorer förklarade ytterligare 31 procent av variationen och den kvarvarande variationen på 26 procent kunde då tillskrivas unika miljöfaktorer. Detta var helt i linje med de tidigare studierna:
Intressant nog fann Silventoinen och hans kollegor att det fanns könsskillnader i de relativa bidragen av ärftligheten och miljöinfluenserna. Ärftliga faktorer förklarade en högre andel av variationen i utbildningsnivå bland män (47 procent) än bland kvinnor (38 procent.) På motsvarande vis fann de att delade miljöfaktorer förklarade en högre andel av variationen bland kvinnor (36 procent) än bland män (26 procent.)
Silventoinen och hans kollegor var därefter intresserade av att undersöka hur ärftligheten för utbildningsnivå hade varierat över tid. Författarna argumenterade för att den ökade tillgängligheten av högre utbildning efter andra världskriget hade lett till mer meritokratiska utbildningssystem. Då förmågor relevanta för utbildningsframgång i varierande grad förklaras av delvis ärftliga individegenskaper, var deras hypotes att ärftligheten för utbildningsnivå bör ha ökat bland de födda efter 1950.
De blev därför förvånade när de såg att ärftlighetsgraden hade sjunkit med 6 procentenheter över tid; från 44 procent bland de som var födda mellan 1900 och 1949 till 38 procent bland de som var födda mellan 1950 och 1989. Samtliga deltagares utbildningsnivå mättes efter det att de var 30 år gamla för att säkerställa att resultaten inte förklarades av icke-avslutade utbildningar.
Forskarna kunde inte förklara hur detta kunde komma sig utan pekade istället på att litteraturen på det här området inte har påvisat några entydiga resultat.2 En potentiell förklaring skulle kunna vara att högre utbildningar under de senaste decennierna inte längre kräver samma typer eller nivåer av förmågor som de en gång gjorde och att de förmågor som numera är relevanta tenderar att vara mindre ärftliga.
Avslutningsvis undersökte forskarna huruvida det fanns skillnader mellan tre geografiska regioner: (1) Europa, (2) Nordamerika och Australien samt (3) Östasien. Anledningen till att de undersökte de nämnda regionerna istället för enskilda länder var dels för att maximera den statistiska styrkan (jämföra större grupper av deltagare) för att kunna vara få mer precisa skattningar, dels för att de ville se om fördelningspolitiska faktorer som var gemensamma för regionerna kunde påverka skattningarna. De fann dock inte att skillnaderna i ärftligheten för utbildningsnivå var statistiskt signifikanta, vilket innebär att de inte kunde utesluta att de observerade skillnaderna kunde ha uppstått till följd av slumpen.