Hoppa över menyflikskommandon
Hoppa till huvudinnehåll

SPS Process 6.1.1

6.1.1 Beräkna vikter​

Syftet med process 6.1.1 Beräkna vikter är att räkna ut de vikter som ska användas när statistikvärden framställs. Vikterna, ibland även kallade uppräkningstal, multipliceras med objektens variabelvärden för att skapa statistikvärden gällande för populationen.

Redan i process 2.5 Utforma framställning av register och statistik planerades och utformades beräkningen av vikterna med hänsyn till urval och skattning (estimation) och eventuellt även till bortfall och täckningsbrister m.m. I process 6.1.1 ska slutlig beräkningsansats för vikterna väljas. Metodstatistisk kompetens behövs genom hela processen.

Input

Den information som behöver införas till processen är:

  • gjorda val från processerna 2.1–2.5, framför allt från 2.3.2 och 2.5
  • en urvalsfil med statuskoder från datainsamlingen.

Output

Från process 6.1.1 levereras:

  • mikrodatafil där uppräkningstal (vikter) bifogas varje observation i en urvalsundersökning, att användas i analysprocessen
  • dokumentation av vägningsproceduren (fastställd före produktionen, eventuellt senare uppdaterad)
  • bortfallsandelar (ovägda, designvägda, storleksvägda)
  • bortfallsanalys.

Genomförande

Urvalsdesignen bestämmer hur (design)vikterna ska beräknas, givet att undersökningen inte har bortfall, täckningsproblem m.m. För mer information, läs Model Assisted Survey Sampling, Särndal, Swensson och Wretman, 1992, främst kapitel 2–4. Ett annat begrepp som ibland används i stället för designvikt är inklusionssannolikhet. Designvikten definieras som inversen av inklusionssannolikheten. Det totala uppräkningstalet påverkas även av val av skattningsförfarande. För förklaring av statistiska begrepp, se kapitel 2 i Urval - från teori till praktik som finns under avsnitt Dokument och länkar nedan.

Om objektbortfall har uppstått och om täckningsproblem misstänks, måste antaganden göras om bortfallsstruktur och undertäckning m.m. Dessa problem uppträder inte bara vid urvalsundersökningar utan även vid totalundersökningar och registerbaserade undersökningar. Designvikterna multipliceras därför (i alla ovan nämnda typer av undersökningar) med faktorer som tagits fram utifrån dessa antaganden. För partiellt bortfall, se t.ex. process 5.2.3 Imputera för bortfall

Metodstatistisk kompetens krävs när slutlig beräkningsansats för vikterna ska väljas och genomföras.

Ansatser för bortfallskompensation

Beräkna uppräkningstal under ideala förhållanden

Urvalsdesignen avgör beräkningsmetod för designvikterna. Om estimatorn som ska användas innehåller hjälpinformation erhålls det totala uppräkningstalet som en produkt av designvikten och en faktor som speglar hjälpinformationen.

Justering för enbart bortfallsfel

Om objektbortfall har uppstått i undersökningen kan uppräkningstalet bortfalls­justeras. (Alternativt imputeras objektvärden). Justering för objektbortfall kan göras på olika sätt. Två metoder är rak uppräkning (inom strata) och kalibrering. En annan metod är att använda svarshomogenitetsgrupper (engelska Response Homogeneity Groups, RHG). Metodstatistisk kompetens behövs för att bedöma vilken metod som är lämplig i en specifik undersökning.

Rak uppräkning (inom strata)

Metoden innebär att designvikten multipliceras med en faktor n/m, där n = antal i urvalet och m = antal svarande. Metoden kan appliceras inom respektive stratum. För att metoden ska ge väntevärdesriktiga (engelska unbiased) punkt­skattningar ska något av (eller båda) nedanstående antaganden vara uppfyllt:

  1. svarssannolikheten är lika (inom strata)
  2. medelvärdet på mät­variabeln är detsamma bland svarande och icke-svarande (inom strata).

Kalibrering

Designvikterna multipliceras med en kalibreringsvikt så att de får egenskapen att de, för en eller flera hjälpvariabler, kan återskapa en känd populationstotal utifrån svarsdata. Metoden fungerar bra om det är möjligt att identifiera en hjälpvektor som är starkt korrelerad med (den huvudsakliga) undersökningsvariabeln. För mer information om kalibrering vid bortfall, läs Estimation in the presence of nonresponse, främst kapitel 6 och 10.

RHG

Metoden innebär ett antagande om att svarsmängden kan delas in i svarshomogenitetsgrupper, där de svarande i gruppen har samma svars­sannolikhet, men där svarssannolikheten skiljer mellan grupperna.

Justering för täckningsfel i kombination med bortfallsfel

För att kompensera för övertäckningsfel multipliceras designvikten med en faktor. Hur faktorn ska beräknas beror på vilket antagande som kan göras gällande övertäckningen:

  1. all övertäckning i urvalet identifieras
  2. andelen övertäckning är lika bland svarande och bortfall.

Tillsammans med t.ex. bortfallsjusteringen Rak uppräkning innebär ovanstående antaganden att följande faktorer ska
användas:

  1. faktorn (antal svarande i urvalet exkl. övertäckning + antal i bortfallet exkl. övertäckning) / (antal svarande i urvalet exkl. övertäckning)
  2. faktorn (antal i urvalet) / (antal svarande i urvalet).

För att kompensera för undertäckningsfel kan en modellbaserad skattning göras. I vissa situationer kan antagandet att undertäckningen är försumbar vara rimligt. Rådgör med metodstatistiker över vad som är lämpligt. En annan metod för att justera för undertäckning innebär kalibrering mot uppdaterade register­data. Metoden har inte använts särskilt mycket på SCB.

Justering för mätfel och övriga felkomponenter

Justera vikterna även för eventuella övriga fel. För att bedöma om och hur en sådan justering ska göras behövs metodstatistisk kompetens. Med hjälp av t.ex. en mätfelsstudie (återintervjustudie e.d) kan vikterna för mätfel justeras. Det finns inga standarder fastställda inom detta område.

IT-verktyg

En programvara för att beräkna (justerade) vikter är CLAN. I CLAN finns många av de vanliga ansatser som beskrivs ovan inbyggda. Variansberäknings­programmet CLAN har funnits i produktion vid SCB i olika versioner sedan 1991. Programmet är ett generellt verktyg för att beräkna punkt- och variansskattningar vid skattning av alla storheter som kan definieras som rationella funktioner av populationstotaler.

Programvaran ETOS 2.0 är en vidareutveckling av CLAN. ETOS 2.0 innehåller utökad funktionalitet för beräkning av punkt- och variansskattningar för kvantiler, Gini-koefficienter m.m. Varken CLAN eller ETOS har ännu fastställts formellt som standard vid SCB.

Länk till programvarorna CLAN och ETOS tillsammans med nödvändiga filer, instruktioner och information om användarstöd finns nedan under Dokument och länkar

Kontrollera rimligheten

När vikterna är beräknade ska rimligheten i dem kontrolleras. Vid alltför stora eller små, eller negativa vikter, kan dessa behöva modifieras. För att bedöma vikternas rimlighet och eventuellt modifiera vikterna ytterligare krävs metodstatistisk kompetens. Var särskilt uppmärksam på att det är rätt version av data som används och att inga objekt saknas eller har dubblerats.

Dokumentera vägningsproceduren

Instruktioner och dataprogram ska finnas dokumenterade. Eventuella modifieringar av planen och av program m.m. i utförandet ska dokumenteras. Det ska vara möjligt att med hjälp av dokumentationen senare göra om processens utförande på samma data med samma resultat.

När vägningsviktning används ska vägningsförfarandet finnas beskrivet på lämpligt sätt. Detta krav gäller även i de fåtaliga fall då vägning görs av uppgifter insamlade från ett icke-sannolikhetsurval. Skattningsförfarandet ska vara beskrivet, normalt med både ord och formler.

Hantering av övertäckning och bortfall måste redovisas. Undvik benämningarna nettourval och uppnådd urvalsstorlek, då dessa lätt kan missförstås. Skriv i regel hellre t.ex. ”urvalsstorlek exklusive övertäckning” när det avses, respektive ”antal svarande inklusive övertäckning” när det avses.

Stratumstorlekar samt urvalsstorlekar och svarandeantal inom strata ska rapporteras. Eventuella utnyttjade hjälpvariabler ska anges, liksom register och datum för registerversion från vilken hjälpinformationen hämtas. CLAN/ETOS-program och eventuella andra skript från skattningsprocessen ska sparas, så att spårbarhet föreligger och beräkningarna kan upprepas vid senare tillfälle.

Bortfallsandelar och bortfallsanalys

Beräkna bortfallsandelar för objektbortfall och partiellt bortfall (för viktiga variabler). Ovägda, designvägda och storleksvägda bortfallsandelar beräknas och jämförs med eventuella tidigare undersökningsomgångar. Ovägda svarsandelar speglar hur väl datainsamlingen har fungerat, designvägda svarsandelar indikerar kvaliteten i skattade parametrar, och storleksvägda svarsandelar indikerar kvaliteten i skattade parametrar som bygger på kvantitativa variabler. Se CBM Minska bortfallet.

Bortfallsanalys genomförs lämpligen i varje produktionsomgång. Analysen innebär att beräkna relativ svarsfrekvens – vägd och ovägd – för viktiga bakgrundsvariabler, för att visa om svarsbenägenheten skiljer mellan viktiga grupper. För en individundersökning kan t.ex. variablerna kön och åldersklass (korsklassificerade) belysa svars­benägenheten. Se vidare beskrivningar i Exempel på bortfallsanalys.

Det finns en logisk koppling mellan bortfallsanalys och beräkning av vikter. Inte minst på SCB är det i många fall naturligt att betrakta viktberäkning och punkt- och variansskattning som ett och samma arbetsmoment, då båda dessa moment genomförs integrerat i programvaran CLAN/ETOS. Även vid statistikproduktion som inte baseras på urval utan hela register eller totalundersökningar kan det finnas behov av viss vägning vid beräkning av punktskattningar, t.ex. för att kompensera för täckningsfel, bortfallsfel och mätfel.

Dokument och länkar

Urval – från teori till praktik (pdf)
Estimation in the presence of nonresponse (pdf)
CBM Minska bortfallet, reviderat kapitel 2 (pdf)
Exempel på bortfallsanalys (pdf)

Länkar till CLAN och ETOS (endast SCB)

-----------------------------------------------------------------------------------------------------------------------------------------------------
Senaste uppdatering

2023-04-28

Senaste verifiering
2023-04-28

Diarienummer A2023/1002