6.1.1 Beräkna vikter

Syftet med process 6.1.1 Beräkna vikter är att räkna ut de vikter som ska användas när statistikvärden framställs. Vikterna, ibland även kallade uppräkningstal, multipliceras med objektens variabelvärden för att skapa statistikvärden (skattningar) gällande för målpopulationen.

Redan i process 2.5 Utforma framställning av register och statistik planerades och utformades beräkningen av vikterna med hänsyn till urval och skattning (estimation) och eventuellt även till bortfall och täckningsbrister m.m. I process 6.1.1 ska slutlig beräkningsansats för vikterna väljas.

I många fall är det naturligt att betrakta viktberäkning och punkt- och variansskattning som ett och samma arbetsmoment, då båda dessa moment genomförs integrerat i programvarorna CLAN och ETOS.

Även vid statistikproduktion som inte baseras på urval utan hela register eller totalundersökningar, kan det finnas behov av viss vägning vid beräkning av punktskattningar. Det kan behövas för att till exempel kompensera för slumpmässig osäkerhet eller skevhet (bias) orsakad av bortfall, täckningsbrister eller mätfel, eller för objekt under en cut-off-gräns (objekt uteslutna från insamling).

Input

Som input till processen behövs:

gjorda val från processerna 2.1–2.5, framför allt från 2.3.2 och 2.5
en urvalsfil med statuskoder från datafångsten
observationsvariabler, hjälpvariabler och processdata för redovisning och analys av bortfallet samt bortfallskompensation.

Output

När processen är genomförd finns:

bortfallsredovisning
bortfallsanalys
mikrodatafil där uppräkningstal (vikter) bifogas varje observation i en urvals- eller totalundersökning
dokumentation av framtagandet av uppräkningstal som kompenserar för osäkerhetskällorna urval och bortfall samt ramtäckning, mätning och modellantaganden (exempelvis vid en cut-off-ansats).

Genomförande

Urvalsdesignen är grunden för hur designvikterna ska beräknas. Om det inte uppstår någon annan osäkerhet än från urval, det vill säga ingen osäkerhet från bortfall, ramtäckning, mätfel m.m., så kan uppräkningstalen sättas lika med designvikterna (om ingen hjälpinformation utnyttjas). Annars korrigeras uppräkningstalen för att kompensera för osäkerhet av andra orsaker än urval. För mer information, läs Model Assisted Survey Sampling, Särndal, Swensson och Wretman, 1992, främst kapitel 2–4. Ett annat begrepp som ibland används i stället för designvikt är inklusionssannolikhet. Designvikten definieras som inversen av inklusionssannolikheten.

Det totala uppräkningstalet påverkas även av val av skattningsförfarande. För förklaring av statistiska begrepp, se Urval – från teori till praktik, kapitel 2.

Om objektbortfall har uppstått och om täckningsbrister misstänks, måste antaganden göras gällande bortfallsstruktur och undertäckning m.m. Designvikterna multipliceras därför med faktorer som tagits fram utifrån dessa antaganden. Vid totalundersökningar och registerbaserade undersökningar är designvikterna trivialt lika med 1. För hantering av partiellt bortfall, se t.ex. process 5.2.3 Imputera för bortfall.

IT-verktyg

En programvara för att beräkna (justerade) vikter är CLAN, där många av de vanliga ansatser som beskrivs ovan finns inbyggda. Variansberäkningsprogrammet CLAN har funnits i produktion vid SCB i olika versioner sedan 1991. Programmet är ett generellt verktyg för att beräkna punkt- och variansskattningar för alla storheter som kan definieras som rationella funktioner av populationstotaler.

Programvaran ETOS 2.0 är en vidareutveckling av CLAN. ETOS 2.0 innehåller utökad funktionalitet för beräkning av punkt- och variansskattningar för kvantiler, Gini-koefficienter m.m. Varken CLAN eller ETOS har ännu fastställts formellt som standardverktyg vid SCB.

Länkar till CLAN och ETOS tillsammans med nödvändiga filer, instruktioner och information om användarstöd finns nedan.

Rimlighetskontroll

När vikterna är beräknade ska rimligheten i dem kontrolleras. Vid alltför stora eller små vikter eller negativa vikter, kan dessa behöva modifieras. För att bedöma vikternas rimlighet och eventuellt modifiera vikterna ytterligare krävs metodstatistiska övervägandet. Var särskilt uppmärksam på att det är rätt version av data som används och att inga objekt saknas eller har dubblerats.

Dokumentation av vägningsproceduren

Instruktioner och dataprogram ska finnas dokumenterade. Eventuella modifieringar av planen och av program m.m. i utförandet ska dokumenteras. Med hjälp av dokumentationen ska det vara möjligt att göra om utförandet på samma data vid ett senare tillfälle, med samma resultat.

När vägning (viktning) används ska vägningsförfarandet finnas beskrivet på lämpligt sätt. Detta krav gäller även i de fåtaliga fall då vägning görs av uppgifter insamlade från ett icke-sannolikhetsurval. Skattningsförfarandet ska vara beskrivet, vanligtvis med både ord och formler.

Hantering av övertäckning och bortfall måste redovisas. Undvik benämningarna "nettourval" och "uppnådd urvalsstorlek", då dessa lätt kan missförstås. Skriv hellre exempelvis ”urvalsstorlek exklusive övertäckning” när det avses, respektive ”antal svarande inklusive övertäckning” när det avses.

Stratumstorlekar samt urvalsstorlekar och svarandeantal inom strata ska rapporteras. Eventuella utnyttjade hjälpvariabler ska anges, liksom register och datum för registerversion från vilken hjälpinformationen hämtas. CLAN- och ETOS-program och eventuella andra skript från skattningsprocessen ska sparas, så att spårbarhet föreligger och beräkningarna kan upprepas vid senare tillfälle.

Dokument och länkar för SCB

Länklistan i detta avsnitt är endast tillgänglig för användare på SCB.

Dokument och länkar för användare utanför SCB

-----------------------------------------------------------------------------------------------------------------------------------------------------
Senaste uppdatering
2025-12-02

Senaste verifiering
2025-12-02

Diarienummer SCB2025/13

SPS Process 6.1.1 // <![CDATA[ _spBodyOnLoadFunctionNames.push("setupPageDescriptionCallout"); // ]]>

6.1.1 Beräkna vikter​