6.1.1 Beräkna vikter
Syftet med process 6.1.1 Beräkna vikter är att räkna ut de vikter som ska användas när statistikvärden framställs. Vikterna, ibland även kallade uppräkningstal, multipliceras med objektens variabelvärden för att skapa statistikvärden (skattningar) gällande för målpopulationen.
Redan i process 2.5 Utforma framställning av register och statistik planerades och utformades beräkningen av vikterna med hänsyn till urval och skattning (estimation) och eventuellt även till bortfall och täckningsbrister m.m. I process 6.1.1 ska slutlig beräkningsansats för vikterna väljas.
I många fall är det naturligt att betrakta viktberäkning och punkt- och variansskattning som ett och samma arbetsmoment, då båda dessa moment genomförs integrerat i programvarorna CLAN och ETOS.
Även vid statistikproduktion som inte baseras på urval utan hela register eller totalundersökningar, kan det finnas behov av viss vägning vid beräkning av punktskattningar. Det kan behövas för att till exempel kompensera för slumpmässig osäkerhet eller skevhet (bias) orsakad av bortfall, täckningsbrister eller mätfel, eller för objekt under en cut-off-gräns (objekt uteslutna från insamling).
Input
Som input till processen behövs:
- gjorda val från processerna 2.1–2.5, framför allt från 2.3.2 och 2.5
- en urvalsfil med statuskoder från datafångsten
- observationsvariabler,
hjälpvariabler och processdata för redovisning och analys av bortfallet samt
bortfallskompensation.
Output
När processen är genomförd finns:
- bortfallsredovisning
- bortfallsanalys
- mikrodatafil där uppräkningstal (vikter) bifogas varje observation i en urvals- eller totalundersökning
- dokumentation av framtagandet
av uppräkningstal som kompenserar för osäkerhetskällorna urval och bortfall
samt ramtäckning, mätning och modellantaganden (exempelvis vid en
cut-off-ansats).
Genomförande
Urvalsdesignen är grunden för hur designvikterna ska beräknas. Om det inte uppstår någon annan osäkerhet än från urval, det vill säga ingen osäkerhet från bortfall, ramtäckning, mätfel m.m., så kan uppräkningstalen sättas lika med designvikterna (om ingen hjälpinformation utnyttjas). Annars korrigeras uppräkningstalen för att kompensera för osäkerhet av andra orsaker än urval. För mer information, läs Model Assisted Survey Sampling, Särndal, Swensson och Wretman, 1992, främst kapitel 2–4. Ett annat begrepp som ibland används i stället för designvikt är inklusionssannolikhet. Designvikten definieras som inversen av inklusionssannolikheten.
Det totala uppräkningstalet påverkas även av val av skattningsförfarande. För förklaring av statistiska begrepp, se Urval – från teori till praktik, kapitel 2.
Om objektbortfall har uppstått och om täckningsbrister misstänks, måste antaganden göras gällande bortfallsstruktur och undertäckning m.m. Designvikterna multipliceras därför med faktorer som tagits fram utifrån dessa antaganden. Vid totalundersökningar och registerbaserade undersökningar är designvikterna trivialt lika med 1. För hantering av partiellt bortfall, se t.ex. process 5.2.3 Imputera för bortfall.
IT-verktyg
En programvara för att beräkna (justerade) vikter är CLAN, där många av de vanliga ansatser som beskrivs ovan finns inbyggda. Variansberäkningsprogrammet CLAN har funnits i produktion vid SCB i olika versioner sedan 1991. Programmet är ett generellt verktyg för att beräkna punkt- och variansskattningar för alla storheter som kan definieras som rationella funktioner av populationstotaler.
Programvaran ETOS 2.0 är en vidareutveckling av CLAN. ETOS 2.0 innehåller utökad funktionalitet för beräkning av punkt- och variansskattningar för kvantiler, Gini-koefficienter m.m. Varken CLAN eller ETOS har ännu fastställts formellt som standardverktyg vid SCB.
Länkar till CLAN och ETOS tillsammans med nödvändiga filer, instruktioner och information om användarstöd finns nedan.
Rimlighetskontroll
När vikterna är beräknade ska rimligheten i dem kontrolleras. Vid alltför stora eller små vikter eller negativa vikter, kan dessa behöva modifieras. För att bedöma vikternas rimlighet och eventuellt modifiera vikterna ytterligare krävs metodstatistiska övervägandet. Var särskilt uppmärksam på att det är rätt version av data som används och att inga objekt saknas eller har dubblerats.
Dokumentation av vägningsproceduren
Instruktioner och dataprogram ska finnas dokumenterade. Eventuella modifieringar av planen och av program m.m. i utförandet ska dokumenteras. Med hjälp av dokumentationen ska det vara möjligt att göra om utförandet på samma data vid ett senare tillfälle, med samma resultat.
När vägning (viktning) används ska vägningsförfarandet finnas beskrivet på lämpligt sätt. Detta krav gäller även i de fåtaliga fall då vägning görs av uppgifter insamlade från ett icke-sannolikhetsurval. Skattningsförfarandet ska vara beskrivet, vanligtvis med både ord och formler.
Hantering av övertäckning och bortfall måste redovisas. Undvik benämningarna "nettourval" och "uppnådd urvalsstorlek", då dessa lätt kan missförstås. Skriv hellre exempelvis ”urvalsstorlek exklusive övertäckning” när det avses, respektive ”antal svarande inklusive övertäckning” när det avses.
Stratumstorlekar samt urvalsstorlekar och svarandeantal inom strata ska rapporteras. Eventuella utnyttjade hjälpvariabler ska anges, liksom register och datum för registerversion från vilken hjälpinformationen hämtas. CLAN- och ETOS-program och eventuella andra skript från skattningsprocessen ska sparas, så att spårbarhet föreligger och beräkningarna kan upprepas vid senare tillfälle.
Dokument och länkar för SCB
Länklistan i detta avsnitt är endast tillgänglig för användare på SCB.
Dokument och länkar för användare utanför SCB
-----------------------------------------------------------------------------------------------------------------------------------------------------
Senaste uppdatering
2025-12-02
Senaste verifiering
2025-12-02
Diarienummer SCB2025/13