6.1.4 Kvalitetssäkra data
Syftet med processen 6.1.4 Kvalitetssäkra data är att granska de statistiska resultat som ska publiceras eller levereras till kund. Processen ska dels upptäcka samt eliminera återstående betydelsefulla fel, och dels ge underlag för kvalitetsbeskrivningen av statistiken. Vanligtvis handlar det om makrogranskning (ibland kallat outputgranskning eller aggregatgranskning).
Denna granskning kan också ses som viktig input till kommande processteg, framför allt 6.3 Tolka och förklara och 6.4 Fastställ innehåll för redovisning och kommunikation. Notera att en slutgranskning vid publicering eller leverans också behöver göras i ett senare skede i process 7.1 och 7.2. Där kontrolleras att text, tabeller, diagram och kartor är riktiga (enligt resultatet från process 6) och konsistenta sinsemellan.
Input
Som input i processen behövs:
- mikrodatafil där uppräkningstal (vikter) bifogas varje observation i en urvalsundersökning
- dokumentation av skattningsförvarandet (fastställd före produktionen, eventuellt senare uppdaterad)
- bearbetade data
- framställda statistikvärden (skattningar)
- bortfallsandelar (ovägda, designvägda, storleksvägda)
- bortfallsanalys
- processdata
- DokSTAR och DokBOR (för helt eller delvis registerbaserade produkter).
Output
När processen är genomförd finns:
- kontrollerade skattningar och vikter
- eventuella upptäckta fel återkopplade till tidigare processteg
- underlag till dokumentation i Statistikens framställning (StaF) och kvalitetsdeklarationen (KD), se vidare i process 6.4 där dokumentationen fastställs.
Genomförande
Det finns en rad kontroller som görs i makrogranskningen av ett datamaterial. Gemensamt för kontrollerna är att de tar avstamp i aggregerade data. Första steget utgörs av att misstänkt felaktiga aggregat identifieras. I det andra steget härleds misstanken till ett eller flera av de objekt som bidrar till det misstänkta aggregatet. Makrogranskning är också viktig vid registerbaserad statistikproduktion för att hitta inkonsistenser och orimligheter i datamaterialet. Det beror på att det ibland är den enda granskningsprocess som tillämpas. Mängden objekt i ett register gör ofta mikrogranskning opraktisk. Makrogranskning underlättar att hitta de misstänkta objekt som faktiskt påverkar slutresultatet.
Nedan finns information om olika aspekter av hur det går att kvalitetskontrollera resultaten samt vikten av att återkoppla till tidigare processteg om orimligheter upptäcks i resultatet.
Olika typer av kvalitetskontroll
Utför interna sambandskontroller
Det är viktigt att de resultat som redovisas hänger ihop på ett saklogiskt sätt. Med det avses såväl rent definitionsmässiga samband som t.ex. att A + B = C (där A, B och C är variabler), men även relationer av typen A/B < 1. I de fall en eller flera skattningar av saklogiska skäl bedöms vara misstänkta kan exempelvis grafiska metoder användas för att hänföra dessa misstankar till enskilda objekt. Grafisk granskning beskrivs bland annat Guide till granskning och kapitel 5. Verktyg som SAS VA och PowerBI
kan användas för att skapa granskningsrapporter där det går att arbeta sig ner
från aggregat till enskilda objekt.
Jämför med annan statistik
Resultaten från den aktuella undersökningen jämförs med annan liknande statistik. I detta sammanhang är det viktigt att vara uppmärksam på de eventuella definitionsskillnader (t.ex. olika målpopulationer, skillnader i variabeldefinitioner eller skilda referensperioder) som kan finnas mellan statistikprodukterna och påverka jämförbarheten. Denna typ av jämförelser ger också bra input till den kvalitetsbeskrivning av statistiken som upprättas i samband med publicering.
Jämför med tidigare publicerad statistik
Om det är en återkommande undersökning är det också naturligt att jämföra aktuella resultat med tidigare publicerade resultat. Finns det en längre tidsserie tillgänglig, görs denna jämförelse med fördel med hjälp av tidsseriemetodik (se process 6.1 Framställ statistikvärden).
Utnyttja annan kvalitetsinformation
För statistikprodukter som är helt eller delvis registerbaserade kan information som sammanställts i form av dokumentationen av det statistiska registret (DokSTAR) eller av det bearbetade observationsregistret (DokBOR) användas för att förstå och förklara eventuella avvikelser identifierade i samband med makrogranskningen. Resultat från aktuella kvalitetsstudier kan också bidra med relevant kvalitetsinformation.
En bortfallsanalys (se process 6.1.1 Beräkna vikter) ger information om risken för bortfallsbias i vissa redovisningsgrupper. Det ideala är naturligtvis att denna skevhet åtgärdas i samband med viktberäkningen. Men om detta av olika skäl inte är möjligt redovisas bortfallsanalysen i kvalitetsbeskrivningen av statistiken.
Det är även värdefullt att använda skattningar av eventuell urvalsosäkerhet som skattningen är behäftad med, för att värdera om en skattning är misstänkt eller inte.
Återkoppla till tidigare processteg
Makrogranskning ska utföras så nära i tiden för uppgiftslämnandet som möjligt. Kvaliteten på insamlade data förväntas vara högre ju närmare tiden för uppgiftslämnandet återkontakt sker. I viss statistikproduktion är återkontakt inte möjlig. Det gäller ibland när källan är ett register eller administrativa data, och för viss insamling från individer. Då är imputering ett alternativ, där orimliga eller ologiska värden identifieras och ersätts med nya värden som förmodas ligga närmare sanningen. Om data kommer från ett administrativt register på en annan myndighet bör återkoppling om hittade orimligheter göras till berörd registerproducent. För interna leveranser av data ska ansvaret för makrogranskning beskrivas i leverantörsöverenskommelser upprättade i process 3.1.
Från denna process (6.1.4) återkopplas det ofta till process 5.2.2 Granska mikrodata. Det beror på att upptäckta fel på aggregerad nivå leder till att fel upptäcks även på mikronivå (som hanteras i process 5.2.2).
Instruktion för makrogranskning
De fel som upptäcks i makrogranskningen kan härröra från insamlingen eller från genomförda bearbetningar. När misstänkta tabellceller identifierats gäller det att hitta den bakomliggande orsaken. Går felet att relatera till rapporterade värden hos ett eller fler objekt eller är felet relaterat till fel i någon eller några bearbetningar? Med ett effektivt verktyg för makrogranskning underlättas arbetet samtidigt som risken minskar för att fel uppkommer i de data som ska levereras eller publiceras. I Instruktion för makrogranskning finns en introduktion som beskriver vad som är bra att tänka på vid utformning och uppdatering samt vid genomförandet av makrogranskning.
Som stöd vid hanteringen av granskningen under covid-19-pandemin togs dokumentet Stöd vid hantering av coronaeffekter i granskningsprocessen fram. Rekommendationerna i dokumentet var inte bindande, men skulle följas av de statistikprodukter som det var genomförbart för. Dokumentet kan användas som stöd i andra situationer när en stor mängd värden avviker från det normala.
Dokument och länkar för SCB
Länklistan i detta avsnitt är endast tillgänglig för användare på SCB.
Dokument och länkar för användare utanför SCB
-----------------------------------------------------------------------------------------------------------------------------------------------------Senaste uppdatering2025-11-06
Senaste verifiering
2025-11-06
Diarienummer SCB2025/13