Hoppa över menyflikskommandon
Hoppa till huvudinnehåll

SPS Process 6.1.4

​6.1.4 Kvalitetssäkra data

Syftet med processen 6.1.4 Kvalitetssäkra data är att granska de statistiska resultat som ska publiceras eller levereras till kund. Den för beräkningarna slutliga kvalitetskontrollen ska dels upptäcka och eliminera återstående betydelsefulla fel, dels ge underlag för kvalitetsbeskrivningen av statistiken.

Denna granskning kan också ses som viktig input till kommande processteg, framför allt 6.3 Tolka och förklara och 6.4 Fastställ innehåll för redovisning och kommunikation. Andra vanligt förekommande benämningar på processen är outputgranskning, makrogranskning och aggregatgranskning. Notera att en slutgranskning vid publicering eller leverans också behöver göras i ett senare skede, i process 7.1–7.2. Där kontrolleras att text, tabeller, diagram och kartor är riktiga (enligt resultatet från process 6) och konsistenta sinsemellan.

Arbetet i denna process kräver viss metodstatistisk kompetens.

Input

  • mikrodatafil där uppräkningstal (vikter) bifogas varje observation i en urvalsundersökning
  • dokumentation av vägningsproceduren (fastställd före produktionen, eventuellt senare uppdaterad)
  • bearbetade data och beräknade vikter
  • framställda statistikvärden (skattningar)
  • bortfallsandelar (ovägda, designvägda, storleksvägda)
  • bortfallsanalys
  • processdata

Output

  • kontrollerade vikter och skattningar
  • eventuella upptäckta fel återkopplade till tidigare processteg
  • underlag till dokumentation i Statistikens framställning (StaF) och kvalitetsdeklarationen (KD), se vidare i process 6.4 där dokumentationen fastställs

Genomförande

Det finns en rad kontroller som görs i outputgranskningen av ett datamaterial. Gemensamt för kontrollerna är att de tar avstamp i aggregerade data. Första steget utgörs av att misstänkta aggregat identifieras. I det andra steget härleds misstanken till ett eller flera av de objekt som bidrar till det aktuella misstänkta aggregatet. Outputgranskning är också viktig vid registerbaserad statistikproduktion för att hitta inkonsistenser och orimligheter i datamaterialet eftersom det ibland är den enda granskningsprocess som tillämpas. Mängden objekt i ett register gör ofta mikrogranskning opraktisk. Outputgranskning underlättar att hitta de misstänkta objekt som faktiskt påverkar slutresultatet.

Här följer information om olika typer eller aspekter på hur man kan kvalitetskontrollera sina resultat, men även information om stöd och verktyg samt vikten att återkoppla till tidigare processteg om man upptäcker orimligheter i sina resultat.

Ytterligare stöd för kvalitetskontroll kommer att tas fram under år 2023 och kommer då att finnas tillgängligt här under process 6.1.4.

Olika typer av kvalitetskontroll

Utför interna sambandskontroller

Det är viktigt att de resultat som redovisas hänger ihop på ett saklogiskt sätt. Här avses såväl rent definitionsmässiga samband, t.ex. att A + B = C (där A, B och C är variabler), som relationer av typen A/B < 1. I de fall en eller flera skattningar på saklogiska skäl bedöms vara misstänkta, kan t.ex. grafiska metoder användas för att hänföra dessa misstankar till enskilda objekt. Grafisk granskning beskrivs bland annat i kapitel fem i CBM 2002:1 Guide till granskning.

Jämför med annan statistik

Resultaten från den egna undersökningen jämförs med annan liknande statistik. I detta sammanhang är det naturligtvis viktigt att vara uppmärksam på de eventuella definitions­skillnader (t.ex. olika målpopulationer, skillnader i variabel­definitioner eller skilda referensperioder) som kan finnas mellan undersökningarna och som kan påverka jämförbarheten. Denna typ av jämförelser ger också bra input till den kvalitetsbeskrivning av statistiken som upprättas i samband med publicering.

Jämför med tidigare publicerad statistik

Om det är en återkommande undersökning är det också naturligt att jämföra aktuella resultat med tidigare publicerade resultat. Finns det en längre tidsserie tillgänglig, görs denna jämförelse med fördel med hjälp av tidsseriemetodik (se process 6.1 Framställ statistikvärden).

Utnyttja annan kvalitetsinformation

En bortfallsanalys (se process 6.1.1 Beräkna vikter) ger information om risken för bortfallsbias i vissa redovisningsgrupper. Det ideala är naturligtvis att denna skevhet åtgärdas i samband med viktberäkningen, men om detta av olika skäl inte är möjligt så redovisas bortfallsanalysen i kvalitetsbeskrivningen av statistiken.

Det är även värdefullt att använda skattningar av eventuell urvalsosäkerhet som skattningen är behäftad med, för att värdera om en skattning är misstänkt eller inte.

Återkoppla till tidigare processteg

Makrogranskning utförs så nära i tiden för uppgiftslämnande det är möjligt. Kvaliteten på insamlade data förväntas vara högre ju närmare tiden för uppgiftslämnandet återkontakt sker. I viss statistikproduktion är återkontakt inte möjlig, detta gäller ibland när källan är ett register och i viss insamling från individer. Ett alternativ är då imputering där orimliga eller ologiska värden identifieras och ersätts med nya värden som förmodas ligga närmare sanningen. Om data kommer från ett administrativt register på annan myndighet bör återkoppling om hittade orimligheter göras till berörd registerproducent. För interna leveranser av data ska ansvaret för outputgranskning beskrivas i leverantörsöverenskommelser upprättade i process 3.1.

Från denna process, Kvalitetssäkra data, återkopplas ofta till process 5.2.2 Granska mikrodata. Upptäckta fel på aggregerad nivå leder till att fel upptäcks även på mikronivå. Dessa fel hanteras i process 5.2.2. 

Checklista för outputgranskning

För outputgranskning av statistikvärden, inkl. analysresultat, ska Checklista för outputgranskning tillämpas. Checklistan finns tillgänglig via Word. Notera att checklistan ska användas även för tilläggsbearbetningar efter ordinarie publicering eller leverans. En undersökningsspecifik version av checklistan fylls i och lagras med övriga undersökningsdokument.

Verktyg för outputgranskning

De fel som upptäcks i outputgranskningen kan härröra från insamlingen eller från genomförda bearbetningar. När misstänkta tabellceller identifierats gäller det att hitta den bakomliggande orsaken. Går felet att relatera till rapporterade värden hos ett eller fler objekt eller är felet relaterat till fel i någon eller några bearbetningar? Med ett effektivt verktyg för outputgranskning underlättas arbetet samtidigt som risken för att fel uppkommer i de data som ska levereras eller publiceras minskar. I dokument Anvisning för outputgranskning finns information om hur rapporter för outputgranskning designas.

För att kunna hantera granskning på ett bra sätt till följd av covid-19 har ett stöddokument tagits fram, Stöd vid hantering av Coronaeffekter i granskningsprocessen. Rekommendationerna i dokumentet är inte bindande, men ska följas av de statistikprodukter som det är genomförbart för.

Kontaktuppgifter

Vid frågor eller för att få ytterligare stöd skriv gärna till gruppbrevlådan Granskning@scb.se

Dokument och länkar

Guide till granskning (pdf)
Checklista för outputgranskning (Word, endast för SCB)
Checklista (pdf)
Anvisning för outputgranskning (pdf)
Stöd vid hantering av Coronaeffekter i granskningsprocessen (pdf)

-----------------------------------------------------------------------------------------------------------------------------------------------------
Senaste uppdatering
2023-04-28

Senaste verifiering
2023-04-28

Diarienummer A2023/1002