Fjärranalysdata spelar en allt viktigare roll för att få fram beslutsunderlag om skogen. Det är en utveckling som enligt forskare inom Mistra Digital Forest aktualiserar en för många svårgreppbar bias-problematik. ”Resultaten av vanliga statistiska skattningar med fjärranalysdata är ofta snedvridna. Det måste vi hantera för att inte fatta beslut på felaktiga grunder”, säger Göran Ståhl, professor i skogsinventering vid SLU.

Göran Ståhl, SLU. Foto: SLU.
Att använda sig av fjärranalysdata för att skatta skogens tillstånd är inget nytt, men det blir allt vanligare. Inom EU finns planer på att använda optiska satellitdata för att som en del av klimatrapporteringen kartlägga Europas skogar och den nationella laserskanningen ger sedan länge viktig information om den svenska skogen.
Utvecklingen aktualiserar en bias-problematik som framför allt uppstår när vi använder fjärranalysdata som beskriver skogen på en mer övergripande nivå. Det menar professor Göran Ståhl vid SLU som har studerat saken inom Mistra Digital Forest och publicerat en vetenskaplig artikel på ämnet.
– Fjärranalysdata som beskriver skogen på pixel- och beståndsnivå i kombination med traditionella statistiska beräkningsmodeller resulterar ofta i skattningar som är snedvridna. Låga sanna värden tenderar att överskattas och höga sanna värden underskattas. Detta är känt sedan tidigare, men orsaken har varit desto mer oklar och beror främst på en sammanblandning av statistiska metoder, säger Göran Ståhl.
Laserdata går att korrigera – mycket svårare med optiska satellitdata
Nu undersöker forskarna olika strategier för att råda bot på problemet med särskilt fokus på optiska satellitdata och laserdata likt dem från Lantmäteriets nationella laserskanning.

Magnus Ekström, SLU.
– Vi jämför flera etablerade och nya metoder för att se om de minskar förekomsten av systematiska fel. Önskvärt är att hitta metoder som har små systematiska fel utan att öka osäkerheten för mycket, säger Magnus Ekström, professor i skoglig matematisk statistik vid SLU.
Resultatet hittills visar att det fungerar någorlunda bra att korrigera för avvikelser i de fall fjärranalysdatat starkt hänger samman med den variabel som ska skattas, exempelvis virkesvolym .
– Laserskanningsdatat har den starka kopplingen. Däremot verkar det vara långt svårare att korrigera för avvikelsen om man har optiska satellitdata. Då är kopplingen mellan variabeln och datat svagare och det blir svårare att göra en korrektion, säger Magnus Ekström.
Tillbaka till Göran Ståhl som understryker att vi behöver förstå och hantera den här problematiken:
– Annars riskerar vi att missa ovanliga och extrema bestånd i skogen, sådana som många gånger är de mest intressanta. Eftersom både skogliga och politiska aktörer använder fjärranalysdata i allt större omfattning finns det en ökad risk att fatta beslut på felaktiga grunder. Vi behöver nya sätt att tänka kring dataanalys och modellering.