Bedömning av uppfyllelse av miljökvalitetsnormer Claudia von Brömssen Enheten för tillämpad statistik och matematik Institutionen för Ekonomi, SLU
Miljökvalitetsnormer Från NVs webbsida: ”Utgångspunkten för en norm är kunskaper om vad människan och naturen tål. Normerna kan även ses som styrmedel för att på sikt nå miljökvalitetsmålen. De flesta av miljökvalitetsnormerna baseras på krav i olika direktiv inom EU. ” ”För att få reda på om vidtagna åtgärder räcker till för att en miljökvalitetsnorm ska uppfyllas i tid behöver det ske en uppföljning, det vill säga de av regeringen utpekade myndigheterna eller kommunerna behöver genom mätningar och beräkningar övervaka den reglerade miljökvaliteten.”
Miljökvalitetsnormer Miljömålen måste översättas till kvantitativa storheter: ”volymen död ved per hektar” som en indikator på miljömålet ”levande skogar”. ”dyngsmedelvärdet för PM10” ”fisk luft”. Varje miljömål består av ett flertal indikatorer. Frågor: Hur kan beslut tas utifrån indikatorernas värden? Vilka problem finns det när bedömningen görs? Hur kan osäkerheterna bedömas?
Måluppfyllelse – en enkel formalisering Ett mål är uppfylld om Y≥ G Alltså om det sanna värdet av indikatorn (Y) är större än gränsvärdet (G) (Alternativ: Y ≤ G) Det sanna värdet Y kan dock inte observeras – vi måste skatta det.
Indikatorns skattning För att kunna bedöma om målet är uppfyllt måste vi skatta värdet på Y. Skattningen ska - inte ha systematiska fel - vara så noggrann som möjligt givet resurserna Skattningens osäkerhet anges med skattningens medelfel. Hur medelfelet beräknas beror på vilken typ at skattning som används, t.ex. medelvärde, proportion, kvot,…
Hypotesprövning Det finns olika sätt att bedöma om målet är uppfyllt. Ett av dessa är klassisk statistisk hypotesprövning. Vi vill visa att Y> G är uppfylld och sätter Nollhypotesen: Y ≤ G Alternativhypotes: Y >G Vi utgår ifrån att nollhypotesen är sann och ta ställning till om skattningens observerade värde är osannolikt. Om det är det så förkastar vi nollhypotesen. Hur osannolik ett värde måste vara för att nollhypotesen ska förkastas bestäms av användaren genom signifikansnivån.
Hypotesprövning Observerat värde
’Fail-safe’ mot ’benefit of doubt’ I föregående exemplet användes metoden ’Fail-safe’: Man kan inte anse att målet är uppfyllt innan man kan visa att motsatsen är orimligt. Bevisbördan ligger hos oss. Man kan också vända på hypoteserna genom metoden ’Benefit of doubt’: Nollhypotes: Y ≥ G (målet är uppfyllt) Alternativhypotes: Y< G Man anser att målet är uppfyllt tills vi kan bevisa motsatsen. Bevisbördan ligger hos andra.
Benefit of doubt - hypotesprövning
’Fail-safe’ mot ’benefit of doubt’ Ett stort problemet med metoden benefit of doubt är att man genom undermålig datainsamling skulle kunna se till att alla mål är uppfyllda. Ett problem med metoden Fail-safe är att man måste överskrida målgränsen med stort marignal för att hypotestestet blir signifikant. Det observerade värdet måste ligger minst på G+ 1.645*SE, där SE är medelfelet av skattningen. Benefit of doubt rekommenderas inte!
Konfidensintervall På samma sätt kan vi använda konfidensintervall för att dra slutsatserna. När vi har bestämt ett konfidensintervall för det sanna värdet Y, så kan vi kontrollera om gränsvärdet G ligger inom eller utanför detta interval. Samma funderingar som för fail-safe och benefit of doubt gäller även här. G G
Face value – Direkt insättning När man använder metoden Face value, så anser man att målet är uppfylld när det observerade värdet ligger inom bedömningsgrundens målområde, dvs om > G I samband med denna metod är det vanligt att man beräknar hur stor sannolikheten är att beslutet är felaktigt om det sanna värdet är Y=y för olika möjliga värden på y. Om y är nära gränsen G är sannolikheten för felaktiga beslut givetvis större än om y är avsevärt större än G.
Face value – Direkt insättning EK=Y
Hybridmetoden Det kan tyckas att hypotesprövningen/konfidensintervallet kräver för mycket eller är ”orättvist”, medan det är svårt att bedöma osäkerheten för direkt insättning. En kompromiss skulle vara att det fanns en sorts gråzon, där beslutet är osäkert. Om vi sätter två referensgränser R och G, där R är mindre än G, så kan vi istället använda oss av en hybrid mellan dessa metoder.
Hybridmetoden Om U betecknar den undre gränsen för konfidensintervallet, R det nedre gränsvärdet och G det ursprungliga gränsvärdet, så kan vi få 6 fall: U ≥ G. Målet är uppfyllt (”grönt” fall). ≥ G och G ≥ U ≥ R. Målet är uppfyllt (”grönt” fall) ≥ G och R ≥ U. Här kan vi inte ta något beslut (”orange” fall) G ≥ ≥ R och G ≥ U ≥ R. Också tveksamt. G ≥ ≥ R och R ≥ U. Här anser vi målet inte vara uppfyllt (”rött” fall) R ≥ (och R ≥ U). Här anser vi målet inte vara uppfyllt (”rött” fall)
Hybridmetoden Grönt: R G Orange: R G R G
Hybridmetoden Rött: R G R G
Hybridmetoden Orange, fall 1, betyder alltså att vi behöver ytterligare information, då vi har för lite eller för osäkra data. Orange, fall 2, inträffar när vi har mycket eller säkra data (eller när skillnaden mellan G och R har blivit för stor). Vi är ganska säkra på vi ligger under G, men vi är också säkra på att Y är större än R. En nackdel med varianten är att riskkontrollen sker gentemot gränsen R och att sannolikhetsberäkningar gentemot gränsen G kompliceras.
Osäkerheten av statistiska mått För att kunna genomföra hypotestest eller osäkerhetsbedömningar för direkt insättning måste vi känna till osäkerheten av det observerade värdet. Osäkerheten består ofta ur många olika komponenter: spatial och temporal osäkerhet, fel i samplingen eller i den kemiska analysen Det kan också vara svårt att uppskatta osäkerheten/variationen ur datamaterialet om datamaterialet är litet.
Hjälpinformation - normalisering För att skatta den relevanta variationen kan det vara intressant att försöka skala bort variation som kan beskrivas av yttre omständigheter. För att kunna skatta säsongsvariationen måste det finnas observationer under de relevanta säsongerna för ett antal år. Om en del av variation beror på väderleken (nederbörd, temperatur,…) så måste det finnas observationer för ett antal olika väderförhållandena. Att reducera variationen med förklarande variabler sker oftast med någon form av regressionsmodell. Viss del av variationen förklaras av säsong eller väder. Enbart den variation som kvarstår används i bedömningen av måluppfyllelse.
Stickprovsstorlekar Man vill gärna redan i förväg veta hur många observationer som behövs för att ganska säkert kunna påvisa att ett objekt håller god statusklass om så är fallet. Beräkningar av stickprovsstorleken för hypotesprovning är dock, som alltid, svårt och kräver mycket information om de förväntade resultaten. Den generella frågan är hur många observationer behövs för att kunna uppnå en viss styrka för hypotestestet. Den information vi behöver är alltså samma som vi behöver för en styrkeberäkning.
Information för Styrkeberäkningar Vi behöver alltså - testets signifikansnivå och den önskade styrka (väljs ofta till 0.05 och 0.8) - osäkerheten av det statistiska måttet som används, dvs medelfelet (standard error). Osäkerheten är vanligtvis inte känd och kan skattas först när man har observerade värden. Ibland kan den skattas ur tidigare liknande undersökningar, om sådana finns. - det sanna värdet för alternativhypotesen Om H0: Y ≤ G och H1: Y>G så behöver vi alltså sätta ett värde för Y . Vi kan alltså bara bestämma att testet ska ha en styrka av 0.8 om avståndet mellan Y och G är av ett visst värde. Vi kan också beräkna styrkefunktioner för olika värden för det sanna Y.
Att tänka på vid bedömning av mål - Vad är en lämplig statistisk fråga? - Hur skattar man osäkerheten? Vad gör jag om jag har få observationer? - Finns det hjälpinformation som man kan använda för att minska osäkerheten? - Kommer jag att lyckas att visa ’god status’ ens om det är verkligheten?