Felmarginaler i bibliometrisk statistik Finns dom? Metrics seminariet 2013-04-11 Staffan Karlsson, KTH.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Inferens om en population Sid
Rickard Danell Sociologiska institutionen, Umeå universitet
Vattenkemiska data Workshop, maj 2014 Claudia von Brömssen, SLU.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Kostnads-nyttoanalys inom CAFE – metod och preliminära resultat
Användande av hjälpinformation: Kvotskattning
An Overall Evaluation of Research at Uppsala University
Bibliometri och forskningsutvärdering Doktorandkurs, SA
Föreläsning 7 Analys av algoritmer T(n) och ordo
Kontroll av DiVA-poster Peter Sjögårde School of Education and Communication in Engineering Science KTH Royal Institute of Technology DiVA-möte
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Statsvetenskap 3, statsvetenskapliga metoder
732G22 Grunder i statistisk metodik
Karin Henning Bibliometric Services Gothenburg University Library Bibliometri och forskningsutvärdering Vårdalinstitutet,
Vetenskaplig publicering, open access och citerings- och publiceringsanalyser Vårdalinstitutet, Karin Henning Tomas Lundén Digitala tjänster.
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Publiceringsstrategier Helena Juhlin, UB Institutionen för kulturvetenskaper Bild från GU- journalen nr
Olika mått på grad av fetma - Spelar det någon roll hur vi mäter?
Schedule F6: Segmentation and Clustering F7: Multispectral Images (Sune Svanberg) F8: Segmentation and Fitting F9: Segmentation, Recognition and Classification.
Workshop i statistik för medicinska bibliotekarier!
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Sammanfatta siffrorna…
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
Samhällsvetenskapliga metoder
732G81 Statistik Föreläsning 3 732G81 Statistik
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Experience from LiU Collaboration with Industry Ingegerd Bauren & David Lawrence Linköping University.
Statsvetenskap 3, statsvetenskapliga metoder
Sannolikhet Stickprov Fördelningar
Hur bra är modellen som vi har anpassat?
Normalfördelningen och centrala gränsvärdessatsen
Fyra nedslag i den (nya) publikationsekonomin Peter Sjögårde Bibliometrisk analytiker KTH Ordförande Arbetsgruppen för Bibliometri inom SUHF
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Aborter i Norden 2013 Anna Heino Mika Gissler.
STOCKHOLMS UNIVERSITETSBIBLIOTEK Te l e f o n v x l: F ax: w w w.s u b.s u.se Informationssökning för geodoktorander Geobiblioteket,
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 I allmänhet är den asymptotiska fördelningen.
Håkan Carlsson Göteborgs universitetsbibliotek Fördelning av direkta forskningsmedel – pengarnas väg till institutionen för neurovetenskap och.
CWTS Monitor Presentation på Metricsmöte 20 oktober 2014.
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
Grundläggande statistik, ht 09, AN
PGSA.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Citeringsstatistik - möjligheter och omöjligheter Staffan Karlsson Analysenheten, Avdelningen för forskningspolitiska frågor.
Bibliometri som kvalitetsmått Staffan Karlsson Analysenheten, Avdelningen för forskningspolitiska frågor.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Marknadsundersökning Kap 12
Multipel regression och att bygga (fungerande) modeller
Presentationens avskrift:

Felmarginaler i bibliometrisk statistik Finns dom? Metrics seminariet Staffan Karlsson, KTH

Varför är man intresserad av osäkerheten i bibliometrisk statistik? •Hur ”säker” eller ”exakt” är statistiken för ett analysobjekt? •Skiljer sig olika analysobjekt åt? •Är en förändring över tid signifikant?

Vad är felmarginaler Från Wikipedia: The margin of error is a statistic expressing the amount of random sampling error in a survey's results. Dvs ”felet” beror på att statistik baserad på ett slumpässigt urval har en osäkerhet i hur väl urvalet representerar hela populationen i kombination med mätfel

Bibliometriska analyser baseras nästa alltid på totalundersökningar, dvs baseras på studieobjektets ALLA publikationer i en viss databas... då finns inga fel i den bemärkelse termen felmarginal normalt syftar på. Om analysen görs om blir resultatet troligen exakt det samma.

Visst finns fel/osäkerheter i bibliometrisk statistik •Fel identifieringen av analysobjektens publikationer •Fel i databsen -ffa felaktiga detaljer i ref. listor  fel i antalet citeringar till en artikel Marginellt i analyser av god kvalité Kan troligen vara betydande i vissa fall, men vi har inga metoder för att uppskatta storleken på dessa (?) • Resultatet är beroende av den databas som analysen baseras på

Ett alternativt perspektiv: Hur stabilt är ett bibliometriskt mått? Hur beroende är citeringsstatistiken för ett studieobjekt av några få högt citerade publikationer? •Colliander & Ahlgren 2011 •Waltman et al 2012

Stabilitet – hur mäts det? Resampling / permutation statistics: Ett stort antal nya uppsättningar data skapas genom upprepad slumpässig provtagning av de data man har. Från dessa nya utslumpade urval kan man uppskatta stabilitieten i statistiken.

Original obs.

Metodik •Bootstrapping (med återlägg) •Jackknife (utan återlägg – ta bort x observationer) Skapa ett stort antal (ofta tusentals) nya prov genom resampling och basera spridningsmått på dessa. Tex intervallet inom vilket 95% av alla nya medelvärden finns. Colliander & Ahlgren Waltman et al

Original obs. Bootstrapping Med återlägg

Original obs. N orig Jackknife utan återlägg N sample N sample < N orig

Exempel på Uppskattning av error margins/stabilitet för fältnormerad medelcitering Kronman & Karlsson, Nordiska bibliometrikonferensen 2008 (opubl) •Antagande: det finns en osäkerhet i årsmedel beroende på en slumpmässig variation mellan år i förekomsten av högt citerade publikationer 1.Årsmedelvärden för 2.24 svenska lärosäten och 153 länder med en volym om > 10 publ/år 3.Trender togs bort med en polynom regression 4.Konfidensintervall/felmarginaler beräknade baserat på residualerna från 3 5.Eller med bootstrapping

Eliminering av trender...

Medelcitering, Länder och svenska lärosäten

Bootstrapp-uppskattningar Origninaldata: 15 års publ för 4 svenska lärosäten ( publ)

Schabloner för stabilitetsinterval för fältnormerad medelcitering Antal publikationer 95%-konfidens intervall Medel 95%-konfidens intervall Inkl 95% 95 % Bootstrapp intervall 10± 0,1 ± 0,5± 0,8 100± 0,05± 0,2± 0,3 1000± 0,02± 0,09± 0, ± 0,01± 0,04

95 % Stability intervals of Mean Normalized Citation Score (MNCS) for 50 univeristies (Waltman et al 2012)

Sammanfattning •Det finns tvelöst felkällor i bibliometrisk (citerings) statistik •MEN dessa är svåra att kvantifiera •Felet är troligen oftast litet men ibland rätt stort... (tex ”svåra” namn i ref listor) •Stabiliteten i citeringsmått pga enstaka högt citerade publikationer kan relativt enkelt uppskattas •Stabilitets intervallet bör inte tolkas som ett ”mätfel”

Bör man använda [parametriska] statistiska tester på bibliometrisk statistik? •Problem -Ofta totalundersökningar som i princip inte är behäftade med några mätfel -Fördelningsmönstret är starkt skevt  statistiska metoder som bygger på normalfördelningen är inte lämpliga -Ofta stora N  lätt att hitta signifikanser även för små skillnader.  svar Hypotestestande statistik - tveksamt! Konfidensinterval / Stabilitet OK Se Schneider 2012 för en kritisk diskussion om hypotestestning av bibliometriska material

Referenser •Colliander C & Ahlgren P The effects and their stability of field normalization baseline on relative performance with respect to citation impact: A case study of 20 natural science departments. Journal of Informetrics 5: •Waltman L. et al The Leiden Ranking 2011/2012: Data Collection, Indicators, and Interpretation. Journal of the American Soc for Information Science and Technol. 63(12): 2419–2432 •Leydesdorff L & Bornmann L Testing differences statistically with the Leiden ranking. Scientometrics 92:781–783 •Schneider JW Caveats for using statistical significance tests in research assessments. arXiv: v1