Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Kapitel 5 Stickprovsteori Sid
Skånes Universitetssjukhus
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Kap 4 - Statistik.
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Sammanfatta siffrorna…
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 1 Kursintroduktion Statistiska undersökningar
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
732G81 Statistik Föreläsning 3 732G81 Statistik
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Skattning av trendkurvor/trendytor och förändringar över tiden Claudia von Brömssen SLU.
Binomialsannolikheter ritas i ett stolpdiagram
Statsvetenskap 3, statsvetenskapliga metoder
Sannolikhet Stickprov Fördelningar
Att välja metod Från Henrik Boström Vad används metoden till?
732G22 Grunder i statistisk metodik
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Grundläggande statistik ht 09, AN
Statistik Lars Valter Fil.lic. Statistik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
732G22 Grunder i statistisk metodik
Helena Lindgren 1 MDI – fördjupningskurs (D – nivå) Kursens mål ge teoretisk fördjupning i ämnet människa-dator interaktion, ge kunskap om metoder.
Lägesmått. Lägesmått Vad är lägesmått? Sammanfatta en mängd data Exempelvis hur mycket veckopengar får elever som går i åk7… En klass består av ca.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 1, Introduktion Varför statistik? Population – Urval - Mätnivå Deskription Cirkeldiagram, stapeldiagram, histogram, spridningsdiagram, boxplot…
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Föreläsning 1-3 Introduktion till kursen Beskrivande statistik.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
STATISTISK METODIK 1. INLEDNING / VAD ÄR STATISTIK? 2. UNDERSÖKNINGSMETODIK 3. DESKRIPTION 4. SAMBAND.
Kap 4 - Statistik.
KAP 5 – SANNOLIKHETSLÄRA OCH STATISTIK
Sju sätt att visa data Sju vanliga och praktiskt användbara presentationsformat vid förbättrings- och kvalitetsarbete.
Marknadsundersökning Kap 12
X Lägesmått För att beskriva ett statistiskt material använder vi oss av lägesmått. De vanligaste lägesmåtten är medelvärde, median och.
Multipel regression och att bygga (fungerande) modeller
Data och att presentera data
Fördelning av data och index
Förelasning 1 Kursintroduktion Statistiska undersökningar
Vad ingår kursen? i korta drag
ÄMNESHJUL MATEMATIK ÅK 3
Grundl. statistik F2, ht09, AN
KAP 5 – SANNOLIKHETSLÄRA OCH STATISTIK
STATISTIK OCH SANNOLIKHETER
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)

Kursmål: För godkänt betyg på kursen skall studenten känna till ett flertal metoder och tekniker för visualisering av datamaterial; kunna genomföra enkla beräkningar av sannolikheter; ha grundläggande kunskaper om stokastiska variabler, vanliga sannolikhetsfördelningar och innebörden av centrala gränsvärdessatsen; känna till regressionsmetodik för anpassning av mätdata; ha utvecklat en intuitiv förståelse för slump, slumpmässigt beteende och känna till hur man genererar slumptal och slump funktioner; förstå användning av punkt- och intervallskattningar för några typproblem; ha kännedom om några typiska ingenjörstillämpningar av sannolikhet och statistik, exempelvis tillförlitlighet och kvalitetsteknik.

Exempel: Belastningsdata Lastbils bakaxel Belastning, stormig hav

Exempel: Tidsjämförelser i system Jämförelser av olika tider: Kompileringstider? Överföringstider? Beräkningstider? Väntetider? ABC 80. Den första svensk- tillverkade persondatorn

Två datamaterial: Föreligger någon skillnad? Konfidensintervall

Exempel: Paketförluster Buffertöverflöden. Router C: Sannolikhet 0,04 Router D: Sannolikhet 0,02 Router E: Sannolikhet 0,02 Router F: Sannolikhet 0,01 Problem: Beräkna sannolikheten att någon av de fyra routrarna är drabbad av bufferöverflöde vid ett slumpvis valt tillfälle. Beräkna sannolikheten att ett paket kan komma från A till B över någon av de två vägarna. (Sannolikheter, händelser m.m. )

Exempel: klimatdata Mätningar av nederbörd vid Maiquetia flygplats, Venezuela. Vad är ”normalt”?

Regnmängder: vad är ”normalt”? 1951-1998

Histogram, regnmängder 1951-1998

Regnmängder 1951-1999

Histogram, regnmängder 1951-1999

gapminder.org

Behov att beskriva datamaterial LÄGESMÅTT : Hur preciserar vi ”medelvärdet” i en datamängd? SPRIDNINGSMÅTT : Hur stor är spridningen kring medelvärdet? BEROENDEMÅTT : Om vi studerar flera storheter som varierar slumpmässigt, vad kan sägas om deras (eventuella) samvariation?

OBSERVATIONER? KVANTITATIVA: Numeriska observationer. Mätbara, uttryckt i någon form av mått. Observationer kan jämföras med varandra. KVALITATIVA: I stället för siffror används ord eller annan ickenumerisk beskrivning. Kan i vissa fall omvandlas till kvantitativa för statistisk analys.

Analys av data för ingenjörer DESIGN : Fastslå/beräkna värden i diverse normer och tabeller. MODELLERING I ALLMÄNHET: Ta hand om variation/mätfel (natur, teknik) RISKHANTERING : Beräkna sannolikheter för oönskade händelser (risker) BESLUTSFATTANDE : Förändring gjorts. Uttala sig på ett statistiskt sunt sätt om det verkligen skett en förändring.

Kursens struktur: SANNOLIKHETSLÄRA: Begreppet sannolikhet. Förfinade matematiska verktyg för att beskriva spridnings-, läges- och beroendemått samt allmänna metoder att beräkna sannolikheter. STATISTIK (INFERENS) : Dra slutsatser om en större population, baserat på ett antal observationer därur.

Beskrivande statistik

Beskrivande statistik Några begrepp: Lägesmått: Medelvärde, median Spridningsmått: Standardavvikelse, varians, variationsbredd Grafiska hjälpmedel: Histogram (kontinuerliga data klassindelas) Lådagram (box plot ) Spridningsdiagram (scatterplot )

Tidigt exempel: Florence Nightingale Florence Nightingale, en pionjär på många sätt. Analys gjord efter Krimkriget, 1854 - 56

Nightingales analys

Exempel på LÄGESMÅTT Syfte: sammanfatta tyngdpunkten av data i ett numeriskt värde. Medelvärde (stickprovsmedelvärde) Median Typvärde

BERÄKNING av lägesmått

SPRIDNINGSMÅTT Syfte: Sammanfatta spridningen hos data. Variationsbredd Kvartilavstånd Standardavvikelse och varians

BERÄKNING av standardavvikelse

Standardavvikelse Lägg märke till att standardavvikelsen … alltid är ickenegativ är relaterad till aritmetiska medelvärdet har samma enhet som de betraktade observationerna

HISTOGRAM (försäljn. Bromma)

SPRIDNINGSDIAGRAM, pris & boyta Samvariation. 33 radhus i Bromma. Ju större boyta, desto högre pris!

Lådagram (boxplot) Lådagrammets upphovsman: John W TUKEY (1915 - 2000) Presenterades i boken Exploratory Data Analysis (1977)

Försäljningar, Bromma ”Lådan” visar kvartiler (25%, 75%) och median (50%). Lägg märke till ”morrhår” och extrema värden (”out- liers”)

Grundbegrepp: