Presentation laddar. Vänta.

Presentation laddar. Vänta.

Föreläsning 1-3 Introduktion till kursen Beskrivande statistik.

Liknande presentationer


En presentation över ämnet: "Föreläsning 1-3 Introduktion till kursen Beskrivande statistik."— Presentationens avskrift:

1 Föreläsning 1-3 Introduktion till kursen Beskrivande statistik

2 Agenda Introduktion till kursen Introduktion till statistik Introduktion till beskrivande statistik

3 Introduktion till kursen

4 Kursens upplägg Tre moduler – Modul 1 – Statistikens grunder och sannolikhetslära – Modul 2 – Statistisk inferens – Modul 3 – Statistiska verktyg 20 föreläsningar 12 lektioner 6 datorövningar 6 matematiklektioner

5 Kursens upplägg Två projektarbeten – Analys av sekundärdata – Insamling och analys av primärdata – Muntlig och skriftlig presentation Två duggor – Möjlighet för bonuspoäng till tentamen Skriftlig salstentamen

6 Examinerande moment Skriftlig salstentamen (9.5 hp) Projektarbeten (7.5 hp) Skriftlig matematiktentamen (3 hp)

7 Betyg Kursen totalt är värd 20 hp med betygen VG/G/U. För betyget Godkänd krävs: – G på tentamen – G på båda projektarbeten – G på matematiktentamen För betyget Väl godkänd krävs: – G-kraven men VG på tentamen

8 Kurslitteratur Statistics for Business and Economics, Newbold, Carlson & Thorne, 8th edition, ISBN: – Var noga med att ni får med en nyckel till MyMathLab Matematik inför högskolan, Wallin, Lithner, Jacobsson & Wiklund, ISBN: Föreläsningsunderlag via LISAM

9 LISAM Portal för väldigt mycket, t.ex. er mail och kurser Kursrummet för 732G30 innehåller: – Föreläsningsunderlag – Information om projektarbeten – Datorövningar – Kontinuerlig information Det är väldigt viktigt att hålla kontinuerlig koll på kursrummet!

10 Studiedisciplin Följ med i undervisningsplanen på LISAM ”Learning by doing” – J. Dewey Ställ frågor!!! Tänk på att universitetsstudier är ett heltidsarbete, 40 timmar i veckan! Egen studietid påverkar starkt resultatet på en universitetskurs!

11 Introduktion till statistik

12 Vad är statistik? ”Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information” – Wikipedia ”[Statistik är] vetenskapen om hur data med inslag av slumpmässig variation eller osäkerhet skall insamlas, utvärderas och presenteras” – Nationalencyklopedin ”Statistik – vetenskapen om metoder för insamling, bearbetning, redovisning och analys av data” – SAO

13 Arbetsmarknad Befolkning Boende Byggande Demokrati Energiproduktion Finansmarknad Livsmedelsförsäljning Hälso- och sjukvård e-handel Jord- och skogsbruk Fiske Samhällets kulturutgifter Levnadsförhållanden Miljöräkenskaper Materialflöden BNP Konsumtion Omsättning Investeringar Skatter Statsskuld Prisindex Rättsväsende Utbildning Kriminalvård Priser Inköpsvanor Börskurser

14 Statistikens delar Insamling av data – Primärdata Visualisering av data – Tabeller och diagram Presentation av data – Beskrivande mått Analys av data – Anpassning av modeller för beskrivande eller predikterande ändamål

15 Beskrivande statistik Kapitel 1

16 Population

17 Stickprov

18 Ändliga och oändliga populationer

19 Dragning av stickprov Målet är att få ett representativt stickprov – Slumpen! Obundet Slumpmässigt Urval (OSU) – Simple Random Sampling Systematiskt urval – Systematic Sampling

20 Parameter och statistika Mätvärde i en population kallas parameter – Sanningen! Mätvärde i ett stickprov kallas statistika – Skattning av sanningen – Osäkerhet finns på grund av slumpen Statistisk inferens är metoder för att dra slutsatser om sanningen från en skattning

21 Variabler Resultatet av upprepade observationer av ett specifikt mätvärde – Ex. ålder av individer i klassen Kvalitativa variabler – Kategorier eller grupper – Mäts ej numeriskt – Ex. nationalitet, grupptillhörighet

22 Variabler Kvantitativa variabler – Mäts numeriskt – Diskreta variabler Antar heltalsvärden Ex. antal syskon – Kontinuerliga variabler Kan mätas med decimalers noggrannhet Ex. löptid på 100 meter

23 Variabler

24 Variabelskalor Fyra olika skalor – Nominal Kategorier som inte går att rangordna Ex. nationalitet – Ordinal Kategorier som går att rangordna Ex. medaljvalör vid OS

25 Variabelskalor – Intervall Numeriska variabler där differens kan beräknas Arbiträr nollpunkt Ex. temperatur – Kvot Numeriska variabler där differens och kvoter kan beräknas Naturlig nollpunkt Ex. ålder

26 Variabelskalor Viktigt att man tar sig tid att undersöka variabeln det första man gör Resterande analys påverkas av både variabelskala och typ.

27 Kort om visualisering Olika sätt att visualisera fördelningar av variabler beroende på typ och skala Kvalitativa variabler – Stapeldiagram baserat på en frekvenstabell – Bokens Pareto-diagram är sorterade stapeldiagram

28 Kort om visualisering Kvantitativa variabler – Histogram – Prickdiagram – Spridningsdiagram (två kvantitativa) Mer om denna del av statistiken kommer i kursen Visuell Dataanalys senare i höst

29 Beskrivande mått Kapitel 2

30 Beskrivande mått i en ändlig population Lägesmått – Beskriver positionen (läget) av variabelns fördelning – Medelvärde – Median och percentiler Spridningsmått – Beskriver hur stor spridning observationerna har i genomsnitt – Varians och standardavvikelse – Kvartilavstånd

31 Medelvärde

32 Median

33

34 Skevhet (skewness)

35 Percentiler och kvartiler Relativ position i ett ordnat datamaterial Exempel på tolkning: Den 10:e percentilen är större än ca 10 procent av data och mindre än ca 90 procent av data. 25 percentilen är den första kvartilen (Q1) 50 percentilen är den andra kvartilen även kallad medianen 75 percentilen är den tredje kvartilen (Q3)

36 Percentiler och kvartiler

37

38 Varians

39 Standardavvikelse

40 Ett mått på det genomsnittliga avståndet från medelvärdet

41 Kvartilavstånd

42 Lådagram Visualisering som visar spridningen av ett datamaterial

43 Lådagram Max Q3 Median Q1 Min

44 Viktade medelvärden

45 Viktade standardavvikelser

46 Viktade medelvärden Bolag ABolag B BefattningAntal personerMedellön (tkr)Antal personerMedellön (tkr) Mellanchef/chef Tjänstemän Administrativ personal

47 Standardvägning (finns ej i boken) Bolag ABolag B BefattningAntal personerMedellön (tkr)Antal personerMedellön (tkr) Mellanchef/chef Tjänstemän Administrativ personal

48 Standardvägning Hur skulle medellönen se ut om andelen som jobbar i de olika befattningarna är densamma i de två företagen? Beräkna viktade medelvärden men frekvenserna för båda grupperna ska vara en standardpopulation Standardpopulationen betecknas ofta som totala antalet inom varje undergrupp

49 Standardvägning

50 Kovarians och korrelation Spridningsdiagram visualiserar sambandet mellan två kontinuerliga variabler Numeriska mått: – Kovarians: Mäter riktningen på ett linjärt samband – Korrelation: Mäter styrkan (och riktning) på ett linjärt samband

51 Kovarians

52 Mer generell formel kommer senare i kursen

53 Korrelation

54

55 Exempel SäljareMånadslönÅlder

56 Exempel

57

58 Projektarbete 1

59 Sekundärdata Sekundärdata innebär analys av ett datamaterial som insamlats för ett annat ändamål Målen med projektet är: – Bestäm en frågeställning som ska besvaras – Hitta relevant data kopplad till denna frågeställning – Analysera data med beskrivande statistik – Skriftligt presentation – Muntlig presentation och diskussion av en annan grupps arbete

60 Tidsplan V36 – Lämplig frågeställning V36-41 – Självständigt arbete V41 – Inlämning av rapport – Förberedelser av presentationer V42 – Seminarium

61 Opponering Opponenterna presenterar sin respondentgrupps arbete baserat på den rapport som lämnas in Ställer krav på rapportskrivandet – Tydlighet – Förklarande – Ha klassen som målgrupp


Ladda ner ppt "Föreläsning 1-3 Introduktion till kursen Beskrivande statistik."

Liknande presentationer


Google-annonser