1. Kontinuerliga variabler Om variabeln är kontinuerlig är P(X=x)=0. Om variabeln är kontinuerlig beräknar vi sannolikheter för intervall. Dessa sannolikheter beräknas som ytor under en funktion f(x) som kallas för täthetsfunktionen.
Observera att Observera också att
2. Normalfördelningen Täthetsfunktionen: Väntevärdet: E(X) = m Variansen: V(X) = s2 Kodbeteckning: X ~ N(m, s)
För en normalfördelning gäller följande: Ungefär 68% av ytan under kurvan ligger inom en standardavvikelse från medelvärdet. Ungefär 95% av ytan under kurvan ligger inom två standardavvikelser från medelvärdet. Ungefär 99,7% av ytan under kurvan ligger inom tre standardavvikelser från medelvärdet.
Exempel: Antag att intelligensen i en population, mätt med ett visst intelligenstest, kan beskrivas av en normalfördelning med medelvärdet 100 och standardavvikelsen 15. Då vet vi att ungefär 68% av populationen ligger mellan 85 och 115, ungefär 95 % av populationen mellan 70 och 130 och ungefär 99,7 % av populationen mellan 55 och 145
3. Standardnormalfördelningen Som vi ser finns det ett oändligt antal normalfördelningar. För varje val av m (medelvärde) och s (standardavvikelse) ges en ny normalfördelning. Om variabeln X är normalfördelad så gäller att variabeln Z=(X-m)/s är standardnormalfördelad. Detta innebär att Z är normalfördelad med medelvärdet 0 och standardavvikelsen 1. För standardnormalfördelningen finns tabeller med beräknade areor.
Exempel Antag att fördelningen av variabeln längd (X) i en population kan beskrivas av en normalfördelning med medelvärdet 178 cm och standardavvikelsen 6. Detta innebär att ungefär 68% ligger mellan 172 cm och 184 cm, ungefär 95% mellan 166 cm och 190 cm och ungefär 99,7% mellan 160 cm och 196 cm.
Lägg märke till att värdena 184, 190 och 196 på variabeln X motsvaras av värdena 1, 2 och 3 på variabeln Z. Observera att Z-värdena anger antalet standardavvikelser från medelvärdet. X-värdet 184 är ju en standardavvikelse över medelvärdet, 190 är två standardavvikelser över medelvärdet, osv.