16. Normalfördelning

Anna, Bertil, Cecilia och Daniel märkte att då de gjorde sitt statistikarbete om kurskamraternas längd blev grafen med intervallen 10 cm formad så att största antalet var mellan 160 och 179 cm. De flesta personers längd var alltså nära medeltalet.

De blir ivriga och skickar ut en länk via sociala medier till sina vänner och släktingar där de frågar efter personens kön och längd. När de klassindelar datan i klasser om 5 cm ser det ut som följande:

Längd Män Kvinnor Totalt
150-154 0 2 2
155-159 1 8 9
160-164 4 13 17
165-169 8 20 28
170-174 16 14 30
175-179 20 7 27
180-184 17 5 22
185-189 10 1 11
190-194 2 0 2

Vi märker att vi har tre toppar, en för män (blå), en för kvinnor (gul) och toppen för det gemensamma (grönt). Sedan avtar längderna mot kortare och längre. Fenomenet med att största delen av materialet har värden som är vid medeltalet och sedan avtar det kallas för normalfördelning.

Det att vi kan tillämpa normalfördelning på tex längd på människor, svansarnas längd på råttor och hur länge en mobiltelefon håller förrän den får något tekniskt fel hjälper oss att förutspå statistiska händelser.

Medeltalet för männens längd blir 177 cm, kvinnorna 168 cm och totalt 173 cm. Standardavvikelsen blir 7,5 cm, 7,7 cm och 8,8 cm (som vi avrundar till 9 cm).

Vi tittar närmare på normalfördelningen för den totala längden. Eftersom vi går till att tala om en hel population talar vi inte om medelvärdet utan väntevärdet 173 cm. Inom den första standarden har vi 34,1 % + 34,1 % = 68,2 % av populationen och deras längd varierar 173 – 9 cm = 164 cm och 173 + 9 = 182 cm.

Inom två standarder har vi 13,6 % + 34,1 % + 34,1 % + 13,6 % = 95,4 %. Längdintervallet blir 155 cm till 191 cm.

För att lättare kunna räkna exakta andelar av en population som rör sig inom vissa gränser arbetar man med normalfördelningens fördelningsfunktion, \(\phi (x)=\frac{1}{\sqrt{2\pi}} \displaystyle \int_{-\infty}^x e^{-\frac{t^2}{2}} \textrm{d }t\). För att få värden som normalfördelningen ger oss använder vi oss av tabellen på sid 61 i MAOL eller tabellen här.

För mera teori om Normalfördelningen se här.

Det som det betyder är att för att få exakta värden måste vi först standardisera vårt material förrän vi kan räkna med det.

Exempel 1 Då vi utgår från materialet som Anna, Bertil, Cecilia och Daniel gjorde.

  1. Hur många procent av populationen är kortare än 180 cm?
  2. Hur många procent av populationen är längre än 170 cm?
  3. Hur många procent är populationen är mellan 175 cm och 185 cm?

Exempel 2 Längden för svansarna hos en apstam är normalfördelade. Väntevärdet är 25 cm och standardavvikelsen är 4 cm.

  1. Hur stor del av stammen har svansar som är kortare än 31 cm?
  2. Hur stor del av stammen har svansar som är längre än 30 cm?
  3. Hur stor del av stammen har svansar som är mellan 23 cm och 28 cm?

Lösning

  1. Eftersom längden för svansarna följer normalfördelningen betecknar vi N(25,6). Vi får \(P(X \leq 31 ) = P(Z < \frac{31-25}{6})=\Phi(1) = 0,8413\).
    84,1 % av apstammen har svansar som är kortare än 31 cm.
  2. Nu söker vi \(P(X \geq 30) = 1- P(X < 30) = 1 – P(Z < \frac{30-25}{6}) \\ = 1-\Phi(0,833\ldots) = 1 – 0,7967 = 0,2033\) .
    20,3 % av apstammen har svansar som är längre än 30 cm.
  3. Här igen är vi intresserade av \(P(23 \leq X \leq 28) = P (\frac{23-25}{6} \leq Z \leq \frac{28-25}{6} )= \Phi(0,5) -\Phi(-0,33\ldots) \\ = \Phi(0,5) -(1-\Phi(0,33\ldots)) = 0,6915-(1-0,6293) \\ = 0,6915 – 0,3707 = 0,3208\).
    Alltså 32,1 % av aporna har en svans som är mellan 23 och 28 cm.

Exempel 3 Garantin hos en surfplatta är 12 månader. Hur stor del av surfplattorna måste tillverkaren reparera på garanti då väntevärdet för att en surfplatta håller är 14 månader och standardavvikelsen är 1 månad?

Lösning

Det att en surfplatta går sönder är normalfördelat, N(14,1).

Det vi söker är \(P(X \leq 12) = P(Z \leq \frac{12-14}{1} )= \Phi(-2) = 1-\Phi(2) = 1-0,9772 = 0,0228\).

2,3 % av surfplattorna behöver service under garantin.

Exempel 4 Hur stor borde standardavvikelsen vara för att en mobiltelefontillverkare endast skall behöva reparera högst 5 % av mobiltelefonerna på garanti då väntevärdet för att telefonen håller är 16 månader och garantin är 12 månader.

Lösning

Hållbarheten hos mobiltelefonen är normalfördelat, N(16,\(\sigma\). 5 % betyder att normalfördelningen skall ha värdet 1,65. Det som vi nu söker är \(P(X \leq 12) = P(Z \leq \frac{16-12}{\sigma} ) = 1,6449\). Vi löser ekvationen.

\(\begin{array}{rcl} \frac{16-12}{\sigma} & = & 1,6449 \\ \sigma & = & \frac{16-12}{1,6449} = 2,43 \\ \end{array}\)

Standardavvikelsen skall var 2,4 månader.

För då vi räknar med normalfördelning använder vi oss av följande formler

  • \(\Phi(-a) = 1-\Phi(a)\)
  • \(P(X\leq 1,23) =\Phi(1,23) = 0,8907\)
  • \(P(0,10 \leq X \leq 0,75) = \Phi(0,75) – \Phi(0,10)\)
  • \(P(X \geq 1,57) = 1- P(X\leq 1,57)\)

För att använda oss av färdiga värden från tabeller gäller vid normeringen av \(N(\mu,\sigma)\) att \(P(X\leq a) = P(Z \leq \frac{a-\mu}{\sigma})\).

Uppgifter

  1. Längden för gurkor som säljs i affärer är normalfördelade. Väntevärdet är 33 cm och standardavvikelsen är 3 cm.
    1. Hur många procent av gurkorna är kortare än 35 cm?

    2. Hur många procent av gurkorna är längre än 40 cm?
    3. Hur många procent av gurkorna är mellan 30 cm och 38 cm?
  2. Längden hos befolkningar är normalfördelade. För finska män gäller att väntevärdet för en fullvuxen är 181 cm. Standardavvikelsen är 6,0 cm.
    1. Hur många procent av fullvuxna finska män är kortare än 178 cm?
    2. Hur många procent av fullvuxna finska män är längre än 175 cm?
    3. Hur många procent av fullvuxna finska män är mellan 170 och 190 cm långa?
  3. Paket av grötflingor packas så att de i medeltal väger 308 g med standardavvikelsen 10 g. Hur många procent av paketen väger mindre än 300 g, som anges på paketet? Svara med en decimals noggrannheten.
  4. Garantitiden för ett bilmärke är 5 år. Hos bilarna uppstår fel med väntevärdet 70 månader och standardavvikelsen är 9 månader. Hos hur många procent av bilarna uppstår det fel under garantitiden?
  5. En däcktillverkare bestämmer sig för att medelhållbarheten för däcken skall vara 45 000 km och att 99,9 % av däcken skall hålla körsträckan 46 000 utan problem. Bestäm standardavvikelsen i km för att detta skall uppfyllas.
  6. *Vid en äppelodling sorteras äpplena enligt vikt. Vikten för äpplen kan ses normalfördelad med väntevärdet 60 g och standardavvikelsen 10 g. Man vill sortera äpplena i tre viktklasser, så att 25 % bedöms som små, 50 % som medelstora och 25 % som stora. Hur skall dessa gränser väljas med en grams noggrannhet?

  7. *Väntevärdet för att det skall uppstå problem hos en mobiltelefon är 14 månader med standardavvikelsen 2 månader. Hur lång garanti, i månader, kan tillverkaren lova om de endast vill reparera 10 % av mobiltelefonerna under garantitiden?