Tilastollinen virheenarviointi

Mittausvirheet voidaan jakaa kahteen tyyppiin:

Tyyppi A: virheet, jotka johtuvat satunnaisista tekijöistä
Tyyppi B: virheet, jotka vaikuttavat määrättyyn suuntaan (esim. mittarin kalibrointivirheet)

virhelajit

Satunnaisvirheen vaikutus tulokseen voidaan eliminoida toistamalla mittausta, jolloin mittaustulosten keskiarvo lähestyy suureen todellista arvoa. Systemaattisen virheen vaikutusta ei voi eliminoida toistolla.

Otannalla saadun tuloksen virhemarginaali

Otantavirheet

Otantavirhe

Otantavirhe on otosten poiminnan satunnaisuudesta aiheutuva virhelähde.

Esimerkki otantavirheistä

Oletetaan, että miespuolisten varusmiesten pituus noudattaa Gaussin normaalijakaumaa, jonka keskiarvo on 180 cm ja keskihajonta 8 cm.

Tutkittaessa varusmiesten pituuksia käyttämällä 25 henkilön otoksia, otosten pituusjakaumat poikkeavat toisistaan johtuen otantavirheestä.
Kuvassa on kolmen otoksen jakaumat.

otantavirhe

Huolimatta eroavaisuuksista, otoskeskiarvot 180.3 cm, 180.7 cm ja 181.3 cm ovat lähellä toisiaan.

Voidaan todistaa, että kun otoskokoa kasvatetaan, otoskeskiarvo lähestyy populaatiokeskiarvoa (tässä esimerkissä siis 180 cm).

Lisäksi otoskeskiarvot ovat normaalisti jakautuneet.

Otoskeskiarvojen keskihajonta on \(\frac{s}{\sqrt{n}}\) ,missä s on populaation keskihajonta ja n on otoskoko.

Otoskokoa (= mittauksen toistojen lukumäärää) kasvattamalla saadaan otantavirhe pienentymään halutulle tasolle.

otosvirhe

Mittaussarjan keskiarvon keskivirhe

Otoskeskiarvon keskivirhe

Olkoon X tilastomuuttuja, jonka arvoista otetaan n:n kappaleen otos.Tällöin

  1. Paras arvio muuttujan X keskiarvoksi on otoskeskiarvo

  2. Otoskeskiarvojen keskihajonta eli keskivirhe on \(\frac{s}{\sqrt{n}}\), missä n on otoskoko ja s on muuttujan X keskihajonta
    (jos X:n keskihajonta ei tunneta, käytetään otoksen keskihajontaa)

  3. Muuttujan X keskiarvon virhemarginaali riippuu vaaditusta luottamustasosta, joka määritellään todennäköisyytenä, että oikea keskiarvo on virhemarginaalin sisäpuolella.

X:n virhemarginaali \(\Delta X = t \frac{s}{\sqrt{n}}\) , missä t = otoskoosta ja luottamustasosta riippuva kattavuuskerroin

Suurilla otoskoon arvoilla ( n > 50) 95% luottamustasoa vastaa t = 1.96, ja
99% luottamustasoa vastaa t = 2.58 (perustuvat normaalijakauman kertymäfunktioon)

Merkitsevyystaso. Luottamustason sijasta esim. Excel-funktioissa käyttää sen komplementtia, jota sanotaan merkitsevyystasoksi.
Ts. 95% luottamustaso vastaa 5% merkitsevyystasoa, 99% luottamustasoa vastaa 1% merkitsevyystaso

Numeerisen muuttujan mittaussarjan virhemarginaali

\(\Delta X = t \frac{s}{\sqrt{n}}\) , missä t = kattavuuskerroin, s = populaatiokeskihajonta (tai otoskeskihajonta, jos em. ei tiedossa), n = otoskoko

Kattavuuskerroin t riippuu otoskoosta ja luottamustasosta (yleensä joko 95% tai 99%).
Ilman laskinta tai Exceliä kattavuuskertoimet eri otoskoille löytyvät taulukkokirjoista tai netistä. Alla taulukko kattavuuskertoimista eri suuruisille otoksille.

Kattavuuskertoimia t tavallisimmille merkitsevyystasoille, n - 1 = otoskoko - 1

ttaulu

Taulukon sijasta virhemarginaali voidaan laskea Excel- funktiolla LUOTTAMUSVÄLI.T.

Excel -funktio LUOTTAMUSVÄLI.T (engl. CONFIDENCE.T)

Pienillä otoksilla (n < 50) otoskeskiarvojen jakauma noudattaa ns. Studentin T -jakaumaa, joka lähestyy suuremmilla otoksilla normaalijakaumaa.

Excel -funktio LUOTTAMUSVÄLI.T(merkitsevyystaso; keskihajonta; otoskoko) laskee virhemarginaalin otoksesta saadulle muuttujan X keskiarvolle käyttäen kaavaa \(\Delta X = t \frac{s}{\sqrt{n}}\).

Suhteellisen osuuden luottamusväli

Gallup - tutkimuksissa tutkittava muuttujana on jonkin ehdokkaan tai ajatuksen kannatusprosentti, ts. suhteellinen osuus. Otoskoot Gallup tutkimuksissa ovat suuria, yleensä 500 - 2500. Satunnaistettujen otosten tulokset noudattavat ns. binomijakaumaa.

Suhteellisen osuuden virhemarginaali riippuu otoskoosta n ja ehdokkaan kannatuksesta p seuraavasti:

Suhteellisen osuuden virhemarginaali

\(\Delta p = t \sqrt\frac{p(1-p)}{n}\)

n = otoskoko, p = kannatusprosentti desimaalilukuna (esim. 0.35 vastaa 35% kannatusta), kattavuuskerroin t = 1.96 (95% luottamustaso) tai t = 2.34 (99% luottamustasolla)

Jos asetetaan Gallup- tutkimukselle etukäteen vaatimus tietystä virhemarginaalista, voidaan tarvittava otoskoko n ratkaista em. yhtälöstä seuraavassa muodossa:

Otoskoon määrittäminen, kun virhemarginaali on annettu

Otoskoko \(n=\frac{p(1-p)t^2}{\Delta p^2}\)

p = kannatusprosentti desimaalilukuna, t = kattavuuskerroin, \(\Delta p\) = virhemarginaali

Huom! Otoskoko riippuu kannatusprosentista siten, että suurin otoskoko tarvitaan n. 50 % kannatusta mitattaessa tiettyyn virhemarginaaliin pääsemiseksi.

Ratkaistuja esimerkkejä