Tilastollisten hypoteesien testauskriteerit ja menetelmät, esimerkit

Sisällysluettelo:

Tilastollisten hypoteesien testauskriteerit ja menetelmät, esimerkit
Tilastollisten hypoteesien testauskriteerit ja menetelmät, esimerkit
Anonim

Hypoteesin testaus on välttämätön toimenpide tilastoissa. Hypoteesitesti arvioi kaksi toisensa poissulkevaa väitettä määrittääkseen, mikä väite on parhaiten tuettu näytetietojen perusteella. Kun löydön sanotaan olevan tilastollisesti merkitsevä, se johtuu hypoteesitestistä.

Varmistusmenetelmät

Tilastollisten hypoteesien testausmenetelmät ovat tilastollisen analyysin menetelmiä. Tyypillisesti verrataan kahta tilastojoukkoa tai otostietojoukkoa verrataan idealisoidun mallin synteettiseen tietojoukkoon. Tiedot on tulkittava siten, että ne lisäävät uusia merkityksiä. Voit tulkita niitä olettamalla lopputuloksen tietyn rakenteen ja käyttämällä tilastollisia menetelmiä oletuksen vahvistamiseksi tai hylkäämiseksi. Oletusta kutsutaan hypoteesiksi, ja tähän tarkoitukseen käytettyjä tilastollisia testejä kutsutaan tilastollisiksi hypoteeseiksi.

H0- ja H1-hypoteesit

On olemassa kaksi pääasiallistahypoteesien tilastollisen testauksen käsitteet - niin sanottu "pää- tai nollahypoteesi" ja "vaihtoehtoinen hypoteesi". Niitä kutsutaan myös Neyman-Pearsonin hypoteesiksi. Tilastollisen testin oletusta kutsutaan nollahypoteesiksi, päähypoteesiksi tai lyhyesti H0. Sitä kutsutaan usein oletusoletukseksi tai oletukseksi, että mikään ei ole muuttunut. Testin oletusrikkomuksesta käytetään usein nimitystä ensimmäinen hypoteesi, vaihtoehtoinen hypoteesi tai H1. H1 on lyhenne jollekin muulle hypoteesille, koska tiedämme siitä vain sen, että H0-tiedot voidaan hylätä.

nollahypoteesitesti
nollahypoteesitesti

Ennen kuin nollahypoteesi hylätään tai ei hylätä, testitulos on tulkittava. Vertailua pidetään tilastollisesti merkitsevänä, jos aineistojen välinen suhde ei todennäköisesti ole nollahypoteesin toteutus kynnystodennäköisyyden - merkitsevyystason - mukaan. Tilastollisten hypoteesien testaamiseen on olemassa myös sopivuuskriteerit. Tämä on hypoteesin testikriteerin nimi, joka liittyy tuntemattoman jakauman oletettuun lakiin. Tämä on numeerinen mitta empiirisen ja teoreettisen jakauman välisestä erosta.

Tilastollisten hypoteesien testausmenettely ja kriteerit

Yleisimmät hypoteesien valintamenetelmät perustuvat joko Akaiken tietokriteeriin tai Bayesin kertoimeen. Tilastollisten hypoteesien testaus on keskeinen tekniikka sekä päättelyssä että Bayesin päättelyssä, vaikka näillä kahdella tyypillä on huomattavia eroja. Tilastolliset hypoteesitestitMääritä menettely, joka hallitsee virheellisen oletus- tai nollahypoteesin virheellisen päätöksen todennäköisyyttä. Menettely perustuu siihen, kuinka todennäköisesti se toimii. Tämä väärän päätöksen tekemisen todennäköisyys on se epätodennäköisyys, että nollahypoteesi on totta ja että mitään erityistä vaihtoehtoista hypoteesia ei ole olemassa. Testi ei voi osoittaa, onko se totta vai tarua.

Tilastollisten hypoteesien testausmenetelmät
Tilastollisten hypoteesien testausmenetelmät

Vaihtoehtoiset päätösteorian menetelmät

On olemassa vaihtoehtoisia päätösteorian menetelmiä, joissa nolla- ja ensimmäinen hypoteesi ovat tasa-arvoisempia. Muut päätöksentekomenetelmät, kuten Bayesin teoria, yrittävät tasapainottaa huonojen päätösten seurauksia kaikissa mahdollisuuksissa sen sijaan, että keskittyisivät yhteen nollahypoteesiin. Useat muut lähestymistavat sen päättämiseksi, mikä hypoteeseista on oikea, perustuvat tietoihin, millä niistä on halutut ominaisuudet. Mutta hypoteesien testaus on hallitseva lähestymistapa tietojen analysointiin monilla tieteenaloilla.

Tilastollisen hypoteesin testaus

Aina kun yksi tulosjoukko eroaa toisesta, on turvauduttava tilastollisiin hypoteesitestauksiin tai tilastollisiin hypoteesitesteihin. Niiden tulkinta edellyttää p-arvojen ja kriittisten arvojen asianmukaista ymmärtämistä. Tärkeää on myös ymmärtää, että testeissä saattaa silti olla virheitä tärkeysasteesta riippumatta. Siksi johtopäätös ei ehkä ole oikea.

Testausprosessi koostuuuseita vaiheita:

  1. Alkuhypoteesia ollaan luomassa tutkimukselle.
  2. Relevantit nolla- ja vaihtoehtoiset hypoteesit on merkitty.
  3. Selittää tilastolliset oletukset testin otoksesta.
  4. Sopivan testin määrittäminen.
  5. Valitse merkitsevyystaso ja todennäköisyyskynnys, jonka alapuolella nollahypoteesi hylätään.
  6. Nollahypoteesitestin tilaston jakauma näyttää mahdolliset arvot, joilla nollahypoteesi hylätään.
  7. Laskenta käynnissä.
  8. Päätös hylätä tai hyväksyä nollahypoteesi vaihtoehdon puolesta.

On olemassa vaihtoehto, joka käyttää p-arvoa.

Esimerkkejä tilastollisten hypoteesien testaamisesta
Esimerkkejä tilastollisten hypoteesien testaamisesta

merkittävyystestit

Puhtasta tiedosta ei ole käytännön hyötyä ilman tulkintaa. Tilastoissa dataa koskevissa kysymyksissä ja tulosten tulkinnassa käytetään tilastollisia menetelmiä vastausten tarkkuuden tai todennäköisyyden varmistamiseksi. Tilastollisia hypoteeseja testattaessa tätä menetelmäluokkaa kutsutaan tilastolliseksi testaukseksi tai merkitsevyystesteiksi. Termi "hypoteesi" muistuttaa tieteellisiä menetelmiä, joissa tutkitaan hypoteeseja ja teorioita. Tilastoissa hypoteesitesti johtaa suureen annetulla oletuksella. Sen avulla voit tulkita, onko olettamus totta vai onko tapahtunut rikkomus.

Testien tilastollinen tulkinta

Hypoteesitestitkäytetään määrittämään, mitkä tutkimustulokset johtavat nollahypoteesin hylkäämiseen enn alta määrätyllä merkitsevyystasolla. Tilastollisen hypoteesitestin tulokset on tulkittava niin, että työskentelyä voidaan jatkaa. On olemassa kaksi yleistä tilastollisen hypoteesin testauskriteerin muotoa. Nämä ovat p-arvo ja kriittiset arvot. Saadut tulokset on tulkittava eri tavalla valitusta kriteeristä riippuen.

Mikä on p-arvo

Tuloste kuvataan tilastollisesti merkitseväksi p-arvoa tulkittaessa. Itse asiassa tämä indikaattori tarkoittaa virheen todennäköisyyttä, jos nollahypoteesi hylätään. Toisin sanoen sitä voidaan käyttää nimeämään arvo, jota voidaan käyttää tulkitsemaan tai kvantifioimaan testitulos, ja määrittämään virheen todennäköisyys nollahypoteesin hylkäämisessä. Voit esimerkiksi suorittaa normaalillisuustestin otokselle tiedoista ja huomata, että poikkeamien mahdollisuus on pieni. Nollahypoteesia ei kuitenkaan tarvitse hylätä. Tilastollinen hypoteesitesti voi palauttaa p-arvon. Tämä tehdään vertaamalla p:n arvoa enn alta määrättyyn kynnysarvoon, jota kutsutaan merkitsevyystasoksi.

Nollahypoteesien tilastollinen testaus
Nollahypoteesien tilastollinen testaus

merkittävyys

Merkitystaso kirjoitetaan usein kreikkalaisella pienellä kirjaimella "alfa". Alfalle käytetty yleinen arvo on 5 % tai 0,05. Pienempi alfa-arvo ehdottaa nollahypoteesin luotettavampaa tulkintaa. p-arvoa verrataanesivalittu alfa-arvo. Tulos on tilastollisesti merkitsevä, jos p-arvo on pienempi kuin alfa. Merkitystaso voidaan kääntää vähentämällä se yhdestä. Tämä tehdään hypoteesin luottamustason määrittämiseksi havaittujen näytetietojen perusteella. Käytettäessä tätä tilastollisten hypoteesien testausmenetelmää P-arvo on todennäköisyys. Tämä tarkoittaa, että tilastollisen testin tulosta tulkittaessa ei tiedetä, mikä on totta vai väärin.

Tilastollisen hypoteesin testauksen teoria

Nollahypoteesin hylkääminen tarkoittaa, että on tarpeeksi tilastollista näyttöä siitä, että se näyttää todennäköiseltä. Muuten se tarkoittaa, että tilastot eivät riitä sen hylkäämiseen. Tilastollisia testejä voidaan ajatella nollahypoteesin hylkäämisen ja hyväksymisen dikotomian kann alta. Nollahypoteesin tilastollisen testauksen vaarana on, että jos se hyväksytään, se voi näyttää olevan totta. Sen sijaan olisi oikeampaa sanoa, että nollahypoteesia ei hylätä, koska sen hylkäämiseen ei ole tarpeeksi tilastollista näyttöä.

Tilastollinen hypoteesi, joka testaa sopivuuskriteerien hyvyyttä
Tilastollinen hypoteesi, joka testaa sopivuuskriteerien hyvyyttä

Tämä hetki hämmentää usein noviisi extrat. Tällaisessa tapauksessa on tärkeää muistuttaa itseäsi siitä, että tulos on todennäköisyys ja että jopa nollahypoteesin hyväksymisessä on pieni mahdollisuus virheeseen.

Tosi tai väärä nollahypoteesi

P:n arvon tulkinta ei tarkoita nollaahypoteesi on totta vai tarua. Tämä tarkoittaa, että empiiristen tietojen ja valitun tilastollisen testin perusteella on tehty valinta hylätä vai olla hylkäämättä nollahypoteesi tietyllä tilastollisen merkitsevyyden tasolla. Siksi p-arvoa voidaan pitää tilastollisiin testeihin upotetun enn alta määrätyn oletuksen perusteella annettujen tietojen todennäköisyytenä. P-arvo on mitta siitä, kuinka todennäköisesti dataotos havaitaan, jos nollahypoteesi on totta.

Kriittisten arvojen tulkinta

Jotkin testit eivät palauta p. Sen sijaan ne voivat palauttaa kriittisten arvojen luettelon. Tällaisen tutkimuksen tuloksia tulkitaan samalla tavalla. Sen sijaan, että verrattaisiin yhtä p-arvoa enn alta määrättyyn merkitsevyystasoon, testitilastoa verrataan kriittiseen arvoon. Jos se osoittautuu pienemmäksi, se tarkoittaa, että nollahypoteesia ei voitu hylätä. Jos suurempi tai yhtä suuri kuin, nollahypoteesi tulee hylätä. Tilastollisen hypoteesin testausalgoritmin merkitys ja sen tuloksen tulkinta on samanlainen kuin p-arvo. Valittu merkitsevyystaso on todennäköisyyspohjainen päätös hylätä tai olla hylkäämättä perustestin oletus tietojen perusteella.

Virheet tilastotesteissä

Tilastollisen hypoteesitestin tulkinta on todennäköisyyspohjainen. Tilastollisten hypoteesien testauksen tehtävänä ei ole löytää oikeaa tai väärää väitettä. Testin todisteet voivat olla virheellisiä. Jos alfa oli esimerkiksi 5 %, tämä tarkoittaa, että suurimmaksi osaksi 1/20nollahypoteesi hylätään vahingossa. Tai se ei tapahdu tietonäytteen tilastollisen kohinan vuoksi. Tässä pisteessä pieni p-arvo, jolla nollahypoteesi hylätään, voi tarkoittaa, että se on väärä tai että on tehty virhe. Jos tällainen virhe tehdään, tulosta kutsutaan vääräksi positiiviseksi. Ja tällainen virhe on ensimmäisen tyyppinen virhe tilastollisia hypoteeseja testattaessa. Toisa alta, jos p-arvo on tarpeeksi suuri merkitsemään nollahypoteesin hylkäämistä, se voi tarkoittaa, että se on totta. Tai ei ole oikein, ja tapahtui jokin epätodennäköinen tapahtuma, jonka vuoksi virhe tapahtui. Tämän tyyppistä virhettä kutsutaan vääräksi negatiiviseksi.

Nollahypoteesien tilastollinen testaus
Nollahypoteesien tilastollinen testaus

Virheiden todennäköisyys

Tilastollisia hypoteeseja testattaessa on silti mahdollisuus tehdä tämäntyyppisiä virheitä. Väärät tiedot tai väärät johtopäätökset ovat melko todennäköisiä. Ihannetapauksessa tulisi valita sellainen merkitsevyystaso, joka minimoi jonkin näistä virheistä todennäköisyyden. Esimerkiksi nollahypoteesien tilastollisella testauksella voi olla hyvin alhainen merkitys. Vaikka merkitsevyystasot, kuten 0,05 ja 0,01, ovat yleisiä monilla tieteenaloilla, yleisimmin käytetty merkitsevyystaso on 310^-7 eli 0,0000003. Sitä kutsutaan usein "5-sigmaksi". Tämä tarkoittaa, että johtopäätös oli satunnainen todennäköisyydellä 1/3,5 miljoonaa itsenäistä kokeiden toistoa. Esimerkit tilastollisten hypoteesien testaamisesta sisältävät usein tällaisia virheitä. Tämä on myös syy, miksi on tärkeää saada riippumattomia tuloksia.vahvistus.

Esimerkkejä tilastollisen vahvistuksen käytöstä

Käytännössä on useita yleisiä esimerkkejä hypoteesien testaamisesta. Yksi suosituimmista tunnetaan nimellä "Tea Tasting". Tohtori Muriel Bristol, biometriikan perustajan Robert Fisherin kollega, väitti voivansa kertoa varmasti, lisättiinkö se ensin teekuppiin vai maitoon. Fisher tarjoutui antamaan hänelle kahdeksan kuppia (neljä kutakin lajiketta) satunnaisesti. Testitilasto oli yksinkertainen: kupin valinnassa onnistuneiden laskeminen. Kriittinen alue oli ainoa menestys neljästä, mahdollisesti tavanomaisen todennäköisyyskriteerin perusteella (< 5 %; 1:70 ≈ 1,4 %). Fisher väitti, että vaihtoehtoista hypoteesia ei tarvita. Nainen tunnisti oikein jokaisen kupin, jota pidettiin tilastollisesti merkitsevänä tuloksena. Tämä kokemus johti Fisherin kirjaan Statistical Methods for Researchers.

Vastaajan esimerkki

Tilastollinen oikeudenkäyntimenettely on verrattavissa rikostuomioistuimeen, jossa vastaajaa pidetään syyttömänä, kunnes hänen syyllisyytensä on todistettu. Syyttäjä yrittää todistaa syytetyn syyllisyyden. Vastaaja voidaan todeta syylliseksi vain, jos syytteeseen on riittävästi näyttöä. Menettelyn alussa on olemassa kaksi hypoteesia: "Syytetty ei ole syyllinen" ja "Syytetty on syyllinen". Syyttömyyden hypoteesi voidaan hylätä vain silloin, kun virhe on erittäin epätodennäköinen, koska syytöntä ei haluta tuomita. Tällaista virhettä kutsutaan tyypin I virheeksi ja sen esiintymisestäharvoin hallinnassa. Tämän epäsymmetrisen käytöksen seurauksena tyypin II virhe, eli tekijän vapauttaminen, on yleisempää.

Tilastollisen validoinnin esimerkkejä
Tilastollisen validoinnin esimerkkejä

Tilastot ovat hyödyllisiä analysoitaessa suuria tietomääriä. Tämä pätee myös hypoteesien testaamiseen, jotka voivat perustella johtopäätökset, vaikka tieteellistä teoriaa ei olisikaan. Teen maistelua koskevassa esimerkissä oli "ilmeistä", että ei ollut eroa kaataako maitoa teehen vai kaataako teetä maitoon.

Hypoteesitestauksen todellinen käytännön sovellus sisältää:

  • testaa, näkevätkö miehet enemmän painajaisia kuin naiset;
  • asiakirjan nimeäminen;
  • Täyden kuun vaikutuksen arviointi käyttäytymiseen;
  • määrittää alueen, jolla lepakko voi havaita hyönteisen kaiun avulla;
  • parhaan tavan valitseminen tupakoinnin lopettamiseen;
  • Tarkistamme, heijastavatko puskuritarrat auton omistajan käyttäytymistä.

Tilastollisten hypoteesien testaamalla on tärkeä rooli tilastoissa yleensä ja tilastollisten päätelmien tekemisessä. Arvotestausta käytetään korvaamaan perinteinen ennustetun arvon ja kokeellisen tuloksen vertailu tieteellisen menetelmän ytimessä. Kun teoria pystyy ennustamaan vain suhteen etumerkkiä, voidaan suunnatut hypoteesitestit konfiguroida siten, että vain tilastollisesti merkitsevä tulos tukee teoriaa. Tämä arviointiteorian muoto on jäykinkritiikki hypoteesitestauksen käytöstä.

Suositeltava: