Pearson-jakelu: määritelmä, sovellus

Sisällysluettelo:

Pearson-jakelu: määritelmä, sovellus
Pearson-jakelu: määritelmä, sovellus
Anonim

Mikä on Pearsonin jakelulaki? Vastaus tähän laajaan kysymykseen ei voi olla yksinkertainen ja ytimekäs. Pearson-järjestelmä suunniteltiin alun perin mallintamaan näkyviä vääristyneitä havaintoja. Tuolloin tiedettiin hyvin, kuinka teoreettinen malli viritetään vastaamaan havaitun tiedon kahta ensimmäistä kumulanttia tai momenttia: mitä tahansa todennäköisyysjakaumaa voidaan suoraan laajentaa muodostamaan ryhmä sijaintiasteikkoja.

Pearsonin hypoteesi kriteerien normaalijakaumasta

Patologisia tapauksia lukuun ottamatta sijaintiasteikko voidaan asettaa vastaamaan havaittua keskiarvoa (ensimmäinen kumulantti) ja varianssia (toinen kumulantti) mieliv altaisella tavalla. Ei kuitenkaan tiedetty, kuinka konstruoida todennäköisyysjakaumia, joissa vinoutta (standardoitu kolmas kumulantti) ja kurtoosia (standardoitu neljäs kumulantti) voitaisiin hallita yhtä vapaasti. Tämä tarve tuli ilmi, kun yritettiin sovittaa tunnettuja teoreettisia malleja havaittuun tietoon,joka osoitti epäsymmetriaa.

Alla olevassa videossa näet Pearsonin chi-jakauman analyysin.

Image
Image

Historia

Alkuperäisessä työssään Pearson tunnisti neljä jakauman tyyppiä (numerot I - IV) normaalijakauman (joka alun perin tunnettiin nimellä V) lisäksi. Luokittelu riippuu siitä, tuetaanko jakaumia rajoitetulla aikavälillä, puoliakselilla vai koko reaaliviivalla ja ovatko ne mahdollisesti vinossa vai välttämättä symmetrisiä.

Kaksi puutetta korjattiin toisessa artikkelissa: hän määritteli uudelleen tyypin V jakauman (alun perin se oli vain normaalijakauma, mutta nyt käänteisellä gammalla) ja otti käyttöön tyypin VI jakauman. Yhdessä kaksi ensimmäistä artikkelia kattavat Pearson-järjestelmän viisi päätyyppiä (I, III, IV, V ja VI). Kolmannessa artikkelissa Pearson (1916) esitteli lisää alatyyppejä.

Pearsonin jakelufunktiot
Pearsonin jakelufunktiot

Paranna konseptia

Rind keksi yksinkertaisen tavan visualisoida Pearson-järjestelmän parametriavaruus (tai kriteerien jakauma), jonka hän myöhemmin omaksui. Nykyään monet matemaatikot ja tilastotieteilijät käyttävät tätä menetelmää. Pearson-jakaumien tyypeille on ominaista kaksi suuretta, joita yleensä kutsutaan β1 ja β2. Ensimmäinen on epäsymmetrian neliö. Toinen on perinteinen kurtosis eli neljäs standardoitu momentti: β2=γ2 + 3.

Nykyaikaiset matemaattiset menetelmät määrittelevät kurtosis γ2:n kumulantteiksi hetkien sijaan, joten normaalillejakaumassa meillä on γ2=0 ja β2=3. Tässä kannattaa seurata historiallista ennakkotapausta ja käyttää β2:ta. Oikealla oleva kaavio näyttää minkä tyyppinen tietty Pearson-jakauma on (merkitty pisteellä (β1, β2).

Pearsonin tilastot
Pearsonin tilastot

Monet vääristyneistä ja/tai ei-mesokurttisista jakaumista, joita tunnemme nykyään, eivät olleet vielä tunnettuja 1890-luvun alussa. Thomas Bayes käytti nykyään beeta-jakaumana tunnettua Bernoulli-jakauman posterioriparametria käänteistä todennäköisyyttä käsittelevässä artikkelissaan vuonna 1763.

Beeta-jakelu nousi näkyvämmäksi Pearson-järjestelmässä läsnäolon ansiosta, ja se tunnettiin 1940-luvulle asti Pearson type I -jakeluna. Tyypin II jakelu on tyypin I erikoistapaus, mutta sitä ei yleensä enää eroteta.

Gamma-jakelu syntyi hänen omasta työstään, ja se tunnettiin nimellä Pearson Type III Normal Distribution, ennen kuin se sai nykyaikaisen nimensä 1930- ja 1940-luvuilla. Tiedemiehen vuonna 1895 tekemässä artikkelissa esitettiin tyypin IV jakauma, joka sisältää Studentin t-jakauman, erikoistapauksena, joka edelsi William Seely Gossetin myöhempää käyttöä useita vuosia. Hänen vuoden 1901 artikkelinsa esitteli jakauman käänteisgamma- (tyyppi V) ja beeta-alkuluvuilla (tyyppi VI).

Toinen mielipide

Ordin mukaan Pearson kehitti yhtälön (1) perusmuodon, joka perustuu normaalijakauman tiheysfunktion (joka antaa lineaarisen jaon neliöllä) logaritmin derivaatan kaavaan.rakenne). Monet asiantuntijat testaavat edelleen Pearson-kriteerien jakautumista koskevaa hypoteesia. Ja se todistaa tehokkuutensa.

Vaihtoehtoinen Pearson-jakelu
Vaihtoehtoinen Pearson-jakelu

Kuka oli Karl Pearson

Karl Pearson oli englantilainen matemaatikko ja biostatistikko. Hänen ansiotaan on luoda matemaattinen tilastotiede. Vuonna 1911 hän perusti maailman ensimmäisen tilastotieteen osaston University College Londoniin ja teki merkittävän panoksen biometriikan ja meteorologian aloille. Pearson oli myös sosiaalidarwinismin ja eugeniikan kannattaja. Hän oli Sir Francis G altonin suojelija ja elämäkerran kirjoittaja.

Biometriset tiedot

Karl Pearson oli avainasemassa biometriikkakoulun luomisessa, joka oli kilpaileva teoria populaatioiden kehityksen ja periytymisen kuvaamisesta 1900-luvun vaihteessa. Hänen kahdeksantoista artikkelin sarja "Mathematical Contributions to the Theory of Evolution" teki hänestä biometrisen periytymiskoulun perustajan. Itse asiassa Pearson omisti suuren osan ajastaan vuosina 1893-1904 tilastollisten menetelmien kehittäminen biometriikkaa varten. Nämä menetelmät, joita nykyään käytetään laaj alti tilastolliseen analyysiin, sisältävät khin neliötestin, keskihajonnan, korrelaatio- ja regressiokertoimet.

Pearsonin korrelaatiokerroin
Pearsonin korrelaatiokerroin

Perinnöllisyyskysymys

Pearsonin perinnöllisyyslaki totesi, että ituplasma koostuu vanhemmilta ja kaukaisilta esivanhemmilta perityistä alkuaineista, joiden osuus vaihteli erilaisten ominaisuuksien mukaan. Karl Pearson oli G altonin seuraaja, ja vaikka heidänteokset erosivat joissakin suhteissa, Pearson käytti huomattavan määrän opettajansa tilastollisia käsitteitä muotoillessaan biometristä koulukuntaa periytymistä varten, kuten regression lakia.

Pearsonin jakelu
Pearsonin jakelu

Koulun ominaisuudet

Biometrinen koulu, toisin kuin mendeliläiset, ei keskittynyt tarjoamaan perintömekanismia, vaan tarjoamaan matemaattista kuvausta, joka ei ollut luonteeltaan kausaalista. Vaikka G alton ehdotti epäjatkuvaa evoluutioteoriaa, jossa lajit muuttuisivat suurilla harppauksilla pikemminkin kuin pienillä ajan mittaan kertyneillä muutoksilla, Pearson osoitti tämän väitteen puutteet ja itse asiassa käytti ideoitaan jatkuvan evoluutioteorian kehittämiseen. Mendeliläiset pitivät parempana epäjatkuvaa evoluutioteoriaa.

Kun G alton keskittyi pääasiassa tilastollisten menetelmien soveltamiseen perinnöllisyyden tutkimuksessa, Pearson ja hänen kollegansa Weldon laajensivat päättelyään tällä alueella, vaihtelussa, luonnollisen ja seksuaalisen valinnan korrelaatioissa.

Tyypillinen jakelu
Tyypillinen jakelu

Katsaus evoluutioon

Pearsonille evoluutioteorian tarkoituksena ei ollut tunnistaa biologista mekanismia, joka selittää periytymismallit, kun taas Mendelin lähestymistapa julisti geenin periytymismekanismiksi.

Pearson kritisoi Batesonia ja muita biologeja siitä, etteivät he ottaneet käyttöön biometrisiä menetelmiä evoluutiotutkimuksessaan. Hän tuomitsi tutkijat, jotka eivät keskittyneetteorioidensa tilastollinen pätevyys, jossa todetaan:

"Ennen kuin voimme hyväksyä [kaiken progressiivisen muutoksen syyn] tekijäksi, meidän on paitsi osoitettava sen uskottavuus, myös, jos mahdollista, osoitettava sen määrällinen kyky."

Biologit ovat antautuneet "melkein metafyysisille spekuloinneille perinnöllisyyden syistä", jotka ovat korvanneet kokeellisen tiedon keruuprosessin, mikä saattaa itse asiassa antaa tutkijoille mahdollisuuden rajata mahdollisia teorioita.

tilastollinen silta
tilastollinen silta

Luonnon lait

Pearsonille luonnonlait olivat hyödyllisiä tarkkojen ennusteiden tekemisessä ja havaittujen tietojen suuntausten yhteenvedossa. Syynä oli kokemus "että tietty sekvenssi tapahtui ja toistui menneisyydessä".

Siksi tietyn genetiikan mekanismin tunnistaminen ei ole ollut biologien arvoinen yritys, vaan heidän pitäisi sen sijaan keskittyä empiiristen tietojen matemaattisiin kuvauksiin. Tämä johti osittain katkeraan kiistaan biometristien ja mendeliläisten välillä, mukaan lukien Bateson.

Kun jälkimmäinen hylkäsi yhden Pearsonin käsikirjoituksista, jotka kuvaavat uutta teoriaa jälkeläisten variaatiosta tai homotypiasta, Pearson ja Weldon perustivat Biometrika-yhtiön vuonna 1902. Vaikka biometrinen perinnöllinen lähestymistapa menetti lopulta mendelilaisen näkökulmansa, niiden tuolloin kehittämät menetelmät ovat elintärkeitä biologian ja evoluution tutkimukselle nykyään.

Suositeltava: