Matemaattinen tilasto on menetelmä, jonka avulla voit tehdä tietoisia päätöksiä epävarmoissa olosuhteissa. Tämä matematiikan haara tekee tiedon keräämis- ja systematisointimenetelmien tutkimista, kokeiden ja massasatunnaisuuskokeiden lopputulosten käsittelyä ja mahdollisten kuvioiden löytämistä. Harkitse matemaattisten tilastojen peruskäsitteitä.
Ero todennäköisyysteorian kanssa
Matemaattisten tilastojen menetelmät leikkaavat läheisesti todennäköisyysteorian. Molemmat matematiikan haarat käsittelevät lukuisten satunnaisten ilmiöiden tutkimusta. Nämä kaksi tieteenalaa yhdistetään rajalauseiden avulla. Näiden tieteiden välillä on kuitenkin suuri ero. Jos todennäköisyysteoria määrittää todellisen maailman prosessin ominaisuudet matemaattisen mallin perusteella, niin matemaattinen tilasto tekee päinvastoin - se asettaa mallin ominaisuudethavaittuun tietoon perustuen.
Vaiheet
Matemaattisten tilastojen soveltaminen voidaan suorittaa vain satunnaisten tapahtumien tai prosessien suhteen, tai pikemminkin niiden havainnolla saatuun tietoon. Ja tämä tapahtuu useissa vaiheissa. Ensinnäkin kokeiden ja kokeiden tiedot läpikäyvät tietyn käsittelyn. Ne on tilattu selkeyden ja analyysin helpottamiseksi. Sitten tehdään tarkka tai likimääräinen arvio havaitun satunnaisprosessin vaadituista parametreista. Ne voivat olla:
- tapahtuman todennäköisyyden arviointi (sen todennäköisyys on aluksi tuntematon);
- epämääräisen jakaumafunktion käyttäytymisen tutkiminen;
- odotusarvio;
- varianssiarvio
- jne.
Kolmas vaihe on ennen analyysiä asetettujen hypoteesien todentaminen, eli vastauksen saaminen kysymykseen, miten kokeiden tulokset vastaavat teoreettisia laskelmia. Itse asiassa tämä on matemaattisten tilastojen päävaihe. Esimerkkinä voisi olla pohtia, onko havaitun satunnaisen prosessin käyttäytyminen normaalijakauman sisällä.
Väestö
Matemaattisten tilastojen peruskäsitteet sisältävät yleiset ja otantapopulaatiot. Tämä tieteenala koskee tiettyjen esineiden joukon tutkimista jonkin ominaisuuden suhteen. Esimerkkinä taksinkuljettajan työ. Harkitse näitä satunnaismuuttujia:
- kuorma tai asiakasmäärä: päivässä, ennen lounasta, lounaan jälkeen, …;
- keskimääräinen matka-aika;
- saapuvien hakemusten määrä tai niiden liitteet kaupunginosille ja paljon muuta.
On myös syytä huomata, että on mahdollista tutkia joukko samanlaisia satunnaisprosesseja, jotka ovat myös havainnoitavissa oleva satunnaismuuttuja.
Joten matemaattisten tilastojen menetelmissä koko joukkoa tutkittavia kohteita tai erilaisten havaintojen tuloksia, jotka on suoritettu samoissa olosuhteissa tietylle objektille, kutsutaan yleisjoukoksi. Toisin sanoen, matemaattisesti tiukemmin, se on satunnaismuuttuja, joka määritellään alkeistapahtumien avaruudessa, johon on merkitty alajoukkojen luokka, jonka elementtien todennäköisyys on tunnettu.
Otospopulaatio
On tapauksia, joissa on mahdotonta tai epäkäytännöllistä jostain syystä (kustannus, aika) suorittaa jatkuvaa tutkimusta kunkin kohteen tutkimiseksi. Esimerkiksi jokaisen suljetun hillopurkin avaaminen sen laadun tarkistamiseksi on kyseenalainen päätös, ja jokaisen ilmamolekyylin liikeradan arvioiminen kuutiometrissä on mahdotonta. Tällaisissa tapauksissa käytetään valikoivan havainnoinnin menetelmää: tietty määrä esineitä valitaan (yleensä satunnaisesti) yleisestä populaatiosta ja ne analysoidaan.
Nämä käsitteet voivat aluksi tuntua monimutkaisilta. Siksi, jotta voit ymmärtää aiheen täysin, sinun on tutkittava V. E. Gmurmanin oppikirja "Todennäköisyysteoria ja matemaattiset tilastot". Näin ollen näytteenottojoukko tai näyte on sarja objekteja, jotka on valittu satunnaisesti yleisestä joukosta. Tiukasti matemaattisesti sanottuna tämä on sarja riippumattomia, tasaisesti jakautuneita satunnaismuuttujia, joiden kunkin jakauma on sama kuin yleiselle satunnaismuuttujalle osoitettu jakauma.
Peruskäsitteet
Katsotaanpa lyhyesti useita muita matemaattisten tilastojen peruskäsitteitä. Yleisen perusjoukon tai otoksen objektien määrää kutsutaan tilavuudeksi. Kokeen aikana saatuja näytearvoja kutsutaan näytteen realisaatioksi. Jotta otokseen perustuva estimaatti yleisestä perusjoukosta olisi luotettava, on tärkeää, että meillä on ns. edustava tai edustava otos. Tämä tarkoittaa, että otoksen tulee edustaa populaatiota täysin. Tämä voidaan saavuttaa vain, jos kaikilla populaation elementeillä on yhtä suuri todennäköisyys olla otoksessa.
Näytteissä erotetaan palautus ja ei-palautus. Ensimmäisessä tapauksessa näytteen sisällössä toistettu elementti palautetaan yleiseen joukkoon, toisessa tapauksessa ei. Yleensä käytännössä käytetään näytteenottoa ilman korvauksia. On myös huomattava, että yleisen populaation koko ylittää aina merkittävästi otoksen koon. Olla olemassauseita vaihtoehtoja näytteenottoprosessille:
- yksinkertainen - kohteet valitaan satunnaisesti yksi kerrallaan;
- kirjoitettu - yleinen populaatio jaetaan tyyppeihin, joista jokaisesta tehdään valinta; esimerkki on asukkaiden kysely: miehet ja naiset erikseen;
- mekaaninen - valitse esimerkiksi joka 10. elementti;
- sarja - valinta tehdään elementtien sarjassa.
Tilastollinen jakelu
Gmurmanin mukaan todennäköisyysteoria ja matemaattinen tilastotiede ovat erittäin tärkeitä tieteenaloja tieteellisessä maailmassa, erityisesti sen käytännön osissa. Harkitse otoksen tilastollista jakautumista.
Oletetaan, että meillä on ryhmä opiskelijoita, jotka on testattu matematiikassa. Tämän seurauksena meillä on joukko arvioita: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - tämä on ensisijainen tilastomateriaalimme.
Ensinnäkin meidän on lajiteltava se tai suoritettava järjestysoperaatio: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - ja siten saadaan muunnelmasarja. Kunkin arvioinnin toistojen määrää kutsutaan arviointitiheydeksi ja niiden suhdetta otoskokoon suhteelliseksi frekvenssiksi. Tehdään taulukko otoksen tilastollisesta jakautumisesta tai vain tilastollinen sarja:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
tai
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Otetaan satunnaismuuttuja, jolla teemme sarjan kokeita ja katsomme, minkä arvon tämä muuttuja saa. Oletetaan, että hän otti arvon a1 - m1 kertaa; a2 - m2 kertaa jne. Tämän otoksen koko on m1 + … + mk=m. Joukko ai, jossa i vaihtelee 1:stä k:aan, on tilastollinen sarja.
Välijakauma
VE Gmurmanin kirjassa "Todennäköisyysteoria ja matemaattiset tilastot" esitetään myös intervallitilastosarja. Sen kokoaminen on mahdollista, kun tutkittavan ominaisuuden arvo on jatkuva tietyllä aikavälillä ja arvojen määrä on suuri. Ajatellaanpa ryhmää opiskelijoita tai pikemminkin heidän pituuttaan: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 61 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - yhteensä 30 opiskelijaa. On selvää, että henkilön pituus on jatkuva arvo. Meidän on määritettävä intervalliaskel. Tätä varten käytetään Sturgesin kaavaa.
h= | max - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Siten välin kooksi voidaan ottaa arvo 6. On myös sanottava, että arvo 1+log2m on kaavaintervallien lukumäärän määrittäminen (tietysti pyöristyksellä). Siten kaavojen mukaan saadaan 6 väliä, joista jokaisen koko on 6. Ja aloitusvälin ensimmäinen arvo on kaavalla määritetty numero: min - h / 2=156 - 6/2=153. Tehdään taulukko, joka sisältää välit ja niiden opiskelijoiden lukumäärän, joiden kasvu jäi tietylle välille.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Tämä ei tietenkään ole kaikki, koska matemaattisissa tilastoissa on paljon enemmän kaavoja. Olemme tarkastelleet vain joitain peruskäsitteitä.
Jakeluaikataulu
Matemaattisen tilaston peruskäsitteisiin kuuluu myös jakauman graafinen esitys, joka erottuu selkeästi. Kaavioita on kahdenlaisia: monikulmio ja histogrammi. Ensimmäistä käytetään diskreetille tilastosarjalle. Ja jatkuvalle jakelulle vastaavasti toinen.