Bayesilaiset verkot: määritelmät, esimerkit ja niiden toiminta

Sisällysluettelo:

Bayesilaiset verkot: määritelmät, esimerkit ja niiden toiminta
Bayesilaiset verkot: määritelmät, esimerkit ja niiden toiminta
Anonim

Uskomus, päätösverkosto, Bayesin (ian) malli tai todennäköisyydellä ohjattu asyklinen graafimalli on varianttiskeema (tilastollisen mallin tyyppi), joka edustaa joukkoa muuttujia ja niiden ehdollisia riippuvuuksia suunnatun asyklisen graafin (DAG) kautta.).

Esimerkiksi Bayesin verkko voi edustaa todennäköisyyttä sairauksien ja oireiden välillä. Jälkimmäinen huomioon ottaen verkon avulla voidaan laskea erilaisten sairauksien mahdollisuus. Alla olevassa videossa näet esimerkin bayesialaisesta uskomusverkostosta laskelmien kera.

Image
Image

Tehokkuus

Tehokkaat algoritmit voivat tehdä päätelmiä ja oppia Bayesin verkoissa. Verkkoja, jotka mallintavat muuttujia (kuten puhesignaaleja tai proteiinisekvenssejä), kutsutaan dynaamiksi verkoiksi. Bayesin verkkojen yleistyksiä, jotka voivat esittää ja ratkaista ongelmia epävarmuudessa, kutsutaan vaikutuskaavioiksi.

Essence

MuodollisestiBayesin verkot ovat DAG:ita, joiden solmut edustavat muuttujia Bayesin mielessä: ne voivat olla havaittuja arvoja, piilotettuja muuttujia, tuntemattomia parametreja tai hypoteeseja. Koska se on erittäin mielenkiintoista.

Bayesian verkkoesimerkki

Kaksi tapahtumaa voi saada ruohon kastumaan: aktiivinen sprinkleri tai sade. Sade vaikuttaa suoraan sprinklerin käyttöön (eli että kun sataa, sprinkleri on yleensä passiivinen). Tämä tilanne voidaan mallintaa käyttämällä Bayesin verkkoa.

Tyypillinen kaava
Tyypillinen kaava

Simulaatio

Koska Bayesin verkko on täydellinen malli muuttujilleen ja niiden suhteille, sitä voidaan käyttää vastaamaan niitä koskeviin todennäköisyyskyselyihin. Sitä voidaan käyttää esimerkiksi päivittämään tietoa muuttujien osajoukon tilasta, kun havaitaan muita tietoja (todistemuuttujia). Tätä mielenkiintoista prosessia kutsutaan todennäköisyyspohjaiseksi päättelyksi.

A posteriori antaa yleisesti riittävän tilaston etsintäsovelluksille valittaessa arvoja muuttujien osajoukolle. Näin ollen tätä algoritmia voidaan pitää mekanismina Bayesin lauseen automaattiselle soveltamiselle monimutkaisiin ongelmiin. Artikkelin kuvissa näet esimerkkejä bayesilaisista uskomusverkostoista.

Käytännön Bayesin verkko
Käytännön Bayesin verkko

Tulostusmenetelmät

Yleisimmät tarkat päättelytavat ovat: muuttujan eliminointi, joka eliminoi (integroimalla tai summaamalla) havaitsemattomanei-kyselyparametrit yksitellen kohdentamalla summa tuotteelle.

Napsauta "puun" etenemistä, joka tallentaa laskelmat välimuistiin, jotta useat muuttujat voidaan kysyä kerralla ja uusia todisteita voidaan levittää nopeasti; ja rekursiivinen sovitus ja/tai haku, jotka mahdollistavat kompromissin tilan ja ajan välillä ja vastaavat muuttujan eliminoinnin tehokkuutta, kun tilaa käytetään riittävästi.

Kaikilla näillä menetelmillä on erityinen monimutkaisuus, joka riippuu eksponentiaalisesti verkon pituudesta. Yleisimmät likimääräiset päättelyalgoritmit ovat minisegmenttien eliminointi, syklinen uskomusten leviäminen, yleinen uskomuksen leviäminen ja variaatiomenetelmät.

Verkkojen tyypit
Verkkojen tyypit

Verkottuminen

Bayes-verkon määrittämiseksi täysin ja siten yhteisen todennäköisyysjakauman täydelliseksi esittämiseksi on tarpeen määrittää jokaiselle solmulle X X:n todennäköisyysjakauma X:n vanhempien vuoksi.

X:n ehdollinen jakaminen vanhempiensa toimesta voi olla missä tahansa muodossa. On yleistä työskennellä diskreettien tai Gaussin jakaumien kanssa, koska se yksinkertaistaa laskelmia. Joskus tunnetaan vain jakelurajoitukset. Voit sitten käyttää entropiaa määrittääksesi yksittäisen jakauman, jolla on suurin entropia rajoituksilla.

Samaan tapaan dynaamisen Bayesin verkon erityisessä kontekstissa latentin ajallisen kehityksen ehdollinen jakaumatila asetetaan yleensä maksimoimaan implisiittisen satunnaisprosessin entropianopeus.

Bayesilainen luottamusverkko
Bayesilainen luottamusverkko

Todennäköisyyden (tai posteriorisen todennäköisyyden) maksimoiminen suoraan on usein hankalaa, kun otetaan huomioon havaitsemattomien muuttujien läsnäolo. Tämä pätee erityisesti Bayesin päätösverkostoon.

Klassinen lähestymistapa

Klassinen lähestymistapa tähän ongelmaan on odotusten maksimointialgoritmi, joka vuorotellen laskee havaitsemattomien muuttujien odotusarvot havaitusta tiedosta riippuen maksimoimalla kokonaistodennäköisyyden (tai posterioriarvon) olettaen, että aiemmin laskettu odotusarvo arvot ovat oikein. Kohtuullisen säännöllisyyden olosuhteissa tämä prosessi konvergoi parametrien maksimiarvoihin (tai maksimiarvoihin a posteriori).

Täydellisempi bayesilainen lähestymistapa parametreihin on käsitellä niitä lisämuuttujina, joita ei havaita, ja laskea täydellinen posteriorijakauma kaikkien solmujen välillä havaittujen tietojen perusteella ja sitten integroida parametrit. Tämä lähestymistapa voi olla kallista ja johtaa suuriin malleihin, mikä tekee klassisista parametrien viritysmenetelmistä helpommin saavutettavissa.

Yksinkertaisimmassa tapauksessa asiantuntija määrittelee Bayesin verkon ja käyttää sitä päättelyn suorittamiseen. Muissa sovelluksissa määritystehtävä on liian vaikea ihmiselle. Tässä tapauksessa Bayesin hermoverkon rakenne ja paikallisjakaumien parametrit on opittava datan joukosta.

Bayesin verkot
Bayesin verkot

Vaihtoehtoinen menetelmä

Vaihtoehtoinen järjestelmällisen oppimisen menetelmä käyttää optimointihakua. Tämä edellyttää arviointifunktion ja hakustrategian soveltamista. Yleinen pisteytysalgoritmi on rakenteen posteriori todennäköisyys tietyllä harjoitusdatalla, kuten BIC tai BDeu.

Aika, joka tarvitaan kattavaan hakuun, joka palauttaa pistemäärän maksimoivan rakenteen, on supereksponentiaalinen muuttujien määrässä. Paikallinen hakustrategia tekee asteittain muutoksia parantaakseen rakenteen estimointia. Friedman ja hänen kollegansa harkitsivat muuttujien keskinäisen tiedon käyttämistä halutun rakenteen löytämiseksi. Ne rajoittavat ylätason ehdokkaiden joukon k solmuun ja etsivät niitä perusteellisesti.

Erityisen nopea tapa tutkia BN:ää tarkasti on kuvitella ongelma optimointitehtäväksi ja ratkaista se kokonaislukuohjelmointia käyttämällä. Asyklisyysrajoitukset lisätään kokonaislukuohjelmaan (IP) ratkaisun aikana leikkaustasojen muodossa. Tällainen menetelmä voi käsitellä jopa 100 muuttujan ongelmia.

Kaaviot ja verkot
Kaaviot ja verkot

Ongelmanratkaisu

Tuhansien muuttujien ongelmien ratkaisemiseksi tarvitaan erilainen lähestymistapa. Yksi on ensin valita yksi tilaus ja sitten löytää optimaalinen BN-rakenne kyseiselle tilaukselle. Tämä tarkoittaa työskentelyä mahdollisen järjestyksen hakutilassa, mikä on kätevää, koska se on pienempi kuin verkkorakenteiden tila. Tämän jälkeen valitaan ja arvioidaan useita tilauksia. Tämä menetelmä osoittautuiparas saatavilla oleva kirjallisuus, kun muuttujien määrä on v altava.

Toinen tapa on keskittyä hajottavien mallien alaluokkaan, joille MLE:t on suljettu. Sitten voit löytää yhtenäisen rakenteen sadoille muuttujille.

Bayesilaisten verkkojen, joiden leveys on rajoitettu kolmella viivalla, tutkiminen on välttämätöntä tarkan, tulkittavan päättelyn saamiseksi, koska jälkimmäisen pahimman tapauksen monimutkaisuus on eksponentiaalinen puun pituudessa k (eksponentiaalisen aikahypoteesin mukaan). Graafin globaalina ominaisuutena se kuitenkin lisää huomattavasti oppimisprosessin monimutkaisuutta. Tässä yhteydessä K-puuta voidaan käyttää tehokkaaseen oppimiseen.

Lyhyt verkko
Lyhyt verkko

Kehitys

Bayesilaisen luottamusverkon kehittäminen alkaa usein DAG G:n luomisella siten, että X täyttää paikallisen Markovin ominaisuuden suhteessa G:hen. Joskus tämä on kausaalinen DAG. Kunkin muuttujan ehdolliset todennäköisyysjakaumat sen vanhempien G:ssä on arvioitu. Monissa tapauksissa, erityisesti kun muuttujat ovat diskreettejä, jos X:n yhteisjakauma on näiden ehdollisten jakaumien tulos, X:stä tulee Bayesin verkko suhteessa G.

Markovin "solmupeite" on joukko solmuja. Markov-peitto tekee solmun riippumattoman samannimisen solmun muusta aihiosta ja on riittävä tieto sen jakautumisen laskemiseen. X on Bayesin verkko suhteessa G:hen, jos jokainen solmu on ehdollisesti riippumaton kaikista muista solmuista, kun otetaan huomioon sen Markovpeitto.

Suositeltava: