Bayesove mreže: definicija, primjeri i kako rade

2026 Autor: Angel Austin | [email protected]. Zadnja promjena: 2025-01-23 12:25:02

Uvjerenje, mreža odluka, Bayesian (ian) model ili vjerojatno vođen model acikličkog grafa je varijantna shema (vrsta statističkog modela) koja predstavlja skup varijabli i njihovih uvjetnih ovisnosti kroz usmjereni aciklički graf (DAG).

Na primjer, Bayesova mreža može predstavljati vjerojatnostne odnose između bolesti i simptoma. S obzirom na potonje, mreža se može koristiti za izračunavanje mogućnosti različitih bolesti. U videu ispod možete vidjeti primjer Bayesove mreže vjerovanja s izračunima.

Učinkovitost

Učinkoviti algoritmi mogu izvoditi zaključke i učenje na Bayesovim mrežama. Mreže koje modeliraju varijable (kao što su govorni signali ili proteinske sekvence) nazivaju se dinamičkim mrežama. Generalizacije Bayesovih mreža koje mogu predstavljati i rješavati probleme pod nesigurnošću nazivaju se dijagrami utjecaja.

Essence

FormalnoBayesove mreže su DAG-ovi čiji čvorovi predstavljaju varijable u Bayesovom smislu: mogu biti promatrane vrijednosti, skrivene varijable, nepoznati parametri ili hipoteze. Jer je vrlo zanimljivo.

primjer Bayesove mreže

Dva događaja mogu uzrokovati smočenje trave: aktivna prskalica ili kiša. Kiša ima izravan učinak na korištenje prskalice (naime, kada pada kiša, prskalica je obično neaktivna). Ova se situacija može modelirati pomoću Bayesove mreže.

Simulacija

Budući da je Bayesova mreža potpuni model za svoje varijable i njihove odnose, može se koristiti za odgovaranje na probabilističke upite o njima. Na primjer, može se koristiti za ažuriranje znanja o stanju podskupa varijabli kada se promatraju drugi podaci (varijable dokaza). Ovaj zanimljiv proces naziva se probabilistički zaključak.

A posteriori daje univerzalno dovoljnu statistiku za aplikacije otkrivanja pri odabiru vrijednosti za podskup varijabli. Stoga se ovaj algoritam može smatrati mehanizmom za automatsku primjenu Bayesova teorema na složene probleme. Na slikama u članku možete vidjeti primjere Bayesovih mreža vjerovanja.

Izlazne metode

Najčešće metode egzaktnog zaključivanja su: eliminacija varijable, koja eliminira (integracijom ili zbrajanjem) neuočljivoparametri bez upita jedan po jedan dodjeljivanjem iznosa proizvodu.

Kliknite na propagiranje "stabla" koje sprema izračune tako da se mnoge varijable mogu ispitivati odjednom i novi dokazi mogu brzo propagirati; i rekurzivno uparivanje i/ili pretraživanje, koji dopuštaju kompromise između prostora i vremena i odgovaraju učinkovitosti eliminacije varijable kada se koristi dovoljno prostora.

Sve ove metode imaju posebnu složenost koja eksponencijalno ovisi o duljini mreže. Najčešći približni algoritmi zaključivanja su eliminacija mini-segmenata, cikličko širenje uvjerenja, generalizirano širenje uvjerenja i varijacijske metode.

Umrežavanje

Da biste u potpunosti specificirali Bayesovu mrežu i tako u potpunosti predstavljali zajedničku distribuciju vjerojatnosti, potrebno je za svaki čvor X specificirati distribuciju vjerojatnosti za X zbog roditelja X.

Distribucija X uvjetno od strane roditelja može imati bilo koji oblik. Uobičajeno je raditi s diskretnim ili Gaussovim distribucijama jer pojednostavljuje izračune. Ponekad su poznata samo ograničenja distribucije. Zatim možete koristiti entropiju da odredite pojedinačnu distribuciju koja ima najveću entropiju s obzirom na ograničenja.

Slično, u specifičnom kontekstu dinamičke Bayesove mreže, uvjetna distribucija za vremensku evoluciju latentnogstanje se obično postavlja tako da maksimizira stopu entropije impliciranog slučajnog procesa.

Izravno maksimiziranje vjerojatnosti (ili posteriorne vjerojatnosti) često je teško s obzirom na prisutnost neopaženih varijabli. To posebno vrijedi za Bayesovu mrežu odlučivanja.

Klasični pristup

Klasični pristup ovom problemu je algoritam maksimizacije očekivanja, koji izmjenjuje izračunavanje očekivanih vrijednosti neopaženih varijabli ovisnih o promatranim podacima s maksimiziranjem ukupne vjerojatnosti (ili posteriorne vrijednosti), uz pretpostavku da je prethodno izračunata očekivana vrijednost vrijednosti su točne. U uvjetima umjerene pravilnosti, ovaj proces konvergira u maksimalne (ili maksimalne a posteriori) vrijednosti parametara.

Cjelovitiji Bayesov pristup parametrima je tretirati ih kao dodatne neopažene varijable i izračunati potpunu posteriornu distribuciju na svim čvorovima s obzirom na promatrane podatke, a zatim integrirati parametre. Ovaj pristup može biti skup i rezultirati velikim modelima, čineći klasične pristupe ugađanju parametara pristupačnijim.

U najjednostavnijem slučaju, Bayesovu mrežu definira stručnjak, a zatim se koristi za izvođenje zaključivanja. U drugim primjenama, zadatak određivanja je pretežak za čovjeka. U ovom slučaju, struktura Bayesove neuronske mreže i parametri lokalnih distribucija moraju se naučiti među podacima.

Alternativna metoda

Alternativna metoda strukturiranog učenja koristi optimizaciju pretraživanja. To zahtijeva primjenu funkcije evaluacije i strategije pretraživanja. Uobičajeni algoritam bodovanja je posteriorna vjerojatnost strukture zadane podatke o treningu kao što su BIC ili BDeu.

Vrijeme potrebno za iscrpno pretraživanje koje vraća strukturu koja maksimizira rezultat je supereksponencijalno u broju varijabli. Strategija lokalnog pretraživanja čini inkrementalne promjene kako bi poboljšala procjenu strukture. Friedman i njegovi kolege razmatrali su korištenje uzajamnih informacija između varijabli kako bi pronašli željenu strukturu. Oni ograničavaju skup roditeljskih kandidata na k čvorova i temeljito ih pretražuju.

Naročito brza metoda za točno proučavanje BN-a je zamisliti problem kao problem optimizacije i riješiti ga korištenjem cjelobrojnog programiranja. Ograničenja acikličnosti se dodaju cjelobrojnom programu (IP) tijekom rješenja u obliku reznih ravnina. Takva metoda može riješiti probleme do 100 varijabli.

Rješavanje problema

Za rješavanje problema s tisućama varijabli potreban je drugačiji pristup. Jedan je najprije odabrati jedan red, a zatim pronaći optimalnu BN strukturu s obzirom na taj redoslijed. To podrazumijeva rad u prostoru pretraživanja mogućeg reda, što je zgodno jer je manji od prostora mrežnih struktura. Zatim se odabire i ocjenjuje nekoliko narudžbi. Ova metoda se pokazalanajbolje dostupno u literaturi kada je broj varijabli ogroman.

Druga metoda je fokusiranje na podklasu razloživih modela za koje su MLE-ovi zatvoreni. Tada možete pronaći dosljednu strukturu za stotine varijabli.

Proučavanje Bayesovih mreža s ograničenom širinom od tri linije potrebno je kako bi se osigurao točan, interpretabilan zaključak, budući da je složenost potonjeg u najgorem slučaju eksponencijalna u duljini stabla k (prema hipotezi eksponencijalnog vremena). Međutim, kao globalno svojstvo grafa, on uvelike povećava složenost procesa učenja. U tom kontekstu, K-stablo se može koristiti za učinkovito učenje.

Razvoj

Razvoj Bayesove mreže povjerenja često počinje stvaranjem DAG-a G tako da X zadovoljava lokalno Markovljevo svojstvo u odnosu na G. Ponekad je to kauzalni DAG. Procjenjuju se uvjetne distribucije vjerojatnosti svake varijable nad njenim roditeljima u G. U mnogim slučajevima, posebno kada su varijable diskretne, ako je zajednička distribucija X proizvod ovih uvjetnih distribucija, tada X postaje Bayesova mreža s obzirom na G.

Markovljev "čvorni pokrivač" je skup čvorova. Markov jorgan čini čvor neovisnim o ostatku praznog dijela čvora s istim imenom i dovoljno je znanja za izračunavanje njegove distribucije. X je Bayesova mreža s obzirom na G ako je svaki čvor uvjetno neovisan o svim ostalim čvorovima, s obzirom na njegov Markoviandeka.