Koji je Pearsonov zakon distribucije? Odgovor na ovo široko pitanje ne može biti jednostavan i sažet. Pearsonov sustav izvorno je dizajniran za modeliranje vidljivih iskrivljenih opažanja. U to je vrijeme bilo dobro poznato kako podesiti teoretski model tako da odgovara prva dva kumulanta ili momenta promatranih podataka: bilo koja distribucija vjerojatnosti može se izravno proširiti u skupinu ljestvica lokacije.
Pearsonova hipoteza o normalnoj raspodjeli kriterija
Osim u patološkim slučajevima, ljestvica lokacije može se napraviti tako da odgovara promatranoj sredini (prvi kumulant) i varijansi (drugi kumulant) na proizvoljan način. Međutim, nije se znalo kako konstruirati distribucije vjerojatnosti u kojima bi se iskrivljenost (standardizirani treći kumulant) i kurtosis (standardizirani četvrti kumulant) mogle jednako slobodno kontrolirati. Ta je potreba postala očita kada se pokušalo uklopiti poznate teorijske modele u promatrane podatke,koji je pokazao asimetriju.
U videu ispod možete vidjeti analizu Pearsonove chi-distribucije.
Povijest
U svom izvornom djelu, Pearson je identificirao četiri vrste distribucija (brojene od I do IV) uz normalnu distribuciju (koja je izvorno bila poznata kao tip V). Klasifikacija ovisi o tome jesu li distribucije podržane u ograničenom intervalu, na poluosi ili na cijeloj realnoj liniji i jesu li bile potencijalno iskrivljene ili nužno simetrične.
Dva su propusta ispravljena u drugom radu: redefinirao je distribuciju tipa V (prvotno je to bila samo normalna raspodjela, ali sada s inverznom gama) i uveo distribuciju tipa VI. Zajedno, prva dva članka pokrivaju pet glavnih tipova Pearsonovog sustava (I, III, IV, V i VI). U trećem je radu Pearson (1916.) uveo dodatne podtipove.
Poboljšajte koncept
Rind je izumio jednostavan način vizualizacije parametarskog prostora Pearsonovog sustava (ili distribucije kriterija), koji je kasnije usvojio. Danas mnogi matematičari i statističari koriste ovu metodu. Vrste Pearsonovih distribucija karakteriziraju dvije veličine, koje se obično nazivaju β1 i β2. Prvi je kvadrat asimetrije. Drugi je tradicionalni kurtosis, ili četvrti standardizirani trenutak: β2=γ2 + 3.
Moderne matematičke metode definiraju kurtosis γ2 kao kumulante umjesto trenutaka, tako da za normalanraspodjelu imamo γ2=0 i β2=3. Ovdje vrijedi slijediti povijesni presedan i koristiti β2. Dijagram s desne strane pokazuje koji je tip određene Pearsonove distribucije (označeno s točkom (β1, β2).
Mnoge iskrivljene i/ili nemezokurtične distribucije koje danas poznajemo još nisu bile poznate ranih 1890-ih. Ono što je sada poznato kao beta distribucija koristio je Thomas Bayes kao zadnji parametar Bernoullijeve distribucije u svom radu iz 1763. o inverznoj vjerojatnosti.
Beta distribucija postala je istaknuta zbog svoje prisutnosti u Pearsonovom sustavu i bila je poznata do 1940-ih kao Pearsonova distribucija tipa I. Distribucija tipa II je poseban slučaj tipa I, ali se obično više ne izdvaja.
Gama distribucija potječe iz njegovog vlastitog rada i bila je poznata kao normalna distribucija Pearson tipa III prije nego što je dobila svoje moderno ime 1930-ih i 1940-ih. Znanstvenik je iz 1895. godine predstavio distribuciju tipa IV, koja sadrži Studentovu t-distribuciju, kao poseban slučaj, koji je nekoliko godina prethodio kasnijem korištenju Williama Seelyja Gosseta. Njegov rad iz 1901. predstavio je distribuciju s inverznim gama (tip V) i beta prostim brojem (tip VI).
Još jedno mišljenje
Prema Ordu, Pearson je razvio osnovni oblik jednadžbe (1) na temelju formule za derivaciju logaritma funkcije gustoće normalne distribucije (koja daje linearnu podjelu kvadratnomstruktura). Mnogi stručnjaci još uvijek se bave testiranjem hipoteze o raspodjeli Pearsonovih kriterija. I dokazuje svoju učinkovitost.
Tko je bio Karl Pearson
Karl Pearson bio je engleski matematičar i biostatičar. Zaslužan je za stvaranje discipline matematičke statistike. Godine 1911. osnovao je prvi odjel za statistiku na Sveučilišnom koledžu u Londonu i dao značajan doprinos na području biometrije i meteorologije. Pearson je također bio pobornik socijalnog darvinizma i eugenike. Bio je štićenik i biograf Sir Francisa G altona.
Biometrija
Karl Pearson bio je ključan u stvaranju škole biometrije, koja je bila konkurentna teorija za opisivanje evolucije i nasljeđivanja populacija na prijelazu iz 20. stoljeća. Njegova serija od osamnaest radova "Matematički prilozi teoriji evolucije" utvrdila ga je kao utemeljitelja biometrijske škole nasljeđivanja. U stvari, Pearson je posvetio velik dio svog vremena tijekom 1893-1904 razvoj statističkih metoda za biometriju. Ove metode, koje se danas široko koriste za statističku analizu, uključuju hi-kvadrat test, standardnu devijaciju, korelaciju i regresijske koeficijente.
Pitanje nasljedstva
Pearsonov zakon nasljeđa navodi da se zametna plazma sastoji od elemenata naslijeđenih od roditelja, kao i od udaljenijih predaka, čiji je udio varirao prema različitim karakteristikama. Karl Pearson bio je G altonov sljedbenik, a iako njihovradovi su se u nekim aspektima razlikovali, Pearson je koristio značajnu količinu statističkih koncepata svog učitelja u formuliranju biometrijske škole za nasljeđivanje, kao što je zakon regresije.
Školske značajke
Biometrijska škola, za razliku od Mendelijanaca, nije bila usredotočena na pružanje mehanizma za nasljeđivanje, već na pružanje matematičkog opisa koji nije bio uzročne prirode. Dok je G alton predložio diskontinuiranu teoriju evolucije u kojoj bi se vrste mijenjale velikim skokovima, a ne malim promjenama koje su se nakupljale tijekom vremena, Pearson je ukazao na nedostatke u ovom argumentu i zapravo je koristio svoje ideje za razvoj kontinuirane teorije evolucije. Mendelijanci su preferirali diskontinuiranu teoriju evolucije.
Dok se G alton uglavnom fokusirao na primjenu statističkih metoda na proučavanje nasljedstva, Pearson i njegov kolega Weldon proširili su svoja razmišljanja u ovom području, varijacijama, korelacijama prirodne i spolne selekcije.
Pogled na evoluciju
Za Pearsona, teorija evolucije nije imala za cilj identificirati biološki mehanizam koji objašnjava obrasce nasljeđivanja, dok je Mendelov pristup proglasio gen mehanizmom nasljeđivanja.
Pearson je kritizirao Batesona i druge biologe jer nisu usvojili biometrijske metode u svom proučavanju evolucije. Osudio je znanstvenike koji se nisu usredotočili nastatističku valjanost njihovih teorija, navodeći:
"Prije nego što možemo prihvatiti [bilo koji uzrok progresivne promjene] kao faktor, moramo ne samo pokazati njegovu vjerodostojnost, već, ako je moguće, pokazati i njegovu kvantitativnu sposobnost."
Biolozi su podlegli "gotovo metafizičkim spekulacijama o uzrocima nasljednosti" koje su zamijenile proces prikupljanja eksperimentalnih podataka, što bi zapravo moglo omogućiti znanstvenicima da suze potencijalne teorije.
Zakoni prirode
Za Pearsona, zakoni prirode bili su korisni za izradu točnih predviđanja i za sažimanje trendova u promatranim podacima. Razlog je bilo iskustvo "da se određeni slijed dogodio i ponovio u prošlosti."
Dakle, identificiranje određenog mehanizma genetike nije bio dostojan poduhvat za biologe, koji bi se umjesto toga trebali usredotočiti na matematičke opise empirijskih podataka. To je dijelom dovelo do ogorčenog spora između biometrista i mendelijanaca, uključujući Batesona.
Nakon što je ovaj odbio jedan od Pearsonovih rukopisa koji opisuje novu teoriju varijacije ili homotipije potomstva, Pearson i Weldon su 1902. osnovali tvrtku Biometrika. Iako je biometrijski pristup nasljeđivanju s vremenom izgubio svoju mendelsku perspektivu, metode koje su razvili u to vrijeme vitalne su za proučavanje biologije i evolucije danas.