Kriteriji i metode za testiranje statističkih hipoteza, primjeri

Sadržaj:

Kriteriji i metode za testiranje statističkih hipoteza, primjeri
Kriteriji i metode za testiranje statističkih hipoteza, primjeri
Anonim

Testiranje hipoteze je neophodan postupak u statistici. Test hipoteze procjenjuje dvije međusobno isključive tvrdnje kako bi se utvrdilo koja je izjava najbolje podržana podacima uzorka. Kada se za nalaz kaže da je statistički značajan, to je rezultat testa hipoteze.

Načini provjere

Metode za testiranje statističkih hipoteza su metode statističke analize. Obično se uspoređuju dva skupa statističkih podataka ili se uzorkovani skup podataka uspoređuje sa sintetičkim skupom podataka iz idealiziranog modela. Podaci se moraju tumačiti na način da im dodaju nova značenja. Možete ih protumačiti pretpostavkom određene strukture konačnog rezultata i korištenjem statističkih metoda da potvrdite ili odbacite pretpostavku. Pretpostavka se naziva hipoteza, a statistički testovi koji se koriste u tu svrhu nazivaju se statističke hipoteze.

H0 i H1 hipoteze

Postoje dva glavnakoncepti statističkog testiranja hipoteza - tzv. "glavna ili nulta hipoteza" i " alternativna hipoteza". Zovu se i Neyman-Pearsonove hipoteze. Pretpostavka statističkog testa naziva se nultom hipotezom, glavnom hipotezom ili skraćeno H0. Često se naziva zadana pretpostavka ili pretpostavka da se ništa nije promijenilo. Kršenje testne pretpostavke često se naziva prva hipoteza, alternativna hipoteza ili H1. H1 je skraćenica za neku drugu hipotezu, jer sve što znamo o njoj je da se podaci H0 mogu odbaciti.

test nulte hipoteze
test nulte hipoteze

Prije odbijanja ili ne odbacivanja nulte hipoteze, rezultat testa se mora protumačiti. Usporedba se smatra statistički značajnom ako je malo vjerojatno da će odnos između skupova podataka biti implementacija nulte hipoteze prema pragu vjerojatnosti – razini značajnosti. Postoje i kriteriji dobrote prilagodbe za testiranje statističkih hipoteza. Ovo je naziv kriterija provjere hipoteze, koji je povezan s navodnim zakonom nepoznate distribucije. Ovo je numerička mjera neslaganja između empirijske i teorijske distribucije.

Procedura i kriteriji za testiranje statističkih hipoteza

Najčešće metode odabira hipoteza temelje se ili na Akaike informacijskom kriteriju ili na Bayesovom koeficijentu. Provjera statističkih hipoteza ključna je tehnika i u zaključivanju iu Bayesovom zaključivanju, iako te dvije vrste imaju značajne razlike. Testovi statističkih hipotezadefinirati postupak koji kontrolira vjerojatnost pogrešne odluke o netočnoj zadanoj ili nultoj hipotezi. Postupak se temelji na tome koliko je vjerojatno da će djelovati. Ova vjerojatnost donošenja pogrešne odluke je nevjerojatnost da je nulta hipoteza istinita i da ne postoji posebna alternativna hipoteza. Test ne može pokazati je li istina ili laž.

Metode ispitivanja statističkih hipoteza
Metode ispitivanja statističkih hipoteza

Alternativne metode teorije odlučivanja

Postoje alternativne metode teorije odlučivanja, u kojima se nulta i prva hipoteza razmatraju na ravnopravnijim osnovama. Drugi pristupi donošenju odluka, kao što je Bayesova teorija, pokušavaju uravnotežiti posljedice loših odluka u svim mogućnostima umjesto da se usredotočuju na jednu nultu hipotezu. Brojni drugi pristupi odlučivanju koja je od hipoteza točna temelje se na podacima koji od njih imaju željena svojstva. Ali testiranje hipoteza dominantan je pristup analizi podataka u mnogim područjima znanosti.

Testiranje statističke hipoteze

Kad god se jedan skup rezultata razlikuje od drugog skupa, morate se osloniti na testiranje statističkih hipoteza ili testove statističkih hipoteza. Njihovo tumačenje zahtijeva pravilno razumijevanje p-vrijednosti i kritičnih vrijednosti. Također je važno razumjeti da, bez obzira na razinu važnosti, testovi i dalje mogu sadržavati pogreške. Stoga zaključak možda nije točan.

Proces testiranja sastoji se odviše koraka:

  1. Stvara se početna hipoteza za istraživanje.
  2. Naznačene su relevantne nulte i alternativne hipoteze.
  3. Objašnjava statističke pretpostavke o uzorku u testu.
  4. Određivanje koji je test prikladan.
  5. Odaberite razinu važnosti i prag vjerojatnosti ispod kojeg će nulta hipoteza biti odbijena.
  6. Distribucija statistike testa nulte hipoteze pokazuje moguće vrijednosti na kojima se nulta hipoteza odbacuje.
  7. Izračun u tijeku.
  8. Donosi se odluka da se odbaci ili prihvati nulta hipoteza u korist alternative.

Postoji alternativa koja koristi p-vrijednost.

Primjeri provjere statističkih hipoteza
Primjeri provjere statističkih hipoteza

Testovi značaja

Čisti podaci nemaju praktičnu korist bez tumačenja. U statistici, kada je u pitanju postavljanje pitanja o podacima i tumačenje rezultata, koriste se statističke metode kako bi se osigurala točnost ili vjerojatnost odgovora. Kada se testiraju statističke hipoteze, ova klasa metoda naziva se statističko testiranje ili testovi značajnosti. Pojam “hipoteza” podsjeća na znanstvene metode, gdje se istražuju hipoteze i teorije. U statistici, test hipoteze rezultira u količini za koju je dana dana pretpostavka. Omogućuje vam tumačenje je li pretpostavka istinita ili je došlo do kršenja.

Statistička interpretacija testova

Testovi hipotezakoriste se za određivanje koji će rezultati istraživanja dovesti do odbacivanja nulte hipoteze za unaprijed određenu razinu značaja. Rezultati testa statističke hipoteze moraju se interpretirati kako bi se na njemu mogao nastaviti rad. Postoje dva uobičajena oblika kriterija za testiranje statističkih hipoteza. To su p-vrijednost i kritične vrijednosti. Ovisno o odabranom kriteriju, dobiveni rezultati moraju se različito tumačiti.

Što je p-vrijednost

Izlaz je opisan kao statistički značajan kada se tumači p-vrijednost. Zapravo, ovaj pokazatelj znači vjerojatnost pogreške ako se nulta hipoteza odbije. Drugim riječima, može se koristiti za imenovanje vrijednosti koja se može koristiti za tumačenje ili kvantificiranje rezultata testa, te za određivanje vjerojatnosti pogreške u odbacivanju nulte hipoteze. Na primjer, možete izvesti test normalnosti na uzorku podataka i otkriti da postoji mala vjerojatnost odstupanja. Međutim, nulta hipoteza se ne mora odbaciti. Statistički test hipoteze može vratiti p-vrijednost. To se postiže usporedbom vrijednosti p s unaprijed određenom vrijednošću praga koja se naziva razina značajnosti.

Statističko testiranje nultih hipoteza
Statističko testiranje nultih hipoteza

Razina značaja

Razina značaja često se piše s grčkim malim slovom "alfa". Opća vrijednost koja se koristi za alfa je 5% ili 0,05. Manja alfa vrijednost ukazuje na pouzdaniju interpretaciju nulte hipoteze. P-vrijednost se uspoređuje sunaprijed odabrana alfa vrijednost. Rezultat je statistički značajan ako je p-vrijednost manja od alfa. Razina značaja može se invertirati oduzimanjem od jedan. To se radi kako bi se odredila razina pouzdanosti hipoteze s obzirom na podatke promatranog uzorka. Kada se koristi ova metoda testiranja statističkih hipoteza, P-vrijednost je vjerojatnostna. To znači da se u procesu tumačenja rezultata statističkog testa ne zna što je istina ili netočno.

Teorija testiranja statističkih hipoteza

Odbijanje nulte hipoteze znači da postoji dovoljno statističkih dokaza da izgleda vjerojatno. Inače, to znači da nema dovoljno statistike da se to odbije. Možemo razmišljati o statističkim testovima u smislu dihotomije odbijanja i prihvaćanja nulte hipoteze. Opasnost statističkog testiranja nulte hipoteze je da se, ako se prihvati, može činiti istinitom. Umjesto toga, ispravnije bi bilo reći da se nulta hipoteza ne odbacuje jer nema dovoljno statističkih dokaza da je odbaci.

Statistička hipoteza koja provjerava ispravnost kriterija uklapanja
Statistička hipoteza koja provjerava ispravnost kriterija uklapanja

Ovaj trenutak često zbunjuje početnike. U takvom slučaju, važno je podsjetiti se da je rezultat vjerojatnost i da čak i prihvaćanje nulte hipoteze još uvijek ima male šanse za pogrešku.

Točna ili netočna nulta hipoteza

Tumačenje vrijednosti p ne znači da je nulahipoteza je istinita ili netočna. To znači da je napravljen izbor odbaciti ili ne odbaciti nultu hipotezu na određenoj razini statističke značajnosti na temelju empirijskih podataka i odabranog statističkog testa. Stoga se p-vrijednost može smatrati vjerojatnošću podataka danih pod unaprijed određenom pretpostavkom ugrađenom u statističke testove. P-vrijednost je mjera vjerojatnosti da će uzorak podataka biti promatran ako je nulta hipoteza istinita.

Tumačenje kritičnih vrijednosti

Neki testovi ne vraćaju str. Umjesto toga, oni mogu vratiti popis kritičnih vrijednosti. Na sličan se način tumače rezultati takvog istraživanja. Umjesto uspoređivanja jedne p-vrijednosti s unaprijed određenom razinom značajnosti, statistika testa se uspoređuje s kritičnom vrijednošću. Ako se pokaže manjim, to znači da nije bilo moguće odbaciti nultu hipotezu. Ako je veća ili jednaka, nultu hipotezu treba odbaciti. Značenje algoritma za provjeru statističkih hipoteza i tumačenje njegovog rezultata slično je p-vrijednosti. Odabrana razina značajnosti je probabilistička odluka da se odbije ili ne odbije pretpostavka osnovnog testa s obzirom na podatke.

Pogreške u statističkim testovima

Tumačenje testa statističke hipoteze je vjerojatnost. Zadatak testiranja statističkih hipoteza nije pronaći istinitu ili lažnu tvrdnju. Testni dokazi mogu biti pogrešni. Na primjer, ako je alfa bila 5%, to znači da je najvećim dijelom 1 od 20nulta hipoteza će biti odbačena greškom. Ili neće zbog statističkog šuma u uzorku podataka. S obzirom na ovu točku, mala p vrijednost pri kojoj se odbacuje nulta hipoteza može značiti da je netočna ili da je napravljena pogreška. Ako se napravi ova vrsta pogreške, rezultat se naziva lažno pozitivan. A takva je pogreška pogreška prve vrste pri testiranju statističkih hipoteza. S druge strane, ako je p-vrijednost dovoljno velika da znači odbacivanje nulte hipoteze, to može značiti da je točna. Ili nije točno, a dogodio se neki malo vjerojatan događaj zbog kojeg je došlo do pogreške. Ova vrsta pogreške naziva se lažno negativna.

Statističko testiranje nultih hipoteza
Statističko testiranje nultih hipoteza

Vjerojatnost pogrešaka

Prilikom testiranja statističkih hipoteza, još uvijek postoji šansa za bilo koju od ovih vrsta pogrešaka. Lažni podaci ili lažni zaključci vrlo su vjerojatni. U idealnom slučaju, treba odabrati razinu značajnosti koja minimalizira vjerojatnost jedne od ovih pogrešaka. Na primjer, statističko testiranje nultih hipoteza može imati vrlo nisku razinu značaja. Iako su razine značajnosti kao što su 0,05 i 0,01 uobičajene u mnogim područjima znanosti, najčešće korištena razina značajnosti je 310^-7, ili 0,0000003. Često se naziva "5-sigma". To znači da je zaključak bio nasumičan s vjerojatnošću od 1 prema 3,5 milijuna neovisnih ponavljanja eksperimenata. Primjeri testiranja statističkih hipoteza često nose takve pogreške. To je i razlog zašto je važno imati neovisne rezultate.potvrda.

Primjeri korištenja statističke provjere

Postoji nekoliko uobičajenih primjera testiranja hipoteza u praksi. Jedan od najpopularnijih je poznat kao "Degustacija čaja". Dr. Muriel Bristol, kolegica osnivača biometrije Roberta Fishera, tvrdila je da može sa sigurnošću reći je li prvo dodano u šalicu čaja ili mlijeka. Fisher je ponudio da joj nasumce da osam šalica (četiri od svake sorte). Statistika testa bila je jednostavna: brojanje uspjeha u odabiru šalice. Kritična regija bila je jedini uspjeh od 4, vjerojatno na temelju uobičajenog kriterija vjerojatnosti (< 5%; 1 od 70 ≈ 1,4%). Fisher je tvrdio da alternativna hipoteza nije potrebna. Gospođa je ispravno identificirala svaku šalicu, što se smatralo statistički značajnim rezultatom. Ovo iskustvo dovelo je do Fisherove knjige Statističke metode za istraživače.

Primjer optuženika

Statistički postupak suđenja je usporediv s kaznenim sudom gdje se optuženik smatra nevinim dok se ne dokaže krivnja. Tužitelj pokušava dokazati krivnju okrivljenika. Samo kada postoji dovoljno dokaza za optužbu, optuženik se može proglasiti krivim. Na početku postupka postoje dvije hipoteze: "Okrivljenik nije kriv" i "Okrivljenik je kriv". Hipoteza nevinosti može se odbaciti samo kada je pogreška vrlo malo vjerojatna jer se ne želi osuditi nevinog optuženika. Takva se pogreška naziva pogreškom tipa I i njezina pojavarijetko kontrolirani. Kao posljedica ovog asimetričnog ponašanja, češća je pogreška tipa II, tj. oslobađanje počinitelja.

Primjeri statističke provjere
Primjeri statističke provjere

Statistika je korisna kada se analiziraju velike količine podataka. To se jednako odnosi i na provjeru hipoteza, koje mogu opravdati zaključke čak i ako ne postoji znanstvena teorija. U primjeru kušanja čaja, bilo je "očito" da nema razlike između ulijevanja mlijeka u čaj ili ulijevanja čaja u mlijeko.

Prava praktična primjena testiranja hipoteza uključuje:

  • testiranje imaju li muškarci više noćnih mora od žena;
  • atribucija dokumenta;
  • Procjena utjecaja punog mjeseca na ponašanje;
  • određivanje raspona u kojem šišmiš može otkriti kukca pomoću jeke;
  • odabir najboljeg načina za prestanak pušenja;
  • Provjera odražavaju li naljepnice na braniku ponašanje vlasnika automobila.

Provjera statističkih hipoteza igra važnu ulogu u statistici općenito i u statističkom zaključivanju. Testiranje vrijednosti koristi se kao zamjena za tradicionalnu usporedbu predviđene vrijednosti i eksperimentalnog rezultata u srži znanstvene metode. Kada je teorija sposobna samo predvidjeti znak veze, testovi usmjerenih hipoteza mogu se konfigurirati na takav način da samo statistički značajan rezultat podržava teoriju. Ovaj oblik teorije evaluacije je najrigidnijikritika upotrebe testiranja hipoteza.

Preporučeni: