Matematička statistika je metodologija koja vam omogućuje donošenje informiranih odluka u neizvjesnim uvjetima. Proučavanje metoda za prikupljanje i sistematizaciju podataka, obradu konačnih rezultata eksperimenata i eksperimenata s masovnom nasumičnošću, te otkrivanje bilo kakvih obrazaca je ono čime se bavi ova grana matematike. Razmotrite osnovne koncepte matematičke statistike.
Razlika s teorijom vjerojatnosti
Metode matematičke statistike usko se presijecaju s teorijom vjerojatnosti. Obje grane matematike bave se proučavanjem brojnih slučajnih pojava. Dvije su discipline povezane graničnim teoremima. Međutim, postoji velika razlika između ovih znanosti. Ako teorija vjerojatnosti određuje karakteristike procesa u stvarnom svijetu na temelju matematičkog modela, onda matematička statistika čini suprotno - postavlja svojstva modela nana temelju uočenih informacija.
Koraci
Primjena matematičke statistike može se provoditi samo u odnosu na slučajne događaje ili procese, odnosno na podatke dobivene njihovim promatranjem. A to se događa u nekoliko faza. Prvo, podaci eksperimenata i eksperimenata prolaze određenu obradu. Naručeni su radi jasnoće i jednostavnosti analize. Zatim se vrši točna ili približna procjena potrebnih parametara promatranog slučajnog procesa. Mogu biti:
- procjena vjerojatnosti događaja (njegova vjerojatnost je u početku nepoznata);
- proučavanje ponašanja funkcije neodređene distribucije;
- procjena očekivanja;
- procjena varijance
- itd.
Treća faza je provjera bilo koje hipoteze postavljene prije analize, tj. dobivanje odgovora na pitanje kako rezultati eksperimenata odgovaraju teorijskim proračunima. Zapravo, ovo je glavna faza matematičke statistike. Primjer bi bio razmatranje je li ponašanje promatranog slučajnog procesa unutar normalne distribucije.
Stanovništvo
Osnovni koncepti matematičke statistike uključuju opću i uzorkovanu populaciju. Ova se disciplina bavi proučavanjem skupa određenih objekata s obzirom na neko svojstvo. Primjer je rad taksista. Uzmite u obzir ove slučajne varijable:
- opterećenje ili broj kupaca: po danu, prije ručka, poslije ručka, …;
- prosječno vrijeme putovanja;
- broj pristiglih prijava ili njihov prilog gradskim četvrtima i još mnogo toga.
Također je vrijedno napomenuti da je moguće proučavati skup sličnih slučajnih procesa, koji će također biti slučajna varijabla koja se može promatrati.
Dakle, u metodama matematičke statistike, cijeli skup objekata koji se proučavaju ili rezultati raznih promatranja koja se provode pod istim uvjetima na danom objektu naziva se opća populacija. Drugim riječima, matematički strože, to je slučajna varijabla koja je definirana u prostoru elementarnih događaja, s klasom podskupova označenih u njoj, čiji elementi imaju poznatu vjerojatnost.
Uzorak populacije
Postoje slučajevi kada je iz nekog razloga (cijena, vrijeme) nemoguće ili nepraktično provoditi kontinuirano proučavanje svakog objekta. Primjerice, otvaranje svake staklenke zatvorenog džema kako bi se provjerila njegova kvaliteta dvojbena je odluka, a pokušaj procijeniti putanju svake molekule zraka u kubičnom metru je nemoguć. U takvim slučajevima koristi se metoda selektivnog promatranja: iz opće populacije odabire se (obično nasumično) određeni broj objekata i oni se podvrgavaju njihovoj analizi.
Ovi se koncepti u početku mogu činiti kompliciranima. Stoga, kako biste u potpunosti razumjeli temu, trebate proučiti udžbenik V. E. Gmurmana "Teorija vjerojatnosti i matematička statistika". Dakle, skup za uzorkovanje ili uzorak je niz nasumično odabranih objekata iz općeg skupa. U strogim matematičkim terminima, ovo je niz neovisnih, jednoliko raspoređenih slučajnih varijabli, za svaku od kojih se distribucija podudara s onom naznačenom za opću slučajnu varijablu.
Osnovni koncepti
Razmotrimo ukratko niz drugih osnovnih koncepata matematičke statistike. Broj objekata u općoj populaciji ili uzorku naziva se volumen. Vrijednosti uzorka koje se dobiju tijekom eksperimenta nazivaju se realizacijom uzorka. Kako bi procjena opće populacije na temelju uzorka bila pouzdana, važno je imati tzv. reprezentativan ili reprezentativan uzorak. To znači da uzorak mora u potpunosti predstavljati populaciju. To se može postići samo ako svi elementi populacije imaju jednaku vjerojatnost da budu u uzorku.
Uzorci razlikuju povrat i nepovrat. U prvom slučaju, u sadržaju uzorka, ponovljeni element se vraća u opći skup, u drugom slučaju nije. Obično se u praksi koristi uzorkovanje bez zamjene. Također treba napomenuti da veličina opće populacije uvijek značajno premašuje veličinu uzorka. postojatimnoge opcije za proces uzorkovanja:
- jednostavno - stavke se nasumično biraju jedna po jedna;
- typed - opća populacija je podijeljena na tipove, a od svake se bira; primjer je anketa stanovnika: muškaraca i žena odvojeno;
- mehanički - na primjer, odaberite svaki 10. element;
- serial - odabir se vrši u nizu elemenata.
Statistička distribucija
Prema Gmurmanu, teorija vjerojatnosti i matematička statistika iznimno su važne discipline u znanstvenom svijetu, posebice u njegovom praktičnom dijelu. Razmotrite statističku distribuciju uzorka.
Pretpostavimo da imamo grupu učenika koji su testirani iz matematike. Kao rezultat, imamo skup procjena: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - ovo je naš primarni statistički materijal.
Prije svega, moramo ga sortirati, ili izvršiti operaciju rangiranja: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - i tako dobiti varijacijski niz. Broj ponavljanja svake od procjena naziva se učestalost procjene, a njihov omjer prema veličini uzorka naziva se relativna učestalost. Napravimo tablicu statističke distribucije uzorka, ili samo statističku seriju:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
ili
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Imamo slučajnu varijablu na kojoj ćemo provesti niz eksperimenata i vidjeti koju vrijednost ova varijabla ima. Pretpostavimo da je uzela vrijednost a1 - m1 puta; a2 - m2 puta, itd. Veličina ovog uzorka bit će m1 + … + mk=m. Skup ai, gdje i varira od 1 do k, je statistički niz.
Intervalna distribucija
U knjizi VE Gmurmana "Teorija vjerojatnosti i matematička statistika" također je prikazan intervalni statistički niz. Njegova kompilacija je moguća kada je vrijednost obilježja koja se proučava kontinuirana u određenom intervalu, a broj vrijednosti je velik. Razmotrimo grupu učenika, odnosno njihovu visinu: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 3, 159, 141 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - ukupno 30 učenika. Očito, visina osobe je kontinuirana vrijednost. Moramo definirati korak intervala. Za to se koristi Sturgesova formula.
h= | max - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Tako se kao veličina intervala može uzeti vrijednost 6. Također treba reći da je vrijednost 1+log2m formula zaodređivanje broja intervala (naravno, uz zaokruživanje). Tako se, prema formulama, dobiva 6 intervala, od kojih svaki ima veličinu 6. A prva vrijednost početnog intervala bit će broj određen formulom: min - h / 2=156 - 6/2=153. Napravimo tablicu koja će sadržavati intervale i broj učenika čiji je rast pao unutar određenog intervala.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Naravno, ovo nije sve, jer u matematičkoj statistici postoji mnogo više formula. Razmotrili smo samo neke osnovne koncepte.
Raspored distribucije
Osnovni koncepti matematičke statistike također uključuju grafički prikaz distribucije, koji se odlikuje jasnoćom. Postoje dvije vrste grafova: poligon i histogram. Prvi se koristi za diskretnu statističku seriju. A za kontinuiranu distribuciju, odnosno drugi.