Matematinės statistikos pagrindai. Pagrindinės matematinės statistikos sąvokos Matematinės statistikos klasifikacija

Matematinė statistika yra matematikos šaka, tirianti apytikslius eksperimentinių rezultatų duomenų rinkimo ir analizės metodus, siekiant nustatyti esamus modelius, t.y. atsitiktinių dydžių pasiskirstymo dėsnių ir jų skaitinių charakteristikų radimas.

Matematinės statistikos srityje įprasta išskirti dvi pagrindines tyrimų sritis::

1. Bendrosios populiacijos parametrų įvertinimas.

2. Statistinių hipotezių tikrinimas (kai kurios a priori prielaidos).

Pagrindinės matematinės statistikos sąvokos yra: visuma, imtis, teorinė skirstinio funkcija.

Bendra populiacija yra visų įmanomų statistinių duomenų, gautų iš atsitiktinio dydžio stebėjimų, rinkinys.

X G = (x 1, x 2, x 3, ..., x N, ) = (x i; i = 1, N)

Stebimas atsitiktinis dydis X vadinamas imties požymiu arba faktoriumi. Bendroji visuma yra statistinis atsitiktinio dydžio analogas, jo tūris N paprastai yra didelis, todėl iš jos atrenkama dalis duomenų, vadinama imtimi arba tiesiog imtimi.

X B = (x 1, x 2, x 3, ..., x n, ) = (x i; i = 1, n)

Х В М Х Г, n £ N

Pavyzdys yra atsitiktinai atrinktų stebėjimų (objektų) iš bendrosios populiacijos rinkinys, skirtas tiesioginiam tyrimui. Objektų skaičius imtyje vadinamas imties dydžiu ir žymimas n. Paprastai imtį sudaro 5–10 % populiacijos.

Naudojant imtį, kuriant modelius, kuriems taikomas stebimas atsitiktinis kintamasis, galima išvengti nuolatinio (masinio) stebėjimo, o tai dažnai yra daug išteklių reikalaujantis procesas arba tiesiog neįmanomas.

Pavyzdžiui, populiacija yra individų visuma. Visos populiacijos tyrimas yra daug laiko ir brangus, todėl duomenys renkami iš imties asmenų, kurie laikomi reprezentatyviais tos populiacijos, todėl galima daryti išvadas apie tą populiaciją.

Tačiau pavyzdys turi atitikti sąlygą reprezentatyvumas, t.y. pateikti pagrįstą gyventojų skaičių. Kaip suformuoti reprezentatyvų (reprezentatyvų) imtį? Idealiu atveju jie stengiasi gauti atsitiktinės atrankos imtį. Tam sudaromas visų populiacijos individų sąrašas ir jie atrenkami atsitiktine tvarka. Tačiau kartais sąrašo sudarymo išlaidos gali pasirodyti nepriimtinos, tada jie paima priimtiną mėginį, pavyzdžiui, vieną kliniką, ligoninę ir ištiria visus šios klinikos pacientus, sergančius tam tikra liga.

Kiekvienas pavyzdinis elementas vadinamas variantu. Variantų pasikartojimų skaičius imtyje vadinamas pasikartojimo dažniu. Kiekis vadinamas santykinis dažnis variantai, t.y. randamas kaip variantų absoliutaus dažnio ir viso mėginio tūrio santykis. Iškviečiama didėjimo tvarka parašytų parinkčių seka variacijų serija.


Panagrinėkime tris variacijų eilučių formas: reitinguotą, diskrečiąją ir intervalinę.

Reitinguota serija- tai atskirų populiacijos vienetų sąrašas tiriamos charakteristikos didėjimo tvarka.

Diskretinė variacijų serija yra lentelė, susidedanti iš stulpelių arba eilučių: specifinės charakteristikos x i reikšmės ir charakteristikos x i-osios reikšmės pasireiškimo absoliutaus dažnio n i (arba santykinio dažnio ω i).

Variacijų serijos pavyzdys yra lentelė

Parašykite santykinių dažnių pasiskirstymą.

Sprendimas: Raskime santykinius dažnius. Norėdami tai padaryti, padalykite dažnius iš imties dydžio:

Santykinių dažnių pasiskirstymas yra toks:

0,15 0,5 0,35

Kontrolė: 0,15 + 0,5 + 0,35 = 1.

Atskira serija gali būti pavaizduota grafiškai. Stačiakampėje Dekarto koordinačių sistemoje žymimi taškai su koordinatėmis () arba (), kurie yra sujungti tiesiomis linijomis. Tokia nutrūkusi linija vadinama dažnio daugiakampis.

Sukurkite diskrečiųjų variacijų seriją (DVR) ir nubrėžkite daugiakampį 45 pretendentų pasiskirstymui pagal balų skaičių, kuriuos jie gavo per stojamuosius egzaminus:

39 41 40 42 41 40 42 44 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 44 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42.

Sprendimas: Norėdami sudaryti variacijų eilutę, pateikiame skirtingas charakteristikos x (variantų) reikšmes didėjančia tvarka ir užrašome jos dažnį po kiekviena iš šių reikšmių.

Sukurkime šio skirstinio daugiakampį:

Ryžiai. 13.1. Dažnio daugiakampis

Intervalų variacijų serija naudojamas daugeliui stebėjimų. Norint sukurti tokią seriją, reikia pasirinkti charakteristikos intervalų skaičių ir nustatyti intervalo ilgį. Jei yra daug grupių, intervalas bus minimalus. Variacijų serijos grupių skaičių galima rasti naudojant Sturges formulę: (k yra grupių skaičius, n yra imties dydis), o intervalo plotis yra

kur yra maksimumas; - minimali reikšmė yra pasirinkimo galimybė, o jų skirtumas R vadinamas variacijos diapazonas.

Tiriama 100 žmonių imtis iš visų medicinos universitetų studentų populiacijos.

Sprendimas: Apskaičiuokime grupių skaičių: . Taigi, norint sudaryti intervalų eilutę, geriau šią imtį padalyti į 7 arba 8 grupes. Vadinamas aibė grupių, į kurias skirstomi stebėjimo rezultatai ir kiekvienoje grupėje stebėjimo rezultatų gavimo dažnumas statistinė visuma.

Norėdami vizualiai parodyti statistinį pasiskirstymą, naudokite histogramą.

Dažnio histograma yra laiptuota figūra, susidedanti iš gretimų stačiakampių, pastatytų vienoje tiesėje, kurių pagrindai yra identiški ir lygūs intervalo pločiui, o aukštis lygus arba kritimo į intervalą dažniui, arba santykiniam dažniui ω i.

Stebėjus dalelių, kurios per minutę patenka į Geigerio skaitiklį, skaičius davė tokius rezultatus:

21 30 39 31 42 34 36 30 28 30 33 24 31 40 31 33 31 27 31 45 31 34 27 30 48 30 28 30 33 46 43 30 33 28 31 27 31 36 51 34 31 36 34 37 28 30 39 31 42 37.

Remiantis šiais duomenimis, sudarykite intervalų variacijų eilutę su vienodais intervalais (I intervalas 20-24; II intervalas 24-28 ir kt.) ir nubraižykite histogramą.

Sprendimas: n = 50

Šio skirstinio histograma atrodo taip:

Ryžiai. 13.2. Paskirstymo histograma

Užduočių parinktys

№ 13.1. Kas valandą buvo matuojama įtampa elektros tinkle. Gautos šios vertės (B):

227 219 215 230 232 223 220 222 218 219 222 221 227 226 226 209 211 215 218 220 216 220 220 221 225 224 212 217 219 220.

Sukurkite statistinį skirstinį ir nubrėžkite daugiakampį.

№ 13.2. Cukraus kiekio kraujyje stebėjimas 50 žmonių davė šiuos rezultatus:

3.94 3.84 3.86 4.06 3.67 3.97 3.76 3.61 3.96 4.04

3.82 3.94 3.98 3.57 3.87 4.07 3.99 3.69 3.76 3.71

3.81 3.71 4.16 3.76 4.00 3.46 4.08 3.88 4.01 3.93

3.92 3.89 4.02 4.17 3.72 4.09 3.78 4.02 3.73 3.52

3.91 3.62 4.18 4.26 4.03 4.14 3.72 4.33 3.82 4.03

Remiantis šiais duomenimis, sukonstruoti intervalų variacijų eilutę su vienodais intervalais (I - 3,45-3,55; II - 3,55-3,65 ir kt.) ir pavaizduoti ją grafiškai, nubraižyti histogramą.

№ 13.3. Sukurkite 100 žmonių eritrocitų nusėdimo greičio (ESR) dažnių pasiskirstymo daugiakampį.

Matematinės statistikos metodai yra naudojami, kaip taisyklė, visuose tyrimo medžiagos analizės etapuose, siekiant pasirinkti problemų sprendimo strategiją pagal konkrečius imties duomenis ir įvertinti gautus rezultatus. Medžiagai apdoroti naudoti matematinės statistikos metodai. Matematinis medžiagų apdorojimas leidžia aiškiai nustatyti ir įvertinti objektyvios informacijos kiekybinius parametrus, juos analizuoti ir pateikti įvairiais santykiais bei priklausomybėmis. Jie leidžia nustatyti verčių kitimo matą surinktose medžiagose, kuriose yra kiekybinės informacijos apie tam tikrą atvejų rinkinį, kai kurie iš jų patvirtina siūlomus ryšius, o kai kurie jų neatskleidžia, kad būtų galima apskaičiuoti kiekybinių skirtumų patikimumą. pasirinktų atvejų rinkinius ir gauti kitas matematines charakteristikas, reikalingas teisingam faktų aiškinimui. Tyrimo metu gautų skirtumų patikimumas buvo nustatytas Stjudento t-testu.

Buvo apskaičiuotos šios vertės.

1. Imties aritmetinis vidurkis.

Apibūdina vidutinę nagrinėjamos populiacijos vertę. Pažymime matavimo rezultatus. Tada:

kur Y yra visų reikšmių suma, kai dabartinis indeksas i keičiasi nuo 1 iki n.

2. Vidutinis kvadratinis nuokrypis (standartinis nuokrypis), apibūdinantis nagrinėjamos populiacijos sklaidą, sklaidą, palyginti su aritmetiniu vidurkiu.

= (x max - x min)/ k

kur yra standartinis nuokrypis

xmax – maksimali lentelės reikšmė;

xmin - minimali lentelės reikšmė;

k – koeficientas

3. Standartinė aritmetinio vidurkio paklaida arba reprezentatyvumo paklaida (m). Standartinė aritmetinio vidurkio paklaida apibūdina imties aritmetinio vidurkio nuokrypio nuo visumos aritmetinio vidurkio laipsnį.

Standartinė aritmetinio vidurkio paklaida apskaičiuojama pagal formulę:

čia y yra matavimo rezultatų standartinis nuokrypis,

n – imties dydis. Kuo mažesnis m, tuo didesnis rezultatų stabilumas ir stabilumas.

4. Studento t testas.

(skaitiklyje - skirtumas tarp dviejų grupių vidutinių verčių, vardiklyje - kvadratinė šaknis iš šių vidurkių standartinių paklaidų kvadratų sumos).

Apdorojant tyrimo rezultatus buvo naudojama kompiuterinė programa su Excel paketu.

Tyrimo organizavimas

Tyrimą atlikome pagal visuotinai priimtas taisykles ir atlikome 3 etapais.

Pirmajame etape buvo surinkta ir išanalizuota gauta medžiaga apie nagrinėjamą tyrimo problemą. Susiformavo mokslinio tyrimo objektas. Literatūros analizė šiame etape leido patikslinti tyrimo tikslą ir uždavinius. Buvo atliktas pirminis 30 m bėgimo technikos išbandymas.<... class="gads_sm">

Trečiajame etape buvo susisteminta mokslinių tyrimų metu gauta medžiaga ir apibendrinama visa turima informacija apie tyrimo problemą.

Eksperimentinis tyrimas atliktas Valstybinės švietimo įstaigos „Lyachovičių vidurinė mokykla“ pagrindu, imtį sudarė 20 6 klasių (11-12 m.) mokinių.

3 skyrius. Tyrimo rezultatų analizė

Pedagoginio eksperimento rezultate nustatėme pradinį 30 m bėgimo technikos lygį kontrolinės ir eksperimentinės grupės mokiniams (1-2 priedai). Statistinis gautų rezultatų apdorojimas leido gauti tokius duomenis (6 lentelė).

6 lentelė. Pradinis bėgimo kokybės lygis

Kaip matyti iš 6 lentelės, kontrolinės ir eksperimentinės grupės sportininkų balų vidurkis statistiškai nesiskiria eksperimentinėje grupėje buvo 3,6 balo, o kontrolinėje – 3,7 balo. T testas abiejose grupėse temp=0,3; Р?0,05, kai tcrit=2,1; Pirminio testavimo rezultatai parodė, kad rodikliai nepriklauso nuo mokymo ir yra atsitiktinio pobūdžio. Pirminio testavimo duomenimis, kontrolinės grupės bėgimo kokybės rodikliai buvo šiek tiek aukštesni nei eksperimentinės grupės. Tačiau statistiškai reikšmingų skirtumų grupėse nerasta, o tai įrodo kontrolinės ir eksperimentinės grupės mokinių tapatybę 30 m bėgimo technikoje.

Eksperimento metu abiejose grupėse pagerėjo bėgimo technikos efektyvumą apibūdinantys rodikliai. Tačiau šis pagerėjimas buvo skirtingo pobūdžio skirtingose ​​eksperimento dalyvių grupėse. Treniruotės rezultatas – natūralus nedidelis rodiklių padidėjimas kontrolinėje grupėje (3,8 balo). Kaip matyti iš 2 priedo, eksperimentinėje grupėje buvo pastebėtas didelis rodiklių padidėjimas. Mokiniai mokėsi pagal mūsų pasiūlytą programą, kuri gerokai pagerino jų rezultatus.

7 lentelė. Bėgimo kokybės pokyčiai tarp tiriamųjų eksperimentinėje grupėje

Eksperimento metu mes nustatėme, kad padidintos apkrovos eksperimentinėje grupėje žymiai pagerino greičio vystymąsi nei kontrolinėje grupėje.

Paauglystėje greitį lavinti patartina pirmiausia naudojant kūno kultūros priemones, kuriomis siekiama padidinti judesių dažnumą. Sulaukus 12–15 metų, greičio gebėjimai didėja, nes dažniausiai naudojami greičio, jėgos ir jėgos pratimai, kuriuos naudojome vesdami kūno kultūros pamokas ir užklasinę veiklą krepšinio ir lengvosios atletikos sporto skyriuje.

Vykdant užsiėmimus eksperimentinėje grupėje buvo griežtai pakoreguotas sudėtingumo ir motorinės patirties progresas. Darbas su klaidomis buvo atliktas laiku. Kaip parodė faktinių duomenų analizė, eksperimentinis mokymo metodas reikšmingai pakeitė bėgimo technikos kokybę (temp = 2,4). Eksperimentinėje grupėje gautų rezultatų analizė ir palyginimas su kontrolinėje grupėje gautais duomenimis, taikant visuotinai pripažintus mokymo metodus, leidžia teigti, kad mūsų siūloma metodika padidins mokymo efektyvumą.

Taigi 30 m bėgimo technikos tobulinimo mokykloje etape nustatėme testavimo rodiklių kitimo dinamiką eksperimentinėje ir kontrolinėje grupėse. Po eksperimento technikos kokybė eksperimentinėje grupėje pakilo iki 4,9 balo (t=3,3; P?0,05). Eksperimento pabaigoje bėgimo technikos kokybė eksperimentinėje grupėje pasirodė esanti aukštesnė nei kontrolinės grupės.

Eksperimento metu gauti duomenys pasižymi kintamumu, kurį gali lemti atsitiktinė paklaida: matavimo prietaiso paklaida, mėginių nevienalytiškumas ir kt. Surinkęs didelį kiekį vienarūšių duomenų, eksperimentuotojas turi juos apdoroti, kad išgautų kuo tikslesnę informaciją apie nagrinėjamą kiekį. Norint apdoroti didelius matavimo duomenų, stebėjimų ir kt. kiekius, kuriuos galima gauti eksperimento metu, patogu naudoti matematinės statistikos metodai.

Matematinė statistika yra neatsiejamai susijusi su tikimybių teorija, tačiau tarp šių mokslų yra didelis skirtumas. Tikimybių teorijoje naudojami jau žinomi atsitiktinių dydžių skirstiniai, kurių pagrindu skaičiuojamos įvykių tikimybės, matematinis lūkestis ir kt. Matematinės statistikos uždavinys– gauti patikimiausią informaciją apie atsitiktinio dydžio pasiskirstymą remiantis eksperimentiniais duomenimis.

Tipiškas kryptys matematinė statistika:

  • atrankos teorija;
  • vertinimo teorija;
  • statistinių hipotezių tikrinimas;
  • regresinė analizė;
  • dispersijos analizė.

Matematinės statistikos metodai

Hipotezių vertinimo ir tikrinimo metodai yra pagrįsti tikimybiniais ir hiperatsitiktiniais duomenų kilmės modeliais.

Matematinė statistika įvertina parametrus ir jų funkcijas, atspindinčias svarbias skirstinių charakteristikas (medianą, numatomą reikšmę, standartinį nuokrypį, kvantilius ir kt.), tankius ir pasiskirstymo funkcijas ir kt. Naudojami taškiniai ir intervaliniai įverčiai.

Šiuolaikinėje matematinėje statistikoje yra didelis skyrius - statistinė nuosekli analizė, kuriame iš vieno masyvo galima suformuoti stebėjimų masyvą.

Matematinė statistika taip pat apima bendrąsias hipotezių tikrinimo teorija ir daug metodų, skirtų konkrečių hipotezių tikrinimas(pavyzdžiui, apie skirstinio simetriją, apie parametrų ir charakteristikų reikšmes, apie empirinės pasiskirstymo funkcijos sutapimą su tam tikra pasiskirstymo funkcija, vienalytiškumo tikrinimo hipotezę (charakteristikos ar pasiskirstymo funkcijų sutapimas dviejose). pavyzdžiai) ir kt.).

Vykdant imčių apklausos, susijęs su adekvačių hipotezių vertinimo ir tikrinimo metodų konstravimu, pasižymintis skirtingų atrankos schemų savybėmis, yra matematinės statistikos šaka, turinti didelę reikšmę. Matematinės statistikos metodai tiesiogiai naudoja šias pagrindines sąvokas.

Pavyzdys

1 apibrėžimas

Mėginių ėmimas nurodo duomenis, gautus eksperimento metu.

Pavyzdžiui, kulkos skrydžio nuotolio rezultatai, kai šaudoma iš to paties ar panašių ginklų grupės.

Empirinė pasiskirstymo funkcija

1 pastaba

Paskirstymo funkcija leidžia išreikšti visas svarbiausias atsitiktinio dydžio charakteristikas.

Matematinė statistika turi sąvoką teorinis(iš anksto nežinoma) ir empirinis paskirstymo funkcijos.

Empirinė funkcija nustatoma pagal eksperimentinius duomenis (empirinius duomenis), t.y. pagal pavyzdį.

Histograma

Histogramos naudojamos vizualiai, bet gana apytiksliai nežinomo pasiskirstymo atvaizdavimui.

Histograma yra grafinis duomenų paskirstymo vaizdas.

Norėdami gauti aukštos kokybės histogramą, laikykitės šių nurodymų: taisykles:

  • Mėginio elementų skaičius turi būti žymiai mažesnis už imties dydį.
  • Padalijimo intervaluose turi būti pakankamai imties elementų.

Jei imtis labai didelė, imties elementų intervalas dažnai dalijamas į lygias dalis.

Imties vidurkis ir imties dispersija

Naudodamiesi šiomis sąvokomis, galite gauti būtinų nežinomo skirstinio skaitinių charakteristikų įvertinimą, nekurdami skirstinio funkcijos, histogramos ir pan.

Odesos nacionalinio medicinos universiteto Biofizikos, informatikos ir medicinos įrangos katedros gairės 1 kurso studentams tema „Matematinės statistikos pagrindai“ Odesa 2009 m.

1. Tema: „Matematinės statistikos pagrindai“.

2. Temos aktualumas.

Matematinė statistika – matematikos šaka, tirianti masinių atsitiktinių įvykių stebėjimų rezultatų rinkimo, sisteminimo ir apdorojimo metodus, siekiant išaiškinti ir praktiškai pritaikyti esamus modelius. Matematinės statistikos metodai buvo plačiai pritaikyti klinikinėje medicinoje ir sveikatos priežiūroje. Jie ypač naudojami kuriant matematinius medicinos diagnostikos metodus, epidemijų teorijoje, planuojant ir apdorojant medicininio eksperimento rezultatus, organizuojant sveikatos priežiūrą. Sąmoningai ar nesąmoningai statistinės sąvokos naudojamos priimant sprendimus tokiais klausimais kaip klinikinė diagnozė, atskiro paciento ligos eigos prognozavimas, galimų tam tikros populiacijos programų rezultato numatymas ir tinkamos programos parinkimas konkrečiomis aplinkybėmis. Matematinės statistikos idėjų ir metodų išmanymas yra esminis kiekvieno sveikatos priežiūros darbuotojo profesinio išsilavinimo elementas.

3. Visos klasės. Bendras pamokos tikslas – išmokyti mokinius sąmoningai naudoti matematinę statistiką sprendžiant biomedicininio profilio uždavinius. Konkrečios visos pamokos:
  1. supažindinti studentus su pagrindinėmis matematinės statistikos idėjomis, sąvokomis ir metodais, daugiausia dėmesio skiriant masinių atsitiktinių įvykių stebėjimų rezultatų apdorojimo klausimams, siekiant išsiaiškinti ir praktiškai pritaikyti esamus modelius;
  2. išmokyti studentus sąmoningai taikyti pagrindines matematinės statistikos sąvokas sprendžiant nesudėtingus gydytojo profesinėje veikloje kylančius uždavinius.
Mokinys turi žinoti (2 lygis):
  1. klasės dažnio nustatymas (absoliutus ir santykinis)
  2. bendrojo agregato ir mėginių ėmimo, mėginių ėmimo tūrio nustatymas
  3. taško ir intervalo įvertinimas
  4. patikimas intervalas ir patikimumas
  5. režimo, medianos ir imties vidurkio apibrėžimas
  6. diapazono apibrėžimas, tarpkvartilis diapazonas, kvartilis nuokrypis
  7. vidutinio absoliutaus nuokrypio nustatymas
  8. imties kovariacijos ir dispersijos nustatymas
  9. imties standartinio nuokrypio ir variacijos koeficiento nustatymas
  10. imties regresijos koeficientų nustatymas
  11. empirinės tiesinės regresijos lygtys
  12. imties koreliacijos koeficiento nustatymas.
Studentas turi įsisavinti pagrindinius skaičiavimo įpročius (3 lygis):
  1. režimas, mediana ir imties vidurkis
  2. diapazonas, tarpkvartilis diapazonas, kvartilis nuokrypis
  3. reiškia absoliutų nuokrypį
  4. imties kovariacija ir dispersija
  5. imties standartinis nuokrypis ir variacijos koeficientas
  6. patikimas lūkesčių ir dispersijos intervalas
  7. imties regresijos koeficientai
  8. imties koreliacijos koeficientas.
4. Pamokos tikslų pasiekimo būdai: Pamokos tikslams pasiekti reikia šių pagrindinių žinių:
  1. Diskretinio atsitiktinio dydžio skirstinio, pasiskirstymo eilučių ir daugiamazgio skirstinio apibrėžimas
  2. Funkcinės variacijos tarp atsitiktinių dydžių nustatymas
  3. Koreliacijos tarp atsitiktinių dydžių nustatymas
Taip pat turite mokėti apskaičiuoti nesuderinamų ir suderinamų įvykių tikimybę, naudodami atitinkamas taisykles. 5. Užduotis mokiniams pasitikrinti pradinį žinių lygį. Saugumo klausimai
  1. Blyksnio įvykio apibrėžimas, santykinis dažnis ir tikimybė.
  2. Teorema nesuderinamų įvykių tikimybių sudarymui
  3. Bendrų įvykių tikimybių sudarymo teorema
  4. Nepriklausomų įvykių tikimybių dauginimo teorema
  5. Priklausomų įvykių tikimybių dauginimo teorema
  6. Bendrosios tikimybės teorema
  7. Bayeso teorema
  8. Atsitiktinių dydžių apibrėžimas: diskretieji ir tolydieji
  9. Diskretinio atsitiktinio dydžio skirstinio, skirstinių eilučių ir skirstinio daugiakampio apibrėžimas
  10. Paskirstymo funkcijos apibrėžimas
  11. Paskirstymo centro padėties matų apibrėžimas
  12. Atsitiktinių dydžių dydžių kintamumo matų nustatymas
  13. Ištisinio atsitiktinio dydžio skirstinio storio ir pasiskirstymo kreivės nustatymas
  14. Funkcinės priklausomybės tarp atsitiktinių dydžių nustatymas
  15. Atsitiktinių dydžių koreliacijos nustatymas
  16. Regresijos apibrėžimas, lygtis ir regresijos linijos
  17. Kovariacijos ir koreliacijos koeficiento nustatymas
  18. Tiesinės regresijos lygties apibrėžimas.
6. Informaciją, skirtą pradinių žinių ir įgūdžių stiprinimui, rasite vadovuose:
  1. Zhumatiy P.G. Paskaita „Tikimybių teorija“. Odesa, 2009 m.
  2. Zhumatiy P.G. „Tikimybių teorijos pagrindai“. Odesa, 2009 m.
  3. Zhumatiy P.G., Senitska Y.R. Tikimybių teorijos elementai. Rekomendacijos medicinos instituto studentams. Odesa, 1981 m.
  4. Chaly O.V., Agapov B.T., Tsekhmister Y.V. Medicininė ir biologinė fizika. Kijevas, 2004 m.
7. Šios temos mokomosios medžiagos turinys, išryškinant pagrindines esmines problemas.

Matematinė statistika – tai matematikos šaka, tirianti stebėjimo rezultatų rinkimo, sisteminimo, apdorojimo, vaizdavimo, analizės ir interpretavimo metodus, siekiant nustatyti esamus modelius.

Naudoti statistiką sveikatos priežiūros srityje būtina tiek bendruomenės, tiek atskirų pacientų lygmeniu. Medicina susiduria su asmenimis, kurie skiriasi vienas nuo kito daugeliu savybių, o vertybės, pagal kurias žmogus gali būti laikomas sveiku, skiriasi kiekvienam asmeniui. Nėra dviejų visiškai vienodų pacientų ar pacientų grupių, todėl sprendimai, turintys įtakos atskiriems pacientams ar populiacijoms, turi būti priimami remiantis patirtimi, įgyta iš kitų pacientų ar populiacijų, turinčių panašias biologines savybes. Būtina suvokti, kad, atsižvelgiant į esamus neatitikimus, šie sprendimai negali būti absoliučiai tikslūs – jie visada yra susiję su tam tikru neapibrėžtumu. Būtent tokia yra virusinė medicinos prigimtis.

Keletas statistinių metodų taikymo medicinoje pavyzdžių:

variacijos aiškinimas (organizmo savybių kintamumas sprendžiant, kokia vienos ar kitos charakteristikos reikšmė bus ideali, normali, vidutinė ir pan., todėl būtina naudoti atitinkamus statistinius metodus).

atskirų pacientų ligų diagnostika ir gyventojų grupės sveikatos būklės įvertinimas.

numatant atskirų pacientų ligos pabaigą arba galimą konkrečios ligos kontrolės programos rezultatą bet kurioje gyventojų grupėje.

pasirenkant tinkamą poveikį pacientui ar gyventojų grupei.

planuoti ir atlikti medicininius tyrimus, analizuoti ir publikuoti rezultatus, juos skaityti ir kritiškai vertinti.

sveikatos priežiūros planavimas ir valdymas.

Naudinga informacija apie sveikatą paprastai yra paslėpta neapdorotų duomenų masėse. Reikia sukoncentruoti juose esančią informaciją ir pateikti duomenis taip, kad būtų aiškiai matoma variacijos struktūra, o tada parinkti konkrečius analizės metodus.

Duomenų pateikimas pateikia įvadą į šias sąvokas ir terminus:

variacijų serija (tvarkingas išdėstymas) – paprastas atskirų kiekio stebėjimų išdėstymas.

klasė yra vienas iš intervalų, į kuriuos padalintas visas atsitiktinio dydžio reikšmių diapazonas.

kraštutiniai klasės taškai - vertės, kurios riboja klasę, pavyzdžiui, 2,5 ir 3,0, apatinė ir viršutinė klasės ribos 2,5 - 3,0.

(absoliutus) klasės dažnis – stebėjimų klasėje skaičius.

santykinis klasės dažnis – absoliutus klasės dažnis, išreikštas viso stebėjimų skaičiaus dalimi.

klasės kaupiamasis (kaupiamasis) dažnis – stebėjimų skaičius, lygus visų ankstesnių klasių ir šios klasės dažnių sumai.

Stovptsev diagrama - grafinis duomenų dažnių pavaizdavimas vardinėms klasėms naudojant stulpelius, kurių aukščiai yra tiesiogiai proporcingi klasės dažniams.

skritulinė diagrama – vardinių klasių duomenų dažnių grafinis pavaizdavimas naudojant apskritimo sektorius, kurių plotai yra tiesiogiai proporcingi klasės dažniams.

histograma – kiekybinių duomenų dažnio pasiskirstymo grafinis vaizdas su stačiakampių plotais, tiesiogiai proporcingais klasės dažniams.

dažnio daugiakampis – kiekybinių duomenų dažninio pasiskirstymo grafikas; klasės dažnį atitinkantis taškas yra virš intervalo vidurio, kiekvienas du gretimi taškai yra sujungti tiesia atkarpa.

ogive (kumuliacinė kreivė) – kaupiamųjų santykinių dažnių pasiskirstymo grafikas.

Visiems medicininiams duomenims būdingas kintamumas, todėl matavimo rezultatų analizė yra pagrįsta informacijos apie tai, kokias vertes gavo tiriamasis atsitiktinis kintamasis, tyrimu.

Visų galimų atsitiktinio dydžio reikšmių rinkinys vadinamas bendruoju.

Atlikus testus užregistruota bendrosios visumos dalis vadinama imtimi.

Į imtį įtrauktų stebėjimų skaičius vadinamas imties tūriu (dažniausiai žymimas n).

Atrankos metodo užduotis yra panaudoti gautą rinkėją, kad būtų galima teisingai įvertinti tiriamą atsitiktinį dydžiui. Todėl pagrindinis reikalavimas imčiai yra maksimalus visų bendrosios visumos ypatybių atspindys Imtis, kuri tenkina šį reikalavimą, yra vadinama reprezentatyvia Imties reprezentatyvumas lemia vertinimo kokybę, tai yra atitikimo laipsnį įvertinimo pagal parametrą, kurį jis apibūdina.

Vertinant populiacijos parametrus pagal rinkėją (parametrinis įvertinimas), naudojamos šios sąvokos:

taškinis įvertinimas – populiacijos parametro įvertinimas vienos reikšmės pavidalu, kurią jis gali gauti su didžiausia tikimybe.

intervalo įvertinimas - populiacijos parametro įvertinimas reikšmių intervalo pavidalu, kuris turi tam tikrą tikimybę padengti tikrąją vertę.

Naudojant intervalų vertinimą, naudojama sąvoka:

patikimas intervalas - reikšmių intervalas, turintis tam tikrą tikimybę padengti tikrąją populiacijos parametro vertę intervalo įvertinimo metu.

patikimumas (reliable probability) – tikimybė, su kuria patikimas intervalas apima tikrąją populiacijos parametro reikšmę.

patikimos ribos – apatinė ir viršutinė patikimo intervalo ribos.

Išvados, gautos matematinės statistikos metodais, visada pagrįstos ribotu, selektyviniu stebėjimų skaičiumi, todėl natūralu, kad antrosios imties rezultatai gali skirtis. Ši aplinkybė lemia matematinės statistikos išvadų tarptautiškumą ir dėl to plačiai paplitusį tikimybių teorijos panaudojimą statistinių tyrimų praktikoje.

Tipiškas statistinio tyrimo kelias yra:

Stebėjimo duomenimis įvertinę dydžius ar ryšius tarp jų, jie daro prielaidą, kad tiriamą reiškinį galima apibūdinti vienu ar kitu stochastiniu modeliu.

naudojant statistinius metodus, šią prielaidą galima patvirtinti arba atmesti; patvirtinus, tikslas pasiektas – rastas modelis, apibūdinantis tiriamus modelius, priešingu atveju tęsiamas darbas, iškeliant ir tikrinant naują hipotezę.

Imties statistinių įverčių apibrėžimas:

režimas yra reikšmė, kuri dažniausiai pasitaiko rinkėjui,

mediana – variacijų eilutės centrinė (vidutinė) reikšmė

diapazonas R - skirtumas tarp didžiausių ir mažiausių verčių stebėjimų serijoje

procentiliai – vertė variacijų eilutėje, kuri skirstymą padalija į 100 lygių dalių (taigi mediana bus penkiasdešimtasis procentilis)

pirmasis kvartilis – 25 procentilis

trečiasis kvartilis – 75 procentilis

tarpkvartilis – skirtumas tarp pirmojo ir trečiojo kvartilių (apima centrinę 50 % stebėjimų)

kvartilis nuokrypis – pusė tarpkvartilio diapazono

imties vidurkis – visų imties verčių aritmetinis vidurkis (matematinės lūkesčių imties įvertinimas)

vidutinis absoliutus nuokrypis - nuokrypių nuo atitinkamos pradžios suma (neatsižvelgiant į ženklą), padalyta iš mėginio tūrio

vidutinis absoliutus nuokrypis nuo imties vidurkio apskaičiuojamas pagal formulę

imties dispersija (X) – (imties dispersijos įvertis) pateikiama pagal

imties kovariacija -- (kovariacijos imties įvertinimas K ( X,Y )) lygus

Y imties regresijos koeficientas X (Y regresijos koeficiento imties įvertis ant X) yra lygus

empirinė tiesinės regresijos lygtis Y ant X turi formą

imties regresijos koeficientas X ant Y (X regresijos koeficiento imties įvertis Y) yra lygus

empirinė tiesinės regresijos X lygtis ant Y turi formą

imties standartinis nuokrypis s(X) – (standartinio nuokrypio imties įvertinimas) yra lygus imties dispersijos kvadratinei šaknei

imties koreliacijos koeficientas – (koreliacijos koeficiento imties įvertinimas) lygus

imties variacijos koeficientas  - (variacijos koeficiento CV imties įvertinimas) yra lygus

.

8. Savarankiško mokinių paruošimo užduotis. 8.1 Užduotis savarankiškai studijuoti temos medžiagą.

8.1.1 Praktinis imties įverčių skaičiavimas

Praktinis imties taškų įverčių skaičiavimas

1 pavyzdys.

Ligos trukmė (dienomis) 20 plaučių uždegimo atvejų buvo:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Nustatykite režimą, medianą, diapazoną, tarpkvartilinį diapazoną, imties vidurkį, vidutinį absoliutų nuokrypį nuo imties vidurkio, mėginio dispersiją, imties variacijos koeficientą.

Rozv"zok.

Atrankos variantų serija turi formą

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

Mada

Dažniausias rinkėjo skaičius yra 13. Todėl režimo reikšmė rinkėjuje bus šis skaičius.

Mediana

Kai variacijų eilutėje yra stebėjimų pora, mediana yra lygi dviejų centrinių serijos dalių, šiuo atveju 11 ir 13, vidurkiui, taigi mediana yra 12.

Taikymo sritis

Mažiausia rinkėjo reikšmė yra 6, o didžiausia - 16, taigi R = 10.

Interkvartilis diapazonas, kvartilis nuokrypis

Variacijų eilutėje ketvirtadalis visų duomenų turi mažesnę reikšmę nei 8 lygis, taigi pirmasis kvartilis yra 8, o 75 % visų duomenų yra mažesnė arba 12 lygis, taigi trečiasis kvartilis yra 14. Taigi , tarpkvartilis yra 6, o kvartilio nuokrypis yra 3.

Pavyzdžio vidurkis

Visų imties verčių aritmetinis vidurkis yra lygus

.

Vidutinis absoliutus nuokrypis nuo imties vidurkio

.

Imties dispersija

Mėginio standartinis nuokrypis

.

Birko variacijos koeficientas

.

Toliau pateiktame pavyzdyje nagrinėsime paprasčiausias stochastinės priklausomybės tarp dviejų atsitiktinių dydžių tyrimo priemones.

2 pavyzdys.

Tiriant pacientų grupę gauti duomenys apie ūgį H (cm) ir cirkuliuojančio kraujo tūrį V (l):

Raskite empirines tiesinės regresijos lygtis.

Rozv"zok.

Pirmas dalykas, kurį reikia apskaičiuoti, yra:

imties vidurkis

imties vidurkis

.

Antras dalykas, kurį reikia apskaičiuoti, yra:

imties dispersija (H)

imties dispersija (V)

imties kovariacija

Trečia, yra imties regresijos koeficientų apskaičiavimas:

imties regresijos koeficientas V ant H

imties regresijos koeficientas H ant V

.

Ketvirta, užrašykite reikiamas lygtis:

empirinė tiesinės regresijos lygtis V ties H turi formą

empirinė tiesinės regresijos H lygtis ant V turi formą

.

3 pavyzdys.

Naudodamiesi 2 pavyzdžio sąlygomis ir rezultatais, apskaičiuokite koreliacijos koeficientą ir 95% patikimumo tikimybe patikrinkite žmogaus ūgio ir cirkuliuojančio kraujo tūrio koreliacijos egzistavimo patikimumą.

Rozv"zok.

Koreliacijos koeficientas yra susijęs su regresijos koeficientais ir praktiškai naudinga formule

.

Pavyzdiniam koreliacijos koeficiento įvertinimui ši formulė turi formą

.

Naudodami imties regresijos koeficientų reikšmes ir 2 pavyzdyje, gauname

.

Koreliacijos tarp atsitiktinių dydžių patikimumo tikrinimas (darant prielaidą, kad kiekvienam iš jų yra normalus pasiskirstymas) atliekamas taip:

  • apskaičiuokite T reikšmę

  • koeficientą raskite Studentų pasiskirstymo lentelėje

  • koreliacijos tarp atsitiktinių dydžių egzistavimas patvirtinamas atliekant nelygumus

.

Kadangi 3,5 > 2,26, tada su 95% patikima tikimybe, kad yra ryšys tarp paciento ūgio ir cirkuliuojančio kraujo tūrio, jis gali būti laikomas nustatytu.

Matematinių lūkesčių ir dispersijos intervalų įverčiai

Jei atsitiktinis dydis turi normalųjį pasiskirstymą, matematinių lūkesčių ir dispersijos intervalų įverčiai apskaičiuojami tokia seka:

1.rasti imties vidurkį;

2. apskaičiuoti imties dispersiją ir imties standartinį nuokrypį s;

3. Stjudento pasiskirstymo lentelėje, naudojant patikimą tikimybę  ir imties tūrį n, raskite Stjudento koeficientą;

4. Patikimas matematinio lūkesčio intervalas užrašomas formoje

5.paskirstymo lentelėje "> ir imties tūryje raskite koeficientus

;

6. Formoje užrašomas patikimas dispersijos intervalas

Patikimo intervalo reikšmė, patikimoji tikimybė ir atrankos tūris priklauso vienas nuo kito. Tiesą sakant, požiūris

mažėja didėjant n, taigi, esant pastoviai patikimo intervalo reikšmei, u didėja didėjant n. Esant pastoviai patikimai tikimybei, didėjant vibratoriaus garsui, patikimo intervalo reikšmė mažėja. Planuojant medicininius tyrimus, ši jungtis naudojama norint nustatyti minimalų mėginių ėmimo tūrį, kuris užtikrins reikiamas patikimo intervalo ir patikimos tikimybės reikšmes pagal sprendžiamos problemos sąlygas.

5 pavyzdys.

Naudodami 1 pavyzdžio sąlygas ir rezultatus raskite matematinių lūkesčių ir dispersijos intervalų įverčius 95% patikimai tikimybei.

Rozv"zok.

1 pavyzdyje nustatomi matematinio lūkesčio (imties vidurkis =12), dispersijos (imties dispersija =10,7) ir standartinio nuokrypio (imties standartinis nuokrypis) taškiniai įverčiai. Mėginio tūris yra n = 20.

Iš Studentų skirstymo lentelės randame koeficiento reikšmę

Toliau apskaičiuojame patikimo intervalo pusę pločio

ir užrašykite matematinio lūkesčio intervalinį įvertį

10,5 < < 13,5 при = 95%

Iš Pearsono pasiskirstymo lentelės „chi kvadratas“ randame koeficientus

apskaičiuokite apatinę ir viršutinę patikimas ribas

ir formoje parašykite dispersijos intervalo įvertinimą

6,2 23 at = 95 % .

8.1.2. Problemos, kurias reikia spręsti savarankiškai

Savarankiškam sprendimui siūlomos 5.4 C 1 – 8 uždaviniai (P.G. Zhumatiy. „Matematinis medicininių ir biologinių duomenų apdorojimas. Problemos ir pavyzdžiai.“ Odesa, 2009, p. 24-25)

8.1.3. Saugumo klausimai
  1. Klasių dažnis (absoliutus ir santykinis).
  2. Populiacija ir imtis, imties dydis.
  3. Taškų ir intervalų įvertinimas.
  4. Patikimas intervalas ir patikimumas.
  5. Režimas, mediana ir imties vidurkis.
  6. Diapazonas, tarpkvartilinis diapazonas, ketvirčio nuokrypis.
  7. Vidutinis absoliutus nuokrypis.
  8. Imties kovariacija ir dispersija.
  9. Imties standartinis nuokrypis ir variacijos koeficientas.
  10. Imties regresijos koeficientai.
  11. Empirinės regresijos lygtys.
  12. Koreliacijos koeficiento apskaičiavimas ir koreliacijos patikimumas.
  13. Normalaus pasiskirstymo atsitiktinių dydžių intervalų įverčių konstravimas.
8.2 Pagrindinė literatūra
  1. Zhumatiy P.G. „Matematinis medicininių ir biologinių duomenų apdorojimas. Užduotys ir pavyzdžiai“. Odesa, 2009 m.
  2. Zhumatiy P.G. Paskaita „Matematinė statistika“. Odesa, 2009 m.
  3. Zhumatiy P.G. „Matematinės statistikos pagrindai“. Odesa, 2009 m.
  4. Zhumatiy P.G., Senitska Y.R. Tikimybių teorijos elementai. Rekomendacijos medicinos instituto studentams. Odesa, 1981 m.
  5. Chaly O.V., Agapov B.T., Tsekhmister Y.V. Medicininė ir biologinė fizika. Kijevas, 2004 m.
8.3 Tolesnis skaitymas
  1. Remizovas O.M. Medicininė ir biologinė fizika. M., „Aukštoji mokykla“, 1999 m.
  2. Remizovas O.M., Isakova N.Kh., Maksina O.G.. Medicininės ir biologinės fizikos problemų rinkinys. M., ., „Aukštoji mokykla“, 1987 m.
Metodinius nurodymus sudarė doc. P. G. Žumatijus.

ATSITIKTINIAI KINTAMAI IR JŲ PASKIRSTYMO DĖSNIAI.

Atsitiktinis Jie vadina kiekį, kurio reikšmės priklauso nuo atsitiktinių aplinkybių derinio. Išskirti diskretiškas ir atsitiktinai tęstinis kiekiai.

Diskretus Dydis vadinamas, jei jis įgauna skaičiuojamą reikšmių rinkinį. ( Pavyzdys: pacientų skaičius pas gydytoją, raidžių skaičius puslapyje, molekulių skaičius tam tikrame tūryje).

Nuolatinis yra dydis, kuris gali įgyti reikšmes per tam tikrą intervalą. ( Pavyzdys: oro temperatūra, kūno svoris, žmogaus ūgis ir kt.)

Paskirstymo dėsnis Atsitiktinis dydis yra galimų šio kintamojo reikšmių ir, atitinkančių šias reikšmes, tikimybių (arba pasireiškimo dažnių) rinkinys.

PAVYZDYS:

x x 1 x 2 x 3 x 4 ... x n
p 1 p 2 p 3 p 4 p ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

ATSITIKTINIŲ KINTAMŲJŲ SKAITINĖS CHARAKTERISTIKOS.

Daugeliu atvejų kartu su atsitiktinio dydžio pasiskirstymu arba vietoj jo informaciją apie šiuos dydžius galima pateikti skaitiniais parametrais, vadinamais atsitiktinio dydžio skaitinės charakteristikos . Dažniausiai iš jų:

1 .Laukimas - Atsitiktinio dydžio (vidutinė reikšmė) yra visų jo galimų reikšmių sandaugų ir šių reikšmių tikimybių suma:

2 .Sklaida atsitiktinis kintamasis:


3 .Standartinis nuokrypis :

„TRIJŲ SIGMŲ“ taisyklė - jei atsitiktinis dydis paskirstomas pagal normalųjį dėsnį, tai šios reikšmės nuokrypis nuo vidutinės vertės absoliučia verte neviršija standartinio nuokrypio trijų kartų

GAUSS TEISĖ – NORMALUS PASKIRSTYMO TEISĖ

Dažnai yra paskirstomi kiekiai normalus įstatymas (Gauso dėsnis). Pagrindinė savybė : tai yra ribojantis dėsnis, kuriam taikomi kiti paskirstymo dėsniai.

Atsitiktinis dydis pasiskirsto pagal normalųjį dėsnį, jei jis tikimybių tankis turi formą:



M(X)- matematinis atsitiktinio dydžio lūkestis;

s- standartinis nuokrypis.

Tikimybių tankis(paskirstymo funkcija) parodo, kaip kinta intervalui priskirta tikimybė dx atsitiktinis kintamasis, priklausomai nuo paties kintamojo reikšmės:


PAGRINDINĖS MATEMATINĖS STATISTIKOS SĄVOKOS

Matematinė statistika- taikomosios matematikos šaka, tiesiogiai susijusi su tikimybių teorija. Pagrindinis skirtumas tarp matematinės statistikos ir tikimybių teorijos yra tas, kad matematinė statistika nenagrinėja pasiskirstymo dėsnių ir atsitiktinių dydžių skaitinių charakteristikų veiksmų, o apytikslius šių dėsnių ir skaitinių charakteristikų nustatymo metodus, pagrįstus eksperimentų rezultatais.

Pagrindinės sąvokos Matematinė statistika yra tokia:

1. Bendra populiacija;

2. pavyzdys;

3. variacijų serija;

4. mada;

5. mediana;

6. procentilė,

7. dažnio daugiakampis,

8. histograma.

Gyventojų skaičius- didelė statistinė visuma, iš kurios atrenkama dalis tyrimams skirtų objektų

(Pavyzdys: visi regiono gyventojai, tam tikro miesto universiteto studentai ir kt.)

Imtis (imties visuma)- objektų rinkinys, atrinktas iš bendrosios populiacijos.

Variacijų serija- statistinis pasiskirstymas, susidedantis iš variantų (atsitiktinio dydžio reikšmių) ir juos atitinkančių dažnių.

Pavyzdys:

X, kg
m

x- atsitiktinio dydžio reikšmė (10 metų mergaičių svoris);

m- pasireiškimo dažnumas.

Mada– atsitiktinio dydžio reikšmė, atitinkanti didžiausią pasireiškimo dažnumą. (Aukščiau pateiktame pavyzdyje mada atitinka reikšmę 24 kg, ji ​​dažniau nei kiti: m = 20).

Mediana– atsitiktinio dydžio reikšmė, dalijanti pasiskirstymą per pusę: pusė reikšmių yra medianos dešinėje, pusė (ne daugiau) – kairėje.

Pavyzdys:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

Pavyzdyje stebime 40 atsitiktinio dydžio reikšmių. Visos reikšmės yra išdėstytos didėjančia tvarka, atsižvelgiant į jų atsiradimo dažnumą. Matote, kad 7 paryškintos reikšmės dešinėje yra 20 (pusė) iš 40 reikšmių. Todėl 7 yra mediana.

Sklaidai apibūdinti rasime ne didesnes nei 25 ir 75% matavimo rezultatų vertes. Šios vertės vadinamos 25 ir 75 procentiliai . Jei mediana skirstinį padalija per pusę, tai 25 ir 75 procentiliai nupjaunami ketvirtadaliu. (Pati mediana, beje, gali būti laikoma 50 procentiliu.) Kaip matyti iš pavyzdžio, 25 ir 75 procentiliai yra atitinkamai lygūs 3 ir 8.

Naudokite diskretiškas (taškinis) statistinis pasiskirstymas ir tęstinis (intervalinis) statistinis pasiskirstymas.

Aiškumo dėlei statistiniai pasiskirstymai formoje pavaizduoti grafiškai dažnių diapazonas arba - histogramos .

Dažnio daugiakampis- trūkinė linija, kurios atkarpos jungia taškus su koordinatėmis ( x 1, m 1), (x 2, m 2), ..., arba už santykinio dažnio daugiakampis – su koordinatėmis ( x 1,р * 1), (x 2 ,р ​​* 2), ...(1 pav.).


m m i / n f(x)

1 pav.2 pav

Dažnio histograma- gretimų stačiakampių rinkinys, pastatytas ant vienos tiesios linijos (2 pav.), stačiakampių pagrindai yra vienodi ir lygūs dx , o aukščiai lygūs dažnio santykiui su dx , arba p* Į dx (tikimybių tankis).

Pavyzdys:

x, kg 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Dažnio daugiakampis

Santykinio dažnio ir intervalo pločio santykis vadinamas tikimybės tankis f(x)=m i / n dx = p* i / dx

Histogramos sudarymo pavyzdys .

Naudokime duomenis iš ankstesnio pavyzdžio.

1. Klasių intervalų skaičiaus apskaičiavimas

Kur n - stebėjimų skaičius. Mūsų atveju n = 100 . Taigi:

2. Intervalo pločio skaičiavimas dx :

,

3. Intervalų serijos sudarymas:

dx 2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Histograma