Matematik statistika metodlari (2) - Annotatsiya. Turli soha mutaxassislari uchun matematik statistika Matematik statistikaning qisqacha usullari

Matematik statistika - Statistik ma'lumotlarni tizimlashtirish va ilmiy va amaliy maqsadlarda foydalanish haqidagi fan.

Psixologiyada matematik statistika

Psixologiyada fan sifatida matematik statistika juda keng qo'llaniladi. Muayyan usullardan, masalan, testdan foydalangan holda, raqamlar inson xatti-harakatlarining turli xususiyatlari bilan taqqoslanadi (miqyosda) va bu raqamlar allaqachon matematik statistika usullaridan foydalangan holda ishlanadi. Ushbu usullarni qo'llaganidan so'ng, talqin qilinishi kerak bo'lgan yangi ma'lumotlar olinadi.

Matematik statistikadan foydalanmagan holda, psixologiya faraz va taxminlarga asoslangan (masalan, psixoanalizda bo'lgani kabi) ancha tekis va informatsion fan bo'lar edi. Albatta, matematik statistikadan foydalanish chayqovchilik va chayqovchilikka qarshi “antidot” emas, lekin muhokama mavzusi ancha boyib boradi.

Keling, matematik statistikadan foydalanishning odatiy va oddiy holatini ko'rib chiqaylik. Aytaylik, kimdir bir guruh maktab o'quvchilari ustida tadqiqot o'tkazdi. Boshqalar qatorida, ekstraversiya-introversiya va aql darajasi kabi parametrlar topildi. Tadqiqot psixologi ushbu parametrlarning bir-biri bilan qanday bog'liqligi bilan qiziqdi. Introvertlar o'rtacha hisobda ekstrovertlarga qaraganda aqlliroq ekanligi rostmi? Buning uchun sub'ektlar guruhini (namuna) ikkita kichik guruhga bo'lish mumkin: ekstrovertlar va introvertlar. Keyinchalik, har bir kichik guruh uchun aql darajasi uchun o'rtacha arifmetik topiladi. Aytaylik, introvertlarning o'rtacha IQ darajasi yuqori bo'lsa, ular ekstrovertlarga qaraganda aqlliroqdir. Bu bir yondashuv. Yana bir narsa sub'ektlarni yuqori IQ (100 dan ortiq) va past IQ (100 dan kam) bo'lgan kichik guruhga bo'lish va keyin har bir guruhdagi ekstraversiya-introversiya uchun o'rtacha qiymatni hisoblash bo'lishi mumkin. Uchinchi yondashuv kichik guruhlarga bo'linish va o'rtacha ko'rsatkichlarni hisoblash o'rniga, yanada murakkab usul, korrelyatsiya tahlilidan foydalanish bo'lishi mumkin. Ushbu uchta usulning barchasi bir-biridan farq qiladi, lekin bir xil aloqani ko'rsatadi.

Matematik statistika qiziqarli, ba'zan hayratlanarli kashfiyotlar qilish imkonini beradi. Keling, taxminiy misolimiz bilan davom etaylik. Aytaylik, psixolog o'zining o'tmish tajribasi va bilimlariga zid bo'lgan paradoksal natija topdi. Aytaylik, u bir maktabda ekstrovertlar introvertlarga qaraganda aqlliroq ekanligini aniqladi, garchi boshqa barcha maktablarda buning aksi bo'lsa ham. Nega bunday? Ehtiyotkor psixolog o'z tadqiqotini boshlashi mumkin va buni aniqlay oladi, masalan, bu maktabda ekstrovertlar fizika fani fani bo'yicha (chunki u erda "g'aroyib o'qituvchi" bor) va o'zlarining aql-zakovatlarini rivojlantiradilar, introvertlar esa maktabga boradilar. adabiyot tanlovi (chunki "ruh o'qituvchisi" bor), bu erda ular o'z qalbining boshqa fazilatlarini rivojlantiradilar. Masalan, psixoanalitik bunday kashfiyotga erisha oladimi? Katta ehtimol bilan.

Psixologik tadqiqotlarda nafaqat sof psixologik parametrlar, masalan, aql-idrok, ekstroversiya yoki tashvish kabilar hisobga olinadi. Yosh, jins, ta'lim darajasi, bo'y, vazn, jismoniy kuch, siyosiy qarashlar, ish tajribasi va boshqalar kabi ma'lumotlardan ham foydalanish mumkin. Ko'pincha shunday bo'ladiki, bunday psixologik bo'lmagan ko'rsatkichlarsiz tadqiqot to'liq va ma'lumotsiz bo'lib chiqadi. Ko'pincha boshqa fanlar (masalan, sotsiologiya yoki biologiya) vakillari ham o'z tadqiqotlarida psixologik parametrlardan foydalanadilar.

Matematik statistika ko'p narsaga imkon beradi:

Amaliy psixologlar o'z ishlarida odatda kichik guruhlarga bo'lingan (yuqoridagi misolda bo'lgani kabi) o'rtacha arifmetik qiymatni topish bilan cheklanadi. Psixologlar turli xil matematik statistika usullaridan foydalanadilar. Keling, asosiylarini ko'rib chiqaylik.

O'rtacha arifmetik qiymatni topish

Eng oddiy va oddiy usul. Ko'rsatkichlar (masalan, mavzularning balandligi) qo'shiladi va keyin mavzular soniga bo'linadi. Oddiyligiga qaramay, usul, albatta, juda informatsion va ingl. Vizualizatsiya amaliy psixolog uchun usulning muhim sifati hisoblanadi. U o'z tadqiqotining natijalarini mijozga (masalan, maktab direktoriga) taqdim etganda, u har doim ham korrelyatsiya yoki dispersiya tahlilining mohiyatini tushuna olmaydi. Mavzularni o'zboshimchalik asosida kichik guruhlarga bo'lish o'rtacha arifmetik potentsialni oshiradi, bu esa tadqiqotchi ehtiyojlarining ko'p qismini qoplash imkonini beradi.

Rejim va medianani topish

Aytaylik, biz 1000 nafar talabani tekshirdik va ularning balandligini santimetrgacha o'lchadik. Ushbu ma'lumotlar jadvalga kiritilgan. Jadvaldagi eng keng tarqalgan qiymat, aytaylik, 172 santimetr bo'lsa, bu moda bizning namunamiz. Aytgancha, "moda" so'zi kundalik hayotda xuddi shunday qo'llaniladi: agar bu mavsumda siz qizil shlyapalarni tez-tez ko'rsangiz, bu moda degani, garchi bu shlyapalarning ulushi atigi 20 yoki 30 foizni tashkil qilishi mumkin.

Psixologik tadqiqotlarda rejim odatda arifmetik o'rtacha atrofida bo'ladi. Agar moda 172 sm bo'lsa, unda o'rtacha bu haqida bo'ladi. Namuna qanchalik katta bo'lsa, rejim va arifmetik o'rtacha yaqinroq bo'ladi.

Keyingisi. Faraz qilaylik, biz o‘quvchilarimizni ikkita teng guruhga ajratdik: birinchi guruhda 500 nafar past bo‘yli talabalar, ikkinchi guruhda 500 nafar oliy o‘quvchilar bor. 500-chi yoki 501-chi talabaga to'g'ri keladigan o'sish qiymati median. Median odatda arifmetik o'rtachaga yaqin bo'ladi.

Tarqalgan qiymatlarni aniqlash

Ma'lumki, shifoxonadagi o'rtacha harorat unchalik muhim emas. Va yaxshi kasalxonada, ular yaxshi davolanadi, o'rtacha harorat 36,6 ° S bo'lishi mumkin; va yomon vaziyatda ham xuddi shunday bo'lishi mumkin: faqat kimdir 40 ° C isitmasi bor, va kimdir allaqachon vafot etgan va 18 ° S.

Namuna dispersiyasini baholashning eng oson usuli uni topishdir qamrovi(aks holda - tarqoq). Agar bizning namunamizdagi eng past o'quvchining bo'yi 148 sm, eng bo'yi esa 205 sm bo'lsa, unda namuna diapazoni 205-148 = 57 sm bo'ladi.

Keyingisi. Keling, bu vaziyatni taxmin qilaylik. Yigirma yildan keyin qandaydir bir boyning xohishiga ko‘ra, uning klon farzandlari bo‘ladi. Yana yigirma yildan keyin ular universitetga boradilar. Universitetda esa 1000 kishidan iborat talabalar namunasi bo'ladi, ulardan 998 nafarining bo'yi 177 sm, biri 148 sm, biri 205 sm asosiy parametrlar bo'yicha - o'rtacha arifmetik, rejim, median, diapazon - bu namuna talabalarning boshqa namunasidan farq qilmasligi mumkin (xuddi shunday qiymatlar mavjud). Ammo shu bilan birga, ikkinchi (normal) namunada bo'yi 150-160 sm, ba'zilari 180-190 sm va hokazo bo'lgan ma'lum miqdordagi o'quvchilar bo'ladi. Shunday qilib, matematik statistika nuqtai nazaridan bu guruhlar bir xil ekanligi ma'lum bo'ldi?

Guruhlar qadriyatlarning tarqalishida farqlanishini tushunish uchun bu raqamga bir qarash kifoya. Shuning uchun, statistikada dispersiyani baholash uchun aniqroq vosita mavjud - dispersiya. Dispersiya quyidagicha hisoblanadi: o'rtacha arifmetikni toping, so'ngra har bir holat uchun o'rtacha qiymatdan chetlanishni toping, bu qiymatni kvadratga aylantiring va nihoyat holatlarning umumiy soniga bo'ling. Variant qiymatidan uni olish oson standart og'ish: bu dispersiyaning kvadrat ildizidir. Standart og'ish, tushunarli, standart og'ish degan ma'noni anglatadi: ya'ni qiymatlarning o'rtacha qancha og'ishini o'lchovi.

Standart og'ish parametrning o'zi bilan bir xil birliklarda o'lchanadi. Deyarli barcha talabalar bir xil bo'lgan birinchi gipotetik guruhimizda standart og'ish juda kichik (1 sm dan kam) bo'ladi. Ikkinchi guruhda juda ko'p bo'ladi - 10-15 santimetr. Agar bizga o'quvchilarning o'rtacha bo'yi 12 sm standart og'ish bilan 175 sm, deb aytilgan bo'lsa, biz o'quvchilarning aksariyati (taxminan 2/3) 163 dan 187 sm gacha bo'lganligini bilib olamiz.

Talabaning t-testi

Aytaylik, biz bunday tajriba o'tkazishga qaror qildik. Biz bir guruh mavzularni oldik. Tajriba boshlanishidan oldin ular, aytaylik, ijodkorlik darajasi bo'yicha sinovdan o'tkazildi. Keyin ular bir oy davomida kuniga bir soat rasm chizishdi. Tajriba yakunida biz ularni yana ijodkorlik darajasini sinab ko‘rdik. Natija sezildi, ammo bu juda kichik edi va skeptiklar bizga ijodkorlik darajasi oshmaganligini, arifmetik o'rtacha ko'rsatkichning biroz oshishi shunchaki tasodif ekanligini aytishni boshladilar.

Bunday holatlar uchun turli xil mezonlar ixtiro qilingan. Ulardan biri - eng mashhuri - Talabaning t-testi. Numeratorda u arifmetik o'rtacha farqga ega. Maxraj kvadrat dispersiya yig'indisining ildizidir (birinchi va ikkinchi sinov holatlarini anglatadi). Arifmetik vositalar orasidagi farq qanchalik katta bo'lsa, shuncha yaxshi (bizning ishimiz behuda emas) va ikkala diagnostika holatida qiymatlarning tarqalishi qanchalik kichik bo'lsa, shuncha yaxshi bo'ladi: qiymatlarning tarqalishi katta bo'lsa, tasodifiy tebranishlar ham kattaroqdir.

Ushbu mezonni qo'llash uchun sezilarli cheklov mavjud - ko'rsatkichlar taqsimoti deb ataladigan darajaga yaqin bo'lishi kerak. normal(qo'ng'iroq shaklida).

Tarqatishning normallik darajasini aniqlash uchun maxsus mezonlar mavjud.

Korrelyatsiya

Psixologiyada, ehtimol boshqa hech qanday fanda bo'lgani kabi, ular korrelyatsiya koeffitsientlarini topishni yaxshi ko'radilar. Oddiy va normal bo'lmagan taqsimotlarni o'z ichiga olgan bir nechta turli yondashuvlar mavjud. Ularning barchasi bir parametrning boshqasiga bog'liqlik darajasini ko'rsatadi. Agar bir parametr (masalan, odamning vazni) boshqa parametrga (masalan, odamning bo'yi) juda bog'liq bo'lsa, u holda korrelyatsiya koeffitsienti +1 ga yaqin bo'ladi. Agar munosabatlar teskari bo'lsa (masalan, odam qanchalik baland bo'lsa, u shunchalik chaqqon bo'lsa), u holda korrelyatsiya koeffitsienti -1 ga moyil bo'ladi. Agar qaramlik bo'lmasa (aytaylik, karta o'ynashda omad odamning balandligiga bog'liq emas), u holda korrelyatsiya koeffitsienti taxminan 0 ga teng bo'ladi.

Agar siz sub'ektlar guruhini olsangiz, ularning bo'yi va vaznini yozsangiz va natijalarni ikki o'lchovli grafikga o'tkazsangiz, siz quyidagi rasmga o'xshash narsani olasiz, bu korrelyatsiya ijobiy, taxminan +0,5 darajasida ekanligini ko'rsatadi. .

Faktor tahlili

Ehtimol, eng sirli tahlil. Uning ba'zi sirlari, uning o'zi ko'p narsani tushuntiradigan, ammo tajriba davomida bevosita o'rganilmagan yangi parametrni topishga mo'ljallanganligi bilan izohlanadi. Qoidaga ko'ra, omil tahlili paytida eng ta'sirli parametrlar topiladi, ularga nisbatan kichikroq, aniqroq parametrlar bog'liq.

Aytaylik, biz maktab o'quvchilari bilan tadqiqot o'tkazdik. Boshqalar qatorida quyidagi ko'rsatkichlar qayd etildi: umumiy o'quv ko'rsatkichlari, fanlar bo'yicha o'quv natijalari, gumanitar fanlar bo'yicha o'quv natijalari, qisqa muddatli xotira hajmi, diqqat hajmi va taqsimlanishi, aqliy faollik, fazoviy tasavvur, umumiy onglilik, xushmuomalalik va tashvish. . Agar siz korrelyatsiya tahlilini qo'llasangiz va korrelyatsiya matritsasini yaratsangiz (bu har bir parametrning har biri bilan bog'liqligini aks ettiradi), bu parametrlarning aksariyati bir-biri bilan yaxshi bog'langanligini ko'rishingiz mumkin. Istisno - qolganlari bilan zaif bog'liq bo'lgan oxirgi ikkitasi. Ushbu matritsaga qarab, biz ko'pgina parametrlarning orqasida ularning barchasiga ta'sir qiluvchi bitta umumiy (super parametr) borligini taxmin qilishimiz mumkin. Biz omillarni tahlil qilish protsedurasini bajaramiz va shundan so'ng bizning matritsamizda boshqa ustun paydo bo'ladi - nomsiz ustun. Ushbu sirli parametr hamma narsa bilan juda yaxshi bog'liq (muloqot va tashvishdan tashqari). Ba'zi ijodiy fikrlardan so'ng, psixolog bu erda yagona mumkin bo'lgan talqinga keladi - sirli parametr - bu aql. Bu hamma narsaga ta'sir qiladi, uning ta'siri kuchli, garchi yuz foiz bo'lmasa.

Bir emas, balki boshqa parametrlarga ta'sir qiluvchi bir nechta omillarni aniqlashga yordam beradigan omil tahlil usullari mavjud. Albatta, ko'pincha sirli parametr unchalik sirli emas, balki qayd etilgan parametrlardan biriga to'liq mos keladi. Ammo ba'zida shunday bo'ladiki, bu maxfiy omilni talqin qilishdan oldin siz uzoq vaqt davomida miyangizni sindirishingiz kerak bo'ladi.

Faktor tahlili asosan olimlar tomonidan tadqiqot predmetini chuqur anglash uchun foydalaniladi. Natijaning aniqligi uchun juda ko'p sonli ob'ektlar kerakligini hisobga olish kerak: sub'ektlar soni parametrlar sonidan bir necha baravar ko'p bo'lishi maqsadga muvofiqdir.

Faktor tahlilidan foydalanib, siz psixologik testlarning sifatini o'rganishingiz mumkin. Agar siz, masalan, bir nechta parametrlarga ega bo'lgan shaxsiy so'rovnomani olsangiz va bu parametrlarni omil tahliliga topshirsangiz, unda barcha parametrlarga ta'sir qiluvchi g'alati umumiy omil paydo bo'lishi mumkin. Bu muhim psixologik ma'noga ega bo'lmasligi mumkin - bu shunchaki sub'ektning u yoki bu tarzda rasmiy ravishda javob berishga moyilligi (kimdir o'ylab javob beradi, kimdir variantlardan birinchi fikrlarni tanlashga moyil, kimdir oxirgi). Ushbu umumiy omilning katta ta'siri topshiriqlarning sifati etarli emasligini ko'rsatishi mumkin.

Adabiyot

Ermolaev O. Yu. Psixologlar uchun matematik statistika: Darslik. - 2-nashr. korr. - M .: MPSI, Flinta, 2003. - 336 b.

TASOSODIY O'ZGARCHILAR VA ULARNING TARQALISH QONUNLARI.

Tasodifiy Ular tasodifiy holatlarning kombinatsiyasiga qarab qiymatlarni qabul qiladigan miqdorni chaqirishadi. Farqlash diskret va tasodifiy uzluksiz miqdorlar.

Diskret Miqdor, agar u sanaladigan qiymatlar to'plamini qabul qilsa, deyiladi. ( Misol: shifokor qabulidagi bemorlar soni, sahifadagi harflar soni, ma'lum hajmdagi molekulalar soni).

Uzluksiz ma'lum bir oraliqda qiymatlarni qabul qila oladigan miqdor. ( Misol: havo harorati, tana vazni, odamning balandligi va boshqalar)

Tarqatish qonuni Tasodifiy o'zgaruvchi - bu o'zgaruvchining mumkin bo'lgan qiymatlari to'plami va ushbu qiymatlarga mos keladigan ehtimolliklar (yoki paydo bo'lish chastotalari).

Misol:

x x 1 x 2 x 3 x 4 ... x n
p p 1 p 2 p 3 p 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

TASOSODIY OʻZGARCHILARNING SON XUSUSIYATLARI.

Ko'p hollarda tasodifiy o'zgaruvchini taqsimlash bilan bir qatorda yoki uning o'rniga ushbu miqdorlar haqida ma'lumot deb nomlangan raqamli parametrlar bilan ta'minlanishi mumkin. tasodifiy miqdorning raqamli xarakteristikalari . Ulardan eng keng tarqalganlari:

1 .Kutish - Tasodifiy o'zgaruvchining (o'rtacha qiymati) uning barcha mumkin bo'lgan qiymatlari va ushbu qiymatlarning ehtimolliklari mahsulotining yig'indisi:

2 .Dispersiya tasodifiy o'zgaruvchi:


3 .Standart og'ish :

"UCH SIGMA" qoidasi - agar tasodifiy o'zgaruvchi normal qonun bo'yicha taqsimlangan bo'lsa, u holda bu qiymatning mutlaq qiymatdagi o'rtacha qiymatdan og'ishi standart og'ishning uch barobaridan oshmaydi.

GAUSS QONUNI - NORMAL TARQALISH QONUNI

Ko'pincha taqsimlangan miqdorlar mavjud oddiy qonun (Gauss qonuni). Asosiy xususiyat : bu taqsimotning boshqa qonunlari yaqinlashadigan cheklovchi qonundir.

Tasodifiy o'zgaruvchi normal qonun bo'yicha taqsimlanadi, agar u bo'lsa ehtimollik zichligi shaklga ega:



M(X)- tasodifiy miqdorni matematik kutish;

s- standart og'ish.

Ehtimollik zichligi(tarqatish funktsiyasi) intervalga tayinlangan ehtimollik qanday o'zgarishini ko'rsatadi dx tasodifiy o'zgaruvchi, o'zgaruvchining o'zi qiymatiga qarab:


MATEMATIK STATISTIKA ASOSIY TUSHUNCHALARI

Matematik statistika- amaliy matematikaning ehtimollar nazariyasiga bevosita tutash bo'limi. Matematik statistikaning ehtimollar nazariyasidan asosiy farqi shundaki, matematik statistika tasodifiy miqdorlarning taqsimot qonunlari va sonli xarakteristikalari bo‘yicha harakatlarni emas, balki tajribalar natijalariga ko‘ra bu qonuniyatlarni va sonli xarakteristikani topishning taxminiy usullarini ko‘rib chiqadi.

Asosiy tushunchalar Matematik statistika quyidagilardan iborat:

1. Umumiy aholi;

2. namuna;

3. o'zgaruvchan seriyalar;

4. moda;

5. median;

6. foizli,

7. chastotali ko'pburchak,

8. gistogramma.

Aholi- tadqiqot uchun ob'ektlarning bir qismi tanlangan katta statistik populyatsiya

(Misol: mintaqaning butun aholisi, ma'lum bir shaharning universitet talabalari va boshqalar)

Namuna (namuna populyatsiyasi)- umumiy aholi orasidan tanlangan ob'ektlar to'plami.

Variatsion seriyalar- variantlardan (tasodifiy o'zgaruvchining qiymatlari) va ularga mos keladigan chastotalardan iborat statistik taqsimot.

Misol:

X, kg
m

x- tasodifiy o'zgaruvchining qiymati (10 yoshli qizlarning vazni);

m- paydo bo'lish chastotasi.

Moda- yuzaga kelishining eng yuqori chastotasiga mos keladigan tasodifiy o'zgaruvchining qiymati. (Yuqoridagi misolda moda 24 kg qiymatiga to'g'ri keladi, u boshqalarga qaraganda tez-tez uchraydi: m = 20).

Median- taqsimotni yarmiga bo'ladigan tasodifiy o'zgaruvchining qiymati: qiymatlarning yarmi mediananing o'ng tomonida, yarmi (ortiq emas) - chapda.

Misol:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

Misolda biz tasodifiy o'zgaruvchining 40 qiymatini kuzatamiz. Barcha qiymatlar ularning paydo bo'lish chastotasini hisobga olgan holda o'sish tartibida joylashtirilgan. Ajratilgan qiymat 7 ning o'ng tomonida 40 ta qiymatdan 20 (yarim) ekanligini ko'rishingiz mumkin. Shunday qilib, 7 mediana hisoblanadi.

Tarqalishni tavsiflash uchun biz o'lchov natijalarining 25 va 75% dan yuqori bo'lmagan qiymatlarni topamiz. Ushbu qiymatlar 25 va 75 deb nomlanadi foizlar . Agar mediana taqsimotni yarmiga bo'lsa, u holda 25 va 75 foizlar chorak bilan kesiladi. (Aytgancha, mediananing o'zini 50-persentil deb hisoblash mumkin.) Misoldan ko'rinib turibdiki, 25 va 75-persentillar mos ravishda 3 va 8 ga teng.

Foydalanish diskret (nuqta) statistik taqsimot va uzluksiz (interval) statistik taqsimot.

Aniqlik uchun statistik taqsimotlar shaklda grafik tarzda tasvirlangan chastota diapazoni yoki - gistogrammalar .

Chastotali poligon- siniq chiziq, uning segmentlari nuqtalarni koordinatalar bilan bog'laydi ( x 1 , m 1), (x 2, m 2), ..., yoki uchun nisbiy chastotali poligon - koordinatalari bilan ( x 1,r * 1), (x 2, r * 2), ...(1-rasm).


m m i /n f(x)

1-rasm 2-rasm

Chastotalar gistogrammasi- bitta to'g'ri chiziqda qurilgan qo'shni to'rtburchaklar to'plami (2-rasm), to'rtburchaklar asoslari bir xil va teng dx , va balandliklar chastotaning nisbatiga teng dx , yoki p* Kimga dx (ehtimollik zichligi).

Misol:

x, kg 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Chastotali poligon

Nisbiy chastotaning interval kengligiga nisbati deyiladi ehtimollik zichligi f(x)=m i / n dx = p* i / dx

Gistogramma tuzishga misol .

Oldingi misoldagi ma'lumotlardan foydalanamiz.

1. Sinf intervallari sonini hisoblash

Qayerda n - kuzatishlar soni. Bizning holatda n = 100 . Demak:

2. Intervallar kengligini hisoblash dx :

,

3. Intervalli qatorni tuzish:

dx 2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Gistogramma

Matematik statistika usullari


1. Kirish

Matematik statistika - tasodifiy massa hodisalarining qonuniyatlarini o'rganish uchun eksperimental ma'lumotlarni olish, tavsiflash va qayta ishlash usullarini ishlab chiqish bilan shug'ullanadigan fan.

Matematik statistikada ikkita sohani ajratish mumkin: tavsiflovchi statistika va induktiv statistika (statistik xulosa). Ta'riflovchi statistika tajriba ma'lumotlarini to'plash, tizimlashtirish va qulay shaklda taqdim etish bilan shug'ullanadi. Ushbu ma'lumotlarga asoslangan induktiv statistika ma'lumotlar to'planadigan ob'ektlar yoki ularning parametrlarini baholash bo'yicha ma'lum xulosalar chiqarishga imkon beradi.

Matematik statistikaning tipik sohalari:

1) tanlab olish nazariyasi;

2) baholash nazariyasi;

3) statistik gipotezalarni tekshirish;

4) regressiya tahlili;

5) dispersiyani tahlil qilish.

Matematik statistika bir qator boshlang'ich tushunchalarga asoslanadi, ularsiz eksperimental ma'lumotlarni qayta ishlashning zamonaviy usullarini o'rganish mumkin emas. Ulardan birinchisi umumiy populyatsiya va namuna tushunchasi.

Ommaviy sanoat ishlab chiqarishida ko'pincha har bir ishlab chiqarilgan mahsulotni tekshirmasdan mahsulot sifati standartlarga mos kelishini aniqlash kerak bo'ladi. Ishlab chiqarilgan mahsulotlar miqdori juda katta bo'lganligi sababli yoki mahsulotlarni sinovdan o'tkazish ularni yaroqsiz holga keltirish bilan bog'liq bo'lganligi sababli, oz miqdordagi mahsulotlar tekshiriladi. Ushbu tekshiruvga asoslanib, barcha mahsulotlar seriyasi haqida xulosa chiqarish kerak. Albatta, ulardan birini tekshirib, 1 million dona partiyadagi barcha tranzistorlar yaxshi yoki yomon deb ayta olmaysiz. Boshqa tomondan, sinov uchun namunalarni tanlash jarayoni va sinovlarning o'zi ko'p vaqt talab qilishi va yuqori xarajatlarga olib kelishi mumkinligi sababli, mahsulotni sinovdan o'tkazish ko'lami shunday bo'lishi kerakki, u mahsulotning butun partiyasini ishonchli taqdim etishi mumkin, minimal o'lchamda bo'lganda. Shu maqsadda biz bir qator tushunchalarni kiritamiz.

O'rganilayotgan ob'ektlar yoki eksperimental ma'lumotlarning butun to'plami umumiy populyatsiya deb ataladi. Biz umumiy populyatsiyani tashkil etuvchi ob'ektlar sonini yoki ma'lumotlar miqdorini N bilan belgilaymiz. N qiymati populyatsiya hajmi deb ataladi. Agar N>>1, ya'ni N juda katta bo'lsa, odatda N = ¥ hisoblanadi.

Tasodifiy tanlama yoki oddiygina namuna, undan tasodifiy tanlangan populyatsiyaning bir qismidir. "Tasodifiy" so'zi populyatsiyadan istalgan ob'ektni tanlash ehtimoli bir xil ekanligini anglatadi. Bu muhim taxmindir, lekin amalda sinab ko'rish ko'pincha qiyin.

Namuna hajmi - bu namunani tashkil etuvchi ob'ektlar soni yoki ma'lumotlar miqdori va bilan belgilanadi n. Kelajakda biz namunaviy elementlarga mos ravishda x 1, x 2, ... x n raqamli qiymatlarni belgilash mumkinligini taxmin qilamiz. Misol uchun, ishlab chiqarilgan bipolyar tranzistorlar sifatini nazorat qilish jarayonida bu ularning doimiy kuchlanishining o'lchovlari bo'lishi mumkin.


2. Namunaning sonli xarakteristikalari

2.1 O'rtacha namuna

n o'lchamdagi ma'lum bir namuna uchun uning namunaviy o'rtacha qiymati

munosabati bilan belgilanadi

bu erda x i - namunaviy elementlarning qiymati. Odatda siz ulardan bittasini emas, balki tasodifiy tasodifiy namunalarning statistik xususiyatlarini tasvirlashni xohlaysiz. Bu shuni anglatadiki, n o'lchamdagi etarlicha katta miqdordagi namunalarni qabul qiladigan matematik model ko'rib chiqilmoqda. Bunday holda, tanlanma elementlari Xi tasodifiy o'zgaruvchilari sifatida ko'rib chiqiladi, f(x) ehtimollik zichligi bilan xi qiymatlarini oladi, bu umumiy populyatsiyaning ehtimollik zichligi hisoblanadi. Keyin o'rtacha tanlama ham tasodifiy o'zgaruvchidir

ga teng

Avvalgidek, biz tasodifiy o'zgaruvchilarni bosh harflar bilan, tasodifiy o'zgaruvchilarning qiymatlarini esa kichik harflar bilan belgilaymiz.

Tanlov olingan populyatsiyaning o'rtacha qiymati umumiy o'rtacha deb ataladi va m x bilan belgilanadi. Agar tanlama kattaligi muhim bo'lsa, o'rtacha tanlanma aholi o'rtachasidan sezilarli darajada farq qilmasligini kutish mumkin. Namuna o'rtacha tasodifiy o'zgaruvchi bo'lgani uchun, uning uchun matematik taxminni topish mumkin:

Shunday qilib, o'rtacha tanlamaning matematik kutilishi umumiy o'rtachaga teng. Bunday holda, tanlab olingan o'rtacha aholi o'rtacha qiymatini xolis baholash deyiladi. Bu muddatga keyinroq qaytamiz. Tanlangan o'rtacha umumiy o'rtacha atrofida o'zgarib turadigan tasodifiy o'zgaruvchi bo'lgani uchun, bu tebranishni o'rtacha tanlamaning dispersiyasidan foydalangan holda baholash maqsadga muvofiqdir. n kattaligi N populyatsiya kattaligidan sezilarli darajada kichik bo'lgan namunani ko'rib chiqing (n<< N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

X i va X j (i¹j) tasodifiy o‘zgaruvchilarni mustaqil deb hisoblash mumkin, shuning uchun

Olingan natijani dispersiya formulasiga almashtiramiz:

bu erda s 2 - populyatsiyaning dispersiyasi.

Bu formuladan kelib chiqadiki, tanlanma hajmi ortishi bilan o'rtacha tanlamaning umumiy o'rtacha atrofida tebranishlari s 2 / n ga kamayadi. Keling, buni bir misol bilan tushuntirib beraylik. Matematik kutilma va dispersiya mos ravishda m x = 10, s 2 = 9 ga teng tasodifiy signal bo'lsin.

Signal namunalari t 1, t 2, ..., teng oraliqli vaqtlarda olinadi.

X(t)

X 1

t 1 t 2. . . t n t

Namunalar tasodifiy o'zgaruvchilar bo'lgani uchun biz ularni X(t 1), X(t 2), ni belgilaymiz. . . , X(tn).

Signalning matematik kutilishini baholashning standart og'ishi uning matematik kutilishining 1% dan oshmasligi uchun namunalar sonini aniqlaymiz. m x = 10 bo'lgani uchun, bu zarur

Boshqa tomondan, shuning uchun yoki bu erdan biz n³ 900 ta namunani olamiz.

2.2 Namuna farqi

Namuna ma'lumotlari uchun nafaqat namunaviy o'rtacha qiymatni, balki namunaviy qiymatlarning namunaviy o'rtacha atrofida tarqalishini ham bilish muhimdir. Agar tanlanma o'rtacha populyatsiyaning o'rtacha qiymatining taxmini bo'lsa, u holda tanlama dispersiyasi populyatsiya dispersiyasining taxmini bo'lishi kerak. Namuna farqi

tasodifiy o'zgaruvchilardan tashkil topgan tanlama uchun quyidagicha aniqlanadi

Namuna dispersiyasining ushbu ko'rinishidan foydalanib, biz uning matematik kutilishini topamiz

Matematik statistika matematika fanining asosiy tarmoqlaridan biri boʻlib, muayyan maʼlumotlarni qayta ishlash usullari va qoidalarini oʻrganuvchi sohadir. Boshqacha qilib aytadigan bo'lsak, u bir xil ob'ektlarning katta populyatsiyalariga xos bo'lgan naqshlarni, ulardan namuna olish asosida kashf qilish yo'llarini o'rganadi.

Ushbu bo'limning maqsadi - olingan natijalarga asoslanib, ehtimollikni baholash yoki hodisalarning tabiati haqida ma'lum bir qaror qabul qilish usullarini yaratish. Ma'lumotlarni tavsiflash uchun jadvallar, diagrammalar va korrelyatsiya maydonlaridan foydalaniladi. kamdan-kam ishlatiladi.

Matematik statistika fanning turli sohalarida qo'llaniladi. Masalan, iqtisod uchun hodisalar va ob'ektlarning bir hil to'plamlari haqidagi ma'lumotlarni qayta ishlash muhim ahamiyatga ega. Ular sanoat tomonidan ishlab chiqarilgan mahsulotlar, xodimlar, foyda ma'lumotlari va boshqalar bo'lishi mumkin.Kuzatuv natijalarining matematik tabiatiga qarab, biz raqamlarning statistik ma'lumotlarini, sonli bo'lmagan xarakterdagi funktsiyalar va ob'ektlarning tahlilini, ko'p o'lchovli tahlilni ajratishimiz mumkin. Bundan tashqari, umumiy va o'ziga xos muammolar (bog'liklarni tiklash, tasniflardan foydalanish va tanlab tadqiqotlar bilan bog'liq) ko'rib chiqiladi.

Ba'zi darsliklar mualliflari matematik statistika nazariyasini ehtimollar nazariyasining faqat bir bo'limi deb hisoblasa, boshqalari esa o'z maqsadi, vazifalari va usullariga ega bo'lgan mustaqil fan deb hisoblaydilar. Biroq, har qanday holatda, uning qo'llanilishi juda keng.

Shunday qilib, matematik statistika psixologiyada eng aniq qo'llaniladi. Uning qo'llanilishi mutaxassisga ma'lumotlar o'rtasidagi munosabatni topishni to'g'ri asoslash, uni umumlashtirish, ko'plab mantiqiy xatolardan qochish va boshqalarga imkon beradi. Shuni ta'kidlash kerakki, ko'pincha ma'lum bir psixologik hodisani yoki shaxsiy xususiyatni hisoblash protseduralarisiz o'lchash mumkin emas. Bu esa ushbu fanning asoslari zarurligini ko'rsatadi. Boshqacha qilib aytganda, ehtimollar nazariyasining manbai va asosi deyish mumkin.

Statistik ma'lumotlarni ko'rib chiqishga asoslangan tadqiqot usuli boshqa sohalarda qo'llaniladi. Biroq, darhol shuni ta'kidlash kerakki, uning xususiyatlari, turli xil kelib chiqishi ob'ektlariga nisbatan qo'llanilganda, har doim o'ziga xosdir. Shuning uchun fizika fanini bir fanga birlashtirishning ma'nosi yo'q. Ushbu usulning umumiy xususiyatlari ma'lum bir guruhga kiradigan ob'ektlarning ma'lum sonini sanash, shuningdek miqdoriy xususiyatlarning taqsimlanishini o'rganish va ma'lum xulosalar olish uchun ehtimollik nazariyasini qo'llash bilan bog'liq.

Matematik statistika elementlari fizika, astronomiya va boshqalar kabi sohalarda qo'llaniladi. Bu erda xarakteristikalar va parametrlarning qiymatlari, ikkita namunadagi har qanday xususiyatlarning mos kelishi haqidagi farazlar, taqsimlanish simmetriyasi va boshqa ko'p narsalarni ko'rib chiqish mumkin. .

Matematik statistika ularning tadqiqotini o'tkazishda katta rol o'ynaydi. Hozirgi vaqtda bu fanda kompyuter texnikasi katta ahamiyatga ega. Ular nafaqat hisoblash jarayonini sezilarli darajada soddalashtirishga, balki ko'paytirish uchun namunalar yaratishga yoki amalda olingan natijalarning mosligini o'rganishga imkon beradi.

Umuman olganda, matematik statistika usullari ikkita xulosa chiqarishga yordam beradi: yoki o'rganilayotgan ma'lumotlarning tabiati yoki xususiyatlari va ularning munosabatlari to'g'risida kerakli hukmni qabul qilish yoki olingan natijalar xulosa chiqarish uchun etarli emasligini isbotlash.

Tajriba natijasida olingan ma'lumotlar o'zgaruvchanlik bilan tavsiflanadi, bu tasodifiy xato tufayli yuzaga kelishi mumkin: o'lchash moslamasining xatosi, namunalarning heterojenligi va boshqalar. Katta hajmdagi bir hil ma'lumotlarni to'plagandan so'ng, eksperimentator ko'rib chiqilayotgan miqdor haqida mumkin bo'lgan eng aniq ma'lumotni olish uchun uni qayta ishlashi kerak. Tajriba davomida olinishi mumkin bo'lgan katta hajmdagi o'lchov ma'lumotlarini, kuzatishlarni va hokazolarni qayta ishlash uchun undan foydalanish qulay. matematik statistika usullari.

Matematik statistika ehtimollar nazariyasi bilan uzviy bog'liq, ammo bu fanlar o'rtasida sezilarli farq bor. Ehtimollar nazariyasi tasodifiy o'zgaruvchilarning allaqachon ma'lum bo'lgan taqsimotlaridan foydalanadi, ular asosida hodisalarning ehtimolligi, matematik kutish va boshqalar hisoblanadi. Matematik statistika muammosi- eksperimental ma'lumotlar asosida tasodifiy o'zgaruvchining taqsimlanishi haqida eng ishonchli ma'lumotlarni olish.

Oddiy yo'nalishlari Matematik statistika:

  • namuna olish nazariyasi;
  • baholash nazariyasi;
  • statistik gipotezalarni tekshirish;
  • regressiya tahlili;
  • dispersiya tahlili.

Matematik statistika usullari

Gipotezalarni baholash va sinovdan o'tkazish usullari ma'lumotlar kelib chiqishining ehtimollik va giper-tasodifiy modellariga asoslanadi.

Matematik statistika taqsimotlarning muhim xarakteristikalarini (median, kutilayotgan qiymat, standart og'ish, kvantlar va boshqalar), zichlik va taqsimot funktsiyalarini va boshqalarni ifodalovchi parametrlari va funktsiyalarini baholaydi. Nuqta va intervalli baholar qo'llaniladi.

Zamonaviy matematik statistika katta bo'limni o'z ichiga oladi - statistik ketma-ketlik tahlili, unda bir massivdan kuzatishlar massivini hosil qilish mumkin.

Matematik statistika umumiy ma'lumotlarni ham o'z ichiga oladi gipotezani tekshirish nazariyasi va ko'p sonli usullar maxsus farazlarni tekshirish(masalan, taqsimot simmetriyasi haqida, parametrlar va xarakteristikalar qiymatlari haqida, empirik taqsimot funktsiyasining berilgan taqsimot funktsiyasi bilan mos kelishi haqida, bir xillikni tekshirish gipotezasi (ikkida xarakteristikalar yoki taqsimot funktsiyalarining mos kelishi) namunalar) va boshqalar).

Amalga oshirish namunaviy so'rovlar, gipotezalarni baholash va tekshirishning adekvat usullarini qurish bilan bog'liq, turli xil tanlab olish sxemalari xususiyatlariga ega bo'lib, katta ahamiyatga ega bo'lgan matematik statistika bo'limidir. Matematik statistika usullari bevosita quyidagi asosiy tushunchalardan foydalanadi.

Namuna

Ta'rif 1

Namuna olish tajriba davomida olingan ma'lumotlarga ishora qiladi.

Masalan, bir xil yoki o'xshash qurollar guruhi tomonidan otilganda o'qning parvoz masofasi natijalari.

Empirik taqsimot funksiyasi

Eslatma 1

Tarqatish funksiyasi tasodifiy miqdorning barcha eng muhim xususiyatlarini ifodalash imkonini beradi.

Matematik statistikada tushuncha mavjud nazariy(oldindan ma'lum emas) va empirik tarqatish funktsiyalari.

Empirik funktsiya eksperimental ma'lumotlar (ampirik ma'lumotlar) bo'yicha aniqlanadi, ya'ni. namuna bo'yicha.

Gistogramma

Gistogrammalar noma'lum taqsimotni vizual, ammo taxminiy ko'rsatish uchun ishlatiladi.

Gistogramma ma'lumotlar taqsimotining grafik ko'rinishidir.

Yuqori sifatli gistogramma olish uchun quyidagilarga amal qiling: qoidalar:

  • Namuna elementlari soni namuna hajmidan sezilarli darajada kam bo'lishi kerak.
  • Ajratilgan intervallar etarli miqdordagi namunaviy elementlarni o'z ichiga olishi kerak.

Namuna juda katta bo'lsa, namuna elementlari oralig'i ko'pincha teng qismlarga bo'linadi.

Namuna o'rtacha va namunaviy dispersiya

Ushbu tushunchalardan foydalanib, siz tarqatish funktsiyasi, gistogramma va boshqalarni qurishga murojaat qilmasdan, noma'lum taqsimotning kerakli raqamli tavsiflarini baholashingiz mumkin.