එකඟතා නිර්ණායක. කැමැත්ත නිර්ණායක එකඟතා නිර්ණායක සහ ඒවා භාවිතා කරන දේ

සසම්භාවී විචල්‍ය ξ හි ස්වාධීන මිනුම් සැකසීමෙන්, අපට සංඛ්‍යානමය ව්‍යාප්ති ශ්‍රිතයක් F * (x) සෑදිය හැක. මෙම ශ්‍රිතයේ ස්වරූපය මත පදනම්ව, සත්‍ය න්‍යායික ව්‍යාප්ති ශ්‍රිතය F(x) යන උපකල්පනය අපට පිළිගත හැක. නියැදිය සාදන ස්වාධීන මිනුම් (x 1 , x 2 ,..., x n) උපකල්පිත ව්‍යාප්ති ශ්‍රිතයක් සහිත F(x) සමානව බෙදා හරින ලද අහඹු විචල්‍යයන් ලෙස සැලකිය හැකිය.

පැහැදිලිවම, F * (x) සහ F(x) ශ්‍රිත අතර යම් විෂමතා ඇති වනු ඇත. මෙම නොගැලපීම් සීමිත නියැදි ප්‍රමාණයේ ප්‍රතිවිපාකයක් ද නැතහොත් අපගේ උපකල්පනය නිවැරදි නොවන බව නිසා ප්‍රශ්නය පැන නගී, i.e. සැබෑ බෙදාහැරීමේ කාර්යය F(x) නොව වෙනත් එකකි. මෙම ගැටළුව විසඳීම සඳහා, ඔවුන් කැමැත්ත නිර්ණායක භාවිතා කරයි, එහි සාරය පහත පරිදි වේ. නිශ්චිත අගයක් Δ(F, F *) තෝරා ඇත, එය F * (x) සහ F(x) ශ්‍රිත අතර විෂමතා මට්ටම සංලක්ෂිත වේ. උදාහරණයක් ලෙස, Δ(F, F *)=Sup|F(x)-F * (x)|, i.e. වෙනසෙහි මාපාංකයේ x හි ඉහළ සීමාව.

උපකල්පනය නිවැරදි ලෙස සලකමින්, i.e. බෙදා හැරීමේ ශ්‍රිතය F(x) දැන ගැනීමෙන්, ඔබට අහඹු විචල්‍යයේ Δ(F, F *) බෙදා හැරීමේ නියමය සොයාගත හැකිය (මෙය කරන්නේ කෙසේද යන ප්‍රශ්නය අපි ස්පර්ශ නොකරමු). මෙම සම්භාවිතාව සමඟ සිදුවීම (Δ(F, F *)>Δ 0 ) සිදුවීම ප්‍රායෝගිකව කළ නොහැක්කක් ලෙස සලකන පරිදි p 0 අංකය ඉතා කුඩා ලෙස සකසමු. කොන්දේසියෙන්

අපි Δ 0 අගය සොයා ගනිමු. මෙහි f(x) යනු ව්‍යාප්ති ඝනත්වය Δ(F,F *) වේ.

අපි දැන් ප්‍රතිඵල මත පදනම්ව Δ(F, F *)= Δ 1 අගය ගණනය කරමු

සාම්පල, i.e. සසම්භාවී විචල්‍ය Δ(F, F *) හි හැකි අගයන්ගෙන් එකක් සොයා ගනිමු. Δ 1 ≥Δ 0 නම්, මෙයින් අදහස් කරන්නේ ප්‍රායෝගිකව කළ නොහැකි සිදුවීමක් සිදුවී ඇති බවයි. අපගේ උපකල්පනය නිවැරදි නොවන බව මෙය පැහැදිලි කළ හැකිය. එබැවින්, Δ 1 ≥Δ 0 නම්, උපකල්පනය ප්‍රතික්ෂේප කරනු ලැබේ, සහ Δ 1 නම්<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Δ(F, F *) විෂමතාවයේ මිනුමක් ලෙස විවිධ අගයන් ගත හැක. මෙය මත පදනම්ව, විවිධ ගිවිසුම් නිර්ණායක ලබා ගනී. උදාහරණයක් ලෙස, Kolmogorov, Mises, Pearson goodness-of-fit test, හෝ chi-square test.

n මිනුම්වල ප්‍රතිඵල k ඉලක්කම් සහිත සමූහගත සංඛ්‍යාන ශ්‍රේණියක ආකාරයෙන් ඉදිරිපත් කරමු.

විසර්ජනය (x 0 ,x 1) (ඇත්ත වශයෙන්ම, මිනුම් දෝෂ යම් කොටසකට ඒකාකාරව බෙදා හරිනු ඇතැයි අපි උපකල්පනය කරමු). එවිට එක් එක් කාණ්ඩ හතට ඇතුල් වීමේ සම්භාවිතාව සමාන වේ. §11 සිට කාණ්ඩගත ශ්‍රේණි භාවිතා කරමින්, අපි Δ(F, F *)= Δ 1 = සූත්‍රය (1) භාවිතා කරමින් ගණනය කරමු. මේ අවස්ථාවේ දී.

උපකල්පිත බෙදා හැරීමේ නීතියට නොදන්නා පරාමිති දෙකක් ඇතුළත් වන බැවින්, α සහ β - කොටසේ ආරම්භය සහ අවසානය, නිදහසේ අංශක ගණන 7-1-2=4 වනු ඇත. තෝරාගත් සම්භාවිතාව p 0 =10 -3 සමඟ chi-square බෙදාහැරීමේ වගුව භාවිතා කරමින්, අපි Δ 0 =18 සොයා ගනිමු. මොකද Δ 1 >Δ 0 , එවිට මිනුම් දෝෂයේ ඒකාකාර ව්‍යාප්තිය පිළිබඳ උපකල්පනය ඉවත දැමිය යුතුය.

හැඳින්වීම

මෙම මාතෘකාවේ අදාළත්වය නම් ජෛව සංඛ්‍යාලේඛනවල මූලික කරුණු අධ්‍යයනය කිරීමේදී ජනගහනයේ බෙදා හැරීමේ නීතිය දන්නා බව අපි උපකල්පනය කළෙමු. නමුත් බෙදාහැරීමේ නීතිය නොදන්නේ නම්, නමුත් එයට නිශ්චිත ස්වරූපයක් ඇතැයි උපකල්පනය කිරීමට හේතුවක් තිබේ නම් (අපි එය A ලෙස හඳුන්වමු), එවිට ශුන්‍ය කල්පිතය පරීක්ෂා කරනු ලැබේ: A නීතියට අනුව ජනගහනය බෙදා හරිනු ලැබේ. මෙම උපකල්පනය පරීක්ෂා කරනු ලබන්නේ a විශේෂයෙන් තෝරාගත් අහඹු විචල්‍යය - සුදුසුකමේ හොඳ නිර්ණායකය.

යෝග්‍යතාවයේ හොඳ නිර්ණායක යනු න්‍යායික සම්භාවිතා ව්‍යාප්තියට අනුභූතික ව්‍යාප්තියේ අනුරූප පිළිබඳ උපකල්පන පරීක්ෂා කිරීමේ නිර්ණායක වේ. එවැනි නිර්ණායක පන්ති දෙකකට බෙදා ඇත:

  • Ш සාමාන්‍ය එකඟතා නිර්ණායක බොහෝ දුරට අදාළ වේ සාමාන්ය සූත්රගත කිරීමඋපකල්පන, එනම් කිසියම් පූර්ව උපකල්පිත සම්භාවිතා ව්‍යාප්තියක් සමඟ නිරීක්ෂණය කරන ලද ප්‍රතිඵලවල එකඟතාවය පිළිබඳ උපකල්පනය.
  • Ш විශේෂ හොඳ යෝග්‍යතා පරීක්‍ෂණවලට යම් ආකාරයක සම්භාවිතා ව්‍යාප්තියක් සමඟ ගිවිසුමක් සකස් කරන විශේෂ ශුන්‍ය උපකල්පන ඇතුළත් වේ.

ගිවිසුම් නිර්ණායකය

වඩාත් සුලභ හොඳ-යෝග්‍යතා පරීක්ෂණ වන්නේ ඔමේගා-චතුරශ්‍රය, චි-චතුරශ්‍රය, කොල්මොගොරොව් සහ කොල්මොගොරොව්-ස්මිර්නොව් ය.

කොල්මොගොරොව්, ස්මිර්නොව් සහ ඔමේගා චතුරශ්‍රය යන පරාමිතික නොවන යහපත්තා පරීක්ෂණ බහුලව භාවිතා වේ. කෙසේ වෙතත්, ඒවා යෙදුමේ පුලුල්ව පැතිරුනු දෝෂ සමඟ ද සම්බන්ධ වේ. සංඛ්යාන ක්රම.

කාරණය නම්, ලැයිස්තුගත නිර්ණායක සම්පූර්ණයෙන් දන්නා න්‍යායික ව්‍යාප්තියක් සමඟ ගිවිසුමක් පරීක්ෂා කිරීම සඳහා සකස් කර ඇති බවයි. ගණනය කිරීමේ සූත්‍ර, බෙදාහැරීමේ වගු සහ තීරණාත්මක අගයන් බහුලව භාවිතා වේ. කොල්මොගොරොව්, ඔමේගා චතුරස්රය සහ ඒ හා සමාන පරීක්ෂණවල ප්රධාන අදහස වන්නේ ආනුභවික බෙදාහැරීමේ කාර්යය සහ න්යායික බෙදාහැරීමේ කාර්යය අතර දුර මැනීමයි. මෙම නිර්ණායක බෙදා හැරීමේ ශ්‍රිතවල අවකාශයේ ඇති දුර ප්‍රමාණය අනුව වෙනස් වේ.

සරල කල්පිතයක් සඳහා පියර්සන් හොඳ යෝග්‍යතා පරීක්ෂණ

K. පියර්සන්ගේ ප්‍රමේයය සීමිත ප්‍රතිඵල සංඛ්‍යාවක් සහිත ස්වාධීන අත්හදා බැලීම් වලට යොමු කරයි, i.e. Bernoulli පරීක්ෂණ වෙත (තරමක් පුළුල් අර්ථයකින්). මෙම ප්‍රතිඵලවල සංඛ්‍යාත අත්හදා බැලීම් විශාල සංඛ්‍යාවක් හරහා කරන නිරීක්ෂණ ඒවායේ ඇස්තමේන්තුගත සම්භාවිතාවන්ට අනුකූලද යන්න විනිශ්චය කිරීමට එය අපට ඉඩ සලසයි.

බොහෝ ප්‍රායෝගික ගැටළු වලදී, නිවැරදි බෙදාහැරීමේ නීතිය නොදනී. එබැවින්, නිරීක්ෂණ වලින් ගොඩනගා ඇති, පවතින ආනුභවික නීතිය යම් න්‍යායික එකකට අනුරූප වීම පිළිබඳ උපකල්පනයක් ඉදිරිපත් කෙරේ. මෙම උපකල්පනය සඳහා සංඛ්‍යානමය පරීක්‍ෂණයක් අවශ්‍ය වන අතර, එහි ප්‍රතිඵල තහවුරු කිරීම හෝ ප්‍රතික්ෂේප කිරීම සිදුවේ.

X විෂයයට ඉඩ දෙන්න අහඹු විචල්යය. මෙම අහඹු විචල්‍යය F(x) බෙදා හැරීමේ නීතියට අවනත වන බවට උපකල්පනය H0 පරීක්ෂා කිරීම අවශ්‍ය වේ. මෙය සිදු කිරීම සඳහා, n ස්වාධීන නිරීක්ෂණවල නියැදියක් සාදා එය ආනුභවික බෙදාහැරීමේ නීතියක් ගොඩනැගීමට භාවිතා කළ යුතුය F "(x). ආනුභවික සහ උපකල්පිත නීති සංසන්දනය කිරීම සඳහා, යහපත්කම-සුදුසු නිර්ණායකය නම් රීතියක් භාවිතා කරයි. ජනප්‍රිය ඒවායින් එකක් වන්නේ K. Pearson chi-square goodness-of-fit එහි chi-square statistic ගණනය කර ඇත.

මෙහි N යනු ආනුභවික ව්‍යාප්ති නියමය ගොඩනගා ඇති කාල අන්තර ගණන (අනුරූප හිස්ටෝග්‍රෑම් හි තීරු ගණන), i යනු පරතරයේ සංඛ්‍යාව, pt i යනු අහඹු විචල්‍ය අගයට වැටීමේ සම්භාවිතාවයි. i-th intervalසෛද්ධාන්තික ව්‍යාප්ති නියමය සඳහා, pe i යනු ආනුභවික ව්‍යාප්ති නීතිය සඳහා i-th පරතරයට සසම්භාවී විචල්‍ය අගය වැටීමේ සම්භාවිතාවයි. එය chi-square ව්‍යාප්තියට අවනත විය යුතුය.

සංඛ්‍යාලේඛනයේ ගණනය කළ අගය, දී ඇති වැදගත්කමේ මට්ටමක් සඳහා නිදහසේ k-p-1 අංශක සහිත chi-square බෙදාහැරීමේ ප්‍රමාණය ඉක්මවා ගියහොත්, H0 උපකල්පනය ප්‍රතික්ෂේප වේ. එසේ නොමැති නම්, එය නිශ්චිත වැදගත්කමේ මට්ටමින් පිළිගනු ලැබේ. මෙහි k යනු නිරීක්ෂණ ගණන, p යනු බෙදාහැරීමේ නීතියේ ඇස්තමේන්තුගත පරාමිති ගණනයි.

අපි සංඛ්යා ලේඛන දෙස බලමු:

සරල කල්පිතයක් සඳහා h2 සංඛ්‍යාලේඛනය Pearson chi-square statistic ලෙස හැඳින්වේ.

h2 නියෝජනය කරන්නේ r-මාන දෛශික දෙකක් අතර යම් දුරක වර්ග බව පැහැදිලිය: සාපේක්ෂ සංඛ්‍යාතවල දෛශිකය (mi /n, ..., mr /n) සහ සම්භාවිතා දෛශිකය (pi, ..., pr) ) මෙම දුර යුක්ලීඩීය දුරින් වෙනස් වන්නේ විවිධ ඛණ්ඩාංක විවිධ බරකින් එයට ඇතුල් වන විට පමණි.

H2 උපකල්පනය සත්‍ය වන විට සහ H අසත්‍ය අවස්ථාවෙහිදී සංඛ්‍යාලේඛන h2 හි හැසිරීම අපි සාකච්ඡා කරමු. H සත්‍ය නම්, n > සඳහා h2 හි අසමමිතික හැසිරීම? K. පියර්සන්ගේ ප්‍රමේයය පෙන්නුම් කරයි. H අසත්‍ය වූ විට (2.2) ට සිදු වන්නේ කුමක්ද යන්න තේරුම් ගැනීමට, n > ? සඳහා විශාල සංඛ්‍යා mi /n > pi නීතියට අනුව, i = 1, …, r සඳහා බව සලකන්න. එබැවින්, n > ?:

මෙම අගය 0 ට සමාන වේ. එබැවින්, H වැරදි නම්, h2 >? (n > සඳහා?).

ඉහතින් දැක්වෙන්නේ අත්හදා බැලීමේදී ලබාගත් h2 අගය ඉතා විශාල නම් H ප්‍රතික්ෂේප කළ යුතු බවයි. මෙහිදී, සෑම විටම, "ඉතා විශාල" යන වචන වලින් අදහස් වන්නේ, h2 හි නිරීක්ෂිත අගය විවේචනාත්මක අගය ඉක්මවා යන බවයි, මෙම නඩුවේ chi-square බෙදාහැරීමේ වගු වලින් ගත හැකිය. වෙනත් වචන වලින් කිවහොත්, P(ch2 npi h2) සම්භාවිතාව කුඩා අගයක් වන අතර, එබැවින්, එය අත්හදා බැලීමේ දී මෙන් අහම්බෙන් හෝ සංඛ්‍යාත දෛශිකය සහ සම්භාවිතා දෛශිකය අතර ඊටත් වඩා විශාල විෂමතාවයක් ලබා ගැනීමට අපහසුය.

K. Pearson's theorem හි අසමමිතික ස්වභාවය, මෙම නියමයට යටින් පවතින අතර, එය භාවිතා කිරීමේදී ප්‍රවේශම් විය යුතුය. ප්රායෝගික භාවිතය. එය විශාල n සඳහා පමණක් විශ්වාසය තැබිය හැකිය. pi, ..., pr සම්භාවිතාවන් සැලකිල්ලට ගනිමින් n ප්‍රමාණවත් තරම් විශාලද යන්න විනිශ්චය කිරීම අවශ්‍ය වේ. එමනිසා, උදාහරණයක් ලෙස, n පමණක් විශාල විය යුතු බැවින්, නිරීක්ෂණ සියයක් ප්රමාණවත් වනු ඇතැයි පැවසිය නොහැක, නමුත් නිෂ්පාදන npi , ..., npr (අපේක්ෂිත සංඛ්යාත) ද කුඩා නොවිය යුතුය. එබැවින්, h2 සංඛ්‍යාලේඛනයට h2 (අඛණ්ඩ ව්‍යාප්තිය) ආසන්න කිරීමේ ගැටලුව, එහි බෙදා හැරීම විවික්තය, දුෂ්කර විය. න්‍යායික සහ පර්යේෂණාත්මක තර්කවල එකතුවක් බලාපොරොත්තු වූ සියලුම සංඛ්‍යාත npi>10 නම් මෙම ආසන්න කිරීම අදාළ වේ යන විශ්වාසයට හේතු වී ඇත. r සංඛ්‍යාව (විවිධ ප්‍රතිඵල ගණන) වැඩි වුවහොත්, සඳහා සීමාව අඩු වේ (5 දක්වා හෝ r දස කිහිපයක අනුපිළිවෙලක් නම් 3 දක්වා). මෙම අවශ්යතා සපුරාලීම සඳහා, ප්රායෝගිකව සමහර විට ප්රතිඵල කිහිපයක් ඒකාබද්ධ කිරීම අවශ්ය වේ, i.e. කුඩා r සමඟ බර්නූලි යෝජනා ක්‍රමයට මාරු වන්න.

ගිවිසුම පරීක්ෂා කිරීම සඳහා විස්තර කරන ලද ක්‍රමය බර්නූලි පරීක්ෂණ සඳහා පමණක් නොව අහඹු සාම්පල සඳහා ද යෙදිය හැකිය. පළමුව, ඔවුන්ගේ නිරීක්ෂණ කණ්ඩායම් කිරීම මගින් බර්නූලි පරීක්ෂණ බවට පත් කළ යුතුය. ඔවුන් එය කරන්නේ මේ ආකාරයටයි: නිරීක්ෂණ අවකාශය අතිච්ඡාදනය නොවන කලාපවල සීමිත සංඛ්‍යාවකට බෙදා ඇත, ඉන්පසු එක් එක් කලාපය සඳහා නිරීක්ෂිත සංඛ්‍යාතය සහ උපකල්පිත සම්භාවිතාව ගණනය කෙරේ.

මෙම අවස්ථාවෙහිදී, ආසන්න වශයෙන් ලැයිස්තුගත කර ඇති දුෂ්කරතා සඳහා, තවත් එකක් එකතු කරනු ලැබේ - මුල් අවකාශයේ සාධාරණ කොටසක් තෝරා ගැනීම. මෙම අවස්ථාවෙහිදී, සාමාන්යයෙන්, නියැදියේ ආරම්භක ව්යාප්තිය පිළිබඳ උපකල්පනය පරීක්ෂා කිරීම සඳහා රීතිය හැකි විකල්ප සඳහා ප්රමාණවත් තරම් සංවේදී බව සහතික කිරීම සඳහා සැලකිලිමත් විය යුතුය. අවසාන වශයෙන්, බර්නූලිගේ යෝජනා ක්රමයට අඩු කිරීම මත පදනම් වූ සංඛ්යානමය නිර්ණායක, නීතියක් ලෙස, සියලු විකල්පයන්ට එරෙහිව අනුකූල නොවන බව මම සටහන් කරමි. එබැවින් කැමැත්ත පරීක්ෂා කිරීමේ මෙම ක්රමය සීමිත වටිනාකමක් ඇත.

Kolmogorov-Smirnov එහි සම්භාව්‍ය ආකෘතියේ යහපත් යෝග්‍යතා පරීක්ෂණය h2 නිර්ණායකයට වඩා බලවත් වන අතර කලින් දැන සිටි පරාමිති සහිත ඕනෑම න්‍යායික අඛණ්ඩ ව්‍යාප්තියකට F(x) අනුභූතික ව්‍යාප්තිය පිළිබඳ කල්පිතය පරීක්ෂා කිරීමට භාවිතා කළ හැක. ලක්ෂණ බෙදා හැරීමේ ක්‍රියාකාරීත්වයේ පරාමිතීන් නිසා යාන්ත්‍රික පරීක්ෂණවල ප්‍රති results ල විශ්ලේෂණය කිරීමේදී මෙම නිර්ණායකය පුළුල් ලෙස ප්‍රායෝගිකව භාවිතා කිරීමේ හැකියාව පිළිබඳ අවසාන අවස්ථාව සීමා පනවයි. යාන්ත්රික ගුණ, රීතියක් ලෙස, නියැදියේ දත්ත වලින්ම ඇස්තමේන්තු කර ඇත.

කොල්මොගොරොව්-ස්මිර්නොව් නිර්ණායකය සමූහගත නොකළ දත්ත සඳහා හෝ කුඩා විරාම පළල (උදාහරණයක් ලෙස, බල මීටරයක පරිමාණ බෙදීම, පැටවුම් චක්‍ර කවුන්ටරය ආදිය) සමූහගත ඒවා සඳහා භාවිතා වේ. n සාම්පල මාලාවක් පරීක්ෂා කිරීමේ ප්‍රතිඵලය යාන්ත්‍රික ගුණවල ලක්ෂණවල විචල්‍ය ශ්‍රේණියක් වේවා

x1 ? x2 ? ...? xi? ...? xn (3.93)

නියැදි ව්‍යාප්තිය (3.93) න්‍යායාත්මක නීතිය F(x) ට අයත් බවට ශුන්‍ය කල්පිතය පරීක්ෂා කිරීම අවශ්‍ය වේ.

Kolmogorov-Smirnov නිර්ණායකය පදනම් වන්නේ බෙදා හැරීමේ ශ්‍රිතයේ අගයෙන් සමුච්චිත විශේෂයේ උපරිම අපගමනය බෙදා හැරීම මත ය. භාවිතා කරන විට, සංඛ්යාලේඛන ගණනය කරනු ලැබේ

Kolmogorov නිර්ණායකයේ සංඛ්යා ලේඛනය වන. අසමානතාවය පවතින්නේ නම්

Dnvn? නළල (3.97)

විශාල නියැදි ප්‍රමාණ සඳහා (n > 35) හෝ

Dn(vn + 0.12 + 0.11/vn) ? නළල (3.98)

n සඳහා? 35, එවිට ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප නොවේ.

අසමානතා (3.97) සහ (3.98) සපුරා නොමැති නම්, නියැදිය (3.93) නොදන්නා ව්‍යාප්තියකට අයත් බවට විකල්ප උපකල්පනයක් පිළිගනු ලැබේ.

lb හි තීරණාත්මක අගයන් වන්නේ: l0.1 = 1.22; l0.05 = 1.36; l0.01 = 1.63.

F(x) ශ්‍රිතයේ පරාමිතීන් කල්තියා නොදත් නමුත් නියැදි දත්ත වලින් ඇස්තමේන්තු කර ඇත්නම්, Kolmogorov-Smirnov නිර්ණායකය එහි විශ්වීයත්වය නැති කර ගන්නා අතර පර්යේෂණාත්මක දත්තවල අනුකූලතාවය පරීක්ෂා කිරීමට පමණක් භාවිතා කළ හැක. නිශ්චිත කාර්යයන්බෙදාහැරීම්.

පර්යේෂණාත්මක දත්ත සාමාන්‍ය හෝ ලඝු-සාමාන්‍ය ව්‍යාප්තියකට අයත් බවට ශුන්‍ය උපකල්පනයක් ලෙස භාවිතා කරන විට, සංඛ්‍යාලේඛන ගණනය කරනු ලැබේ:

මෙහි Ц(zi) යනු Laplace ශ්‍රිතයේ අගයයි

Ц(zi) = (xi - xср)/s ඕනෑම නියැදි ප්‍රමාණයක n සඳහා කොල්මොගොරොව්-ස්මිර්නොව් නිර්ණායකය පෝරමයේ ලියා ඇත

මෙම නඩුවේ lb හි තීරණාත්මක අගයන් වන්නේ: l0.1 = 0.82; l0.05 = 0.89; l0.01 = 1.04.

නියැදිය *** ඝාතීය ව්‍යාප්තියට අනුරූප වන බවට උපකල්පනය පරීක්‍ෂා කරන්නේ නම්, එහි පරාමිතිය පර්යේෂණාත්මක දත්ත වලින් ඇස්තමේන්තු කර ඇත, සමාන සංඛ්‍යාලේඛන ගණනය කරනු ලැබේ:

නිර්ණායක ආනුභවික සම්භාවිතාව

සහ Kolmogorov-Smirnov නිර්ණායකය සාදයි.

මෙම නඩුව සඳහා lb හි විවේචනාත්මක අගයන්: l0.1 = 0.99; l0.05 = 1.09; l0.01 = 1.31.

යුක්රේනයේ අධ්‍යාපන හා විද්‍යා අමාත්‍යාංශය

AZOV කලාපීය කළමනාකරණ ආයතනය

ZAPORIZHIE ජාතික තාක්ෂණික විශ්ව විද්යාලය

ගණිත අංශය

පාඨමාලා වැඩ

3 විෂයයන් "සංඛ්‍යාන"

මාතෘකාව මත: "කැමැත්තේ නිර්ණායක"

2 වසර සිසුන්

කණ්ඩායම් 207 කළමනාකරණ පීඨය

Batura Tatyana Olegovna

විද්යාත්මක අධීක්ෂක

සහකාර මහාචාර්ය Kosenkov O.I.

බර්ඩියන්ස්ක් - 2009


හැඳින්වීම

1.2 පියර්සන් χ 2 සරල උපකල්පනයක් සඳහා හොඳ-සුදුසුකම් පරීක්ෂණ

1.3 සංකීර්ණ කල්පිතයක් සඳහා සුදුසු නිර්ණායකවල යහපත්කම

1.4 සංකීර්ණ කල්පිතයක් සඳහා ෆිෂර්ගේ χ 2 හොඳ යෝග්‍යතා පරීක්ෂණ

1.5 වෙනත් එකඟතා නිර්ණායක. Poisson ව්‍යාප්තිය සඳහා හොඳ යෝග්‍යතා පරීක්ෂණ

II කොටස. ගිවිසුම් නිර්ණායකයේ ප්‍රායෝගික යෙදුම

අයදුම්පත්

භාවිතා කරන ලද යොමු ලැයිස්තුව


හැඳින්වීම

මෙම පාඨමාලා කාර්යය වඩාත් සුලභ හොඳ-යෝග්‍යතා පරීක්ෂණ විස්තර කරයි - ඔමේගා-චතුරශ්‍රය, චි-චතුරශ්‍රය, කොල්මොගොරොව් සහ කොල්මොගොරොව්-ස්මිර්නොව්. දත්ත බෙදා හැරීම කිසියම් පරාමිතික පවුලකට අයත් දැයි පරීක්ෂා කිරීමට අවශ්‍ය වූ විට විශේෂ අවධානයක් යොමු කෙරේ, උදාහරණයක් ලෙස සාමාන්‍ය. එහි සංකීර්ණත්වය නිසා, ප්රායෝගිකව ඉතා සුලභ වන මෙම තත්ත්වය, සම්පූර්ණයෙන්ම අධ්යයනය කර නොමැති අතර අධ්යාපනික හා විමර්ශන සාහිත්යය තුළ සම්පූර්ණයෙන්ම පිළිබිඹු නොවේ.

යහපත්කම-සුදුසු නිර්ණායක යනු පර්යේෂණාත්මක දත්ත සහ න්‍යායික ආකෘතියක් අතර එකඟතාව පරීක්ෂා කිරීම සඳහා නිර්මාණය කර ඇති සංඛ්‍යානමය නිර්ණායක වේ. නිරීක්ෂණ අහඹු නියැදියක් නියෝජනය කරන්නේ නම් මෙම ප්‍රශ්නය වඩාත් හොඳින් වර්ධනය වේ. මෙම නඩුවේ න්යායික ආකෘතිය බෙදාහැරීමේ නීතිය විස්තර කරයි.

න්‍යායාත්මක ව්‍යාප්තිය යනු අහඹු තේරීම පාලනය කරන සම්භාවිතා ව්‍යාප්තියයි. න්‍යායට විතරක් නෙවෙයි ඒ ගැන අදහස් දෙන්න පුළුවන්. මෙහි දැනුමේ මූලාශ්‍ර සම්ප්‍රදාය, අතීත අත්දැකීම් සහ පෙර නිරීක්ෂණ විය හැකිය. අප එය පරීක්ෂා කිරීමට යන දත්ත නොසලකා මෙම බෙදා හැරීම තෝරා ගත යුතු බව අවධාරණය කළ යුතුය. වෙනත් වචන වලින් කිවහොත්, නියැදියක් භාවිතයෙන් යම් බෙදාහැරීමේ නීතියක් මුලින්ම "ගැලපීම" පිළිගත නොහැකි අතර, එම නියැදියම භාවිතා කර ලබාගත් නීතිය සමඟ එකඟතාව පරීක්ෂා කිරීමට උත්සාහ කරන්න.

සරල හා සංකීර්ණ උපකල්පන. දී ඇති නියැදියක මූලද්‍රව්‍ය උපකල්පිතව අනුගමනය කළ යුතු න්‍යායික ව්‍යාප්ති නීතිය ගැන කතා කරමින්, මෙම නීතිය පිළිබඳ සරල හා සංකීර්ණ උපකල්පන අතර වෙනස හඳුනාගත යුතුය:

· සරල උපකල්පනයක් සෘජුවම පෙන්නුම් කරන්නේ නියැදි අගයන් ඇති වූ යම් සම්භාවිතා නීතියක් (සම්භාවිතා ව්‍යාප්තිය) ය;

· සංකීර්ණ කල්පිතයක් තනි ව්යාප්තියක් පෙන්නුම් කරයි, නමුත් ඒවායින් සමහරක් කට්ටලයක් (උදාහරණයක් ලෙස, පරාමිතික පවුලක්).

යෝග්‍යතාවයේ යහපත්කම නිර්ණායක පදනම් වී ඇත්තේ විශ්ලේෂණය කරන ලද ආනුභවික ව්‍යාප්තිය සහ ජනගහනයේ ලක්ෂණයේ ව්‍යාප්ති ශ්‍රිතය අතර දුර මැනීමේ විවිධ මිනුම් භාවිතය මතය.

කොල්මොගොරොව්, ස්මිර්නොව් සහ ඔමේගා චතුරශ්‍රය යන පරාමිතික නොවන යහපත්තා පරීක්ෂණ බහුලව භාවිතා වේ. කෙසේ වෙතත්, ඒවා සංඛ්‍යානමය ක්‍රම භාවිතා කිරීමේදී පුලුල්ව පැතිරුනු දෝෂ සමඟ ද සම්බන්ධ වේ.

කාරණය නම්, ලැයිස්තුගත නිර්ණායක සම්පූර්ණයෙන් දන්නා න්‍යායික ව්‍යාප්තියක් සමඟ ගිවිසුමක් පරීක්ෂා කිරීම සඳහා සකස් කර ඇති බවයි. ගණනය කිරීමේ සූත්‍ර, බෙදාහැරීමේ වගු සහ තීරණාත්මක අගයන් බහුලව භාවිතා වේ. කොල්මොගොරොව්, ඔමේගා චතුරස්රය සහ ඒ හා සමාන පරීක්ෂණවල ප්රධාන අදහස වන්නේ ආනුභවික බෙදාහැරීමේ කාර්යය සහ න්යායික බෙදාහැරීමේ කාර්යය අතර දුර මැනීමයි. මෙම නිර්ණායක බෙදා හැරීමේ ශ්‍රිතවල අවකාශයේ ඇති දුර ප්‍රමාණය අනුව වෙනස් වේ.

මේ සමඟ ආරම්භ කිරීම පාඨමාලා වැඩ, පවතින එකඟතා නිර්ණායක මොනවාදැයි සොයා බැලීමට, ඒවා අවශ්‍ය වන්නේ මන්දැයි සොයා බැලීමට මම ඉලක්කයක් තබමි. මෙම ඉලක්කය සපුරා ගැනීම සඳහා, ඔබ පහත සඳහන් කාර්යයන් සම්පූර්ණ කළ යුතුය:

1. "අනුමත කිරීමේ නිර්ණායක" සංකල්පයේ සාරය හෙළි කරන්න;

2. පවතින එකඟතා නිර්ණායක මොනවාදැයි තීරණය කර ඒවා වෙන වෙනම අධ්‍යයනය කරන්න;

3. සිදු කරන ලද කාර්යය පිළිබඳ නිගමන උකහා ගන්න.


I වගන්තිය. එකඟතා නිර්ණායකයේ න්‍යායාත්මක පසුබිම

1.1 සරල උපකල්පනයකදී Kolmogorov යහපත්කම-සුදුසුකම් පරීක්ෂණ සහ ඔමේගා වර්ග

සරල උපකල්පනයක්. මනින ලද දත්ත සංඛ්‍යා, වෙනත් වචන වලින් කිවහොත්, ඒකමාන අහඹු විචල්‍යයන් වන තත්වයක් සලකා බලමු. ඒකමාන සසම්භාවී විචල්‍යවල ව්‍යාප්තිය සම්පූර්ණයෙන්ම විස්තර කළ හැක්කේ ඒවායේ ව්‍යාප්ති ශ්‍රිත නියම කිරීමෙනි. තවද බොහෝ යහපත් යෝග්‍යතා පරීක්ෂණ පදනම් වී ඇත්තේ න්‍යායික සහ ආනුභවික (නියැදි) බෙදා හැරීමේ ශ්‍රිතවල සමීපභාවය පරීක්ෂා කිරීම මත ය.

අපි හිතමු අපි ළඟ n සාම්පලයක් තියෙනවා කියලා. නිරීක්ෂණවලට යටත් වන සත්‍ය ව්‍යාප්ති ශ්‍රිතය, G(x), අනුභූතික (නියැදි) ව්‍යාප්ති ශ්‍රිතය, Fn(x) සහ උපකල්පිත ව්‍යාප්ති ශ්‍රිතය, F(x) සඳහන් කරමු. එවිට සත්‍ය ව්‍යාප්ති ශ්‍රිතය F(x) යන උපකල්පිතය H: G(·) = F(·) ආකාරයෙන් ලියා ඇත.

H උපකල්පනය පරීක්ෂා කරන්නේ කෙසේද? H සත්‍ය නම්, F n සහ F යම් සමානකමක් පෙන්විය යුතු අතර, n වැඩි වන විට ඒවා අතර වෙනස අඩු විය යුතුය. බර්නූලිගේ ප්‍රමේයය හේතුවෙන් F n (x) → F(x) n → ∞ ලෙස. F n සහ F යන ශ්‍රිතවල සමානතාවය ප්‍රමාණාත්මකව ප්‍රකාශ කිරීමට, භාවිතා කරන්න විවිධ ක්රම.

ශ්රිතවල සමානත්වය ප්රකාශ කිරීම සඳහා, මෙම කාර්යයන් අතර එක් හෝ තවත් දුරක් භාවිතා කළ හැකිය. උදාහරණයක් ලෙස, ඔබට F n සහ F ඒකාකාර මෙට්රික් තුළ සංසන්දනය කළ හැකිය, i.e. අගය සලකා බලන්න:

(1.1)

D n සංඛ්‍යාලේඛනය Kolmogorov සංඛ්‍යාලේඛනය ලෙස හැඳින්වේ.

පැහැදිලිවම, D n යනු අහඹු විචල්‍යයකි, මන්ද එහි අගය අහඹු වස්තුව F n මත රඳා පවතී. උපකල්පනය H 0 සත්‍ය සහ n → ∞ නම්, ඕනෑම x සඳහා F n (x) → F(x) වේ. එබැවින්, මෙම තත්වයන් යටතේ D n → 0. කල්පිතය H 0 අසත්‍ය නම්, F n → G සහ G ≠ F, සහ එම නිසා sup -∞

උපකල්පනයක් පරීක්‍ෂා කිරීමේදී සෑම විටම මෙන්, අපි උපකල්පනය සත්‍යයක් ලෙස තර්ක කරමු. D n සංඛ්‍යාලේඛනයේ පර්යේෂණාත්මකව ලබාගත් අගය විශ්වාස කළ නොහැකි තරම් විශාල බව පෙනේ නම් H 0 ප්‍රතික්ෂේප කළ යුතු බව පැහැදිලිය. නමුත් මෙය සිදු කිරීම සඳහා, ලබා දී ඇති n සහ G සඳහා H: F = G කල්පිතය යටතේ D n සංඛ්‍යාලේඛන බෙදා හරින ආකාරය ඔබ දැනගත යුතුය.

D n හි කැපී පෙනෙන ගුණයක් නම් G = F නම්, i.e. උපකල්පිත ව්‍යාප්තිය නිවැරදිව සඳහන් කර ඇත්නම්, සංඛ්‍යාලේඛන D n හි බෙදා හැරීමේ නියමය සියලුම අඛණ්ඩ ශ්‍රිත සඳහා සමාන වේ G. එය රඳා පවතින්නේ නියැදි ප්‍රමාණය මත පමණි.

x-අක්ෂයේ ඒකාකාරී පරිවර්තනයන් යටතේ සංඛ්‍යාලේඛන ඒවායේ අගය වෙනස් නොවන බව මෙම කරුණ සනාථ කරයි. මෙම පරිවර්තනය සමඟ, ඕනෑම අඛණ්ඩ ව්‍යාප්තිය G පරතරය මත ඒකාකාර ව්‍යාප්තියක් බවට පත් කළ හැක. මෙම අවස්ථාවෙහිදී, F n (x) මෙම ඒකාකාර ව්‍යාප්තියෙන් නියැදියේ බෙදා හැරීමේ කාර්යය බවට පත්වේ.

කුඩා n සඳහා, H 0 උපකල්පනය යටතේ සංඛ්‍යාලේඛන D n සඳහා ප්‍රතිශත ලක්ෂ්‍ය වගු සම්පාදනය කර ඇත. විශාල n සඳහා, D n (උපකල්පනය යටතේ H 0) ව්යාප්තිය 1933 දී A.N විසින් සොයාගත් සීමාව ප්රමේයය මගින් පෙන්නුම් කෙරේ. ඇය සංඛ්යා ලේඛන ගැන කතා කරයි

(H 0 හි D n → 0 අගයම බැවින්, ව්‍යාප්තිය ස්ථායී වීම සඳහා එය අසීමිත ලෙස වර්ධනය වන අගයකින් ගුණ කිරීම අවශ්‍ය වේ). කොල්මොගොරොව්ගේ ප්‍රමේයය H 0 සත්‍ය නම් සහ G අඛණ්ඩ නම්:
(1.2)

මෙම මුදල Maple හි ගණනය කිරීම ඉතා පහසුය. සරල උපකල්පනයක් පරීක්ෂා කිරීම සඳහා H 0: G = F, මුල් නියැදියෙන් සංඛ්යාලේඛන D n අගය ගණනය කිරීම අවශ්ය වේ. මේ සඳහා සරල සූත්‍රයක් ක්‍රියා කරයි:

(1.3)

මෙහිදී, x k යනු මුල් නියැදියෙන් සාදන ලද විචල්‍ය ශ්‍රේණියේ මූලද්‍රව්‍ය වේ. එවිට Dn හි ප්‍රතිඵලයක් ලෙස ලැබෙන අගය වගු වලින් උපුටා ගන්නා ලද තීරණාත්මක අගයන් සමඟ සංසන්දනය කළ යුතුය හෝ අසමමිතික සූත්‍රයක් භාවිතයෙන් ගණනය කළ යුතුය. D n හි පර්යේෂණාත්මකව ලබාගත් අගය පිළිගත් වැදගත්කම මට්ටමට අනුරූප වන තෝරාගත් තීරණාත්මක අගය ඉක්මවන්නේ නම්, H 0 උපකල්පනය ප්‍රතික්ෂේප කළ යුතුය (තෝරාගත් වැදගත්කමේ මට්ටමේදී).

අනුකලිත මෙට්‍රික් හි F n සහ F අතර දුර මැනීමෙන් අපි තවත් ජනප්‍රිය ගිවිසුම් නිර්ණායකයක් ලබා ගනිමු. එය ඊනියා ඔමේගා වර්ග සංඛ්යාලේඛන මත පදනම් වේ:

(1.4)

සැබෑ දත්ත භාවිතයෙන් එය ගණනය කිරීම සඳහා, ඔබට සූත්රය භාවිතා කළ හැකිය:

(1.5)

කල්පිතය H 0 සත්‍ය නම් සහ G ශ්‍රිතය අඛණ්ඩ නම්, D n සංඛ්‍යාලේඛනයේ ව්‍යාප්තිය මෙන් ඔමේගා වර්ග සංඛ්‍යාලේඛනයේ ව්‍යාප්තිය n මත පමණක් රඳා පවතින අතර G මත රඳා නොපවතී.

D n සඳහා මෙන්ම, සඳහා

කුඩා n සඳහා ප්‍රතිශත ලක්ෂ්‍ය වගු ඇති අතර n විශාල අගයන් සඳහා n සංඛ්‍යාලේඛනයේ ආන්තික (n → ∞ ලෙස) ව්‍යාප්තිය භාවිතා කළ යුතුය. මෙහිදී නැවතත් අපට අසීමිත ලෙස වර්ධනය වන සාධකයකින් ගුණ කළ යුතුය. සීමාකාරී ව්‍යාප්තිය 1939 දී N.V. ස්මිර්නොව් විසින් සොයා ගන්නා ලදී. ඒ සඳහා සවිස්තර වගු සහ පරිගණක වැඩසටහන් සම්පාදනය කරන ලදී. D n මත පදනම් වූ නිර්ණායකවල වැදගත් ගුණාංගයක් සහ න්‍යායික දෘෂ්ටි කෝණයකින්: ඒවා ඕනෑම විකල්ප G ≠ F සමඟ අනුකූල වේ.

විචල්‍ය බෙදාහැරීමේ ශ්‍රේණි විශ්ලේෂණය කිරීමේදී, එය කෙසේද යන්න ඉතා වැදගත් වේ ආනුභවික ව්යාප්තියලකුණ අනුරූප වේ සාමාන්ය. මෙය සිදු කිරීම සඳහා, සැබෑ ව්යාප්තියේ සංඛ්යාතයන් සාමාන්ය ව්යාප්තියක ලක්ෂණයක් වන න්යායික ඒවා සමඟ සැසඳිය යුතුය. මෙයින් අදහස් කරන්නේ සත්‍ය දත්ත මත පදනම්ව, සාමාන්‍යකරණය වූ අපගමනයන්හි ශ්‍රිතයක් වන සාමාන්‍ය ව්‍යාප්ති වක්‍රයේ න්‍යායාත්මක සංඛ්‍යාත ගණනය කිරීම අවශ්‍ය වන බවයි.

වෙනත් වචන වලින් කිවහොත්, ආනුභවික බෙදා හැරීමේ වක්‍රය සාමාන්‍ය බෙදාහැරීමේ වක්‍රය සමඟ පෙළගැස්විය යුතුය.

අනුකූලතාවයේ වෛෂයික ලක්ෂණ න්යායිකසහ ආනුභවික සංඛ්යාතයනුවෙන් හැඳින්වෙන විශේෂ සංඛ්යාන දර්ශක භාවිතයෙන් ලබා ගත හැක එකඟතා නිර්ණායක.

ගිවිසුම් නිර්ණායකයවිෂමතාවය දැයි තීරණය කිරීමට ඔබට ඉඩ සලසන නිර්ණායකයක් ලෙස හැඳින්වේ ආනුභවිකසහ න්යායිකබෙදාහැරීම් අහඹු හෝ වැදගත් වේ, එනම් නිරීක්ෂණ දත්ත ඉදිරිපත් කරන ලද සංඛ්‍යානමය උපකල්පනය සමඟ එකඟ වන්නේද නැතහොත් එකඟ නොවන්නේද යන්න. ඉදිරිපත් කරන ලද කල්පිතය හේතුවෙන් ජනගහන ව්‍යාප්තිය න්‍යායික ලෙස හැඳින්වේ.

ස්ථාපනය කිරීමේ අවශ්යතාවයක් ඇත නිර්ණායකය(නීතිය) අනුභූතික සහ න්‍යායික ව්‍යාප්තිය අතර ඇති විෂමතාවය අහඹු හෝ වැදගත්ද යන්න විනිශ්චය කිරීමට කෙනෙකුට ඉඩ සලසයි. විෂමතාවය හැරෙනවා නම් අහඹු, එවිට ඔවුන් විශ්වාස කරන්නේ නිරීක්ෂණ දත්ත (නියැදිය) සාමාන්‍ය ජනගහනයේ බෙදා හැරීමේ නීතිය පිළිබඳව ඉදිරිපත් කරන ලද උපකල්පනයට අනුකූල වන අතර, එබැවින් උපකල්පනය පිළිගනු ලැබේ; විෂමතාවය හැරෙන්නේ නම් සැලකිය යුතු, එවිට නිරීක්ෂණ දත්ත උපකල්පනය සමඟ එකඟ නොවන අතර එය ප්රතික්ෂේප කරනු ලැබේ.

සාමාන්‍යයෙන්, ආනුභවික සහ න්‍යායික සංඛ්‍යාත වෙනස් වන්නේ:

  • විෂමතාව අහඹු වන අතර සීමිත නිරීක්ෂණ සංඛ්‍යාවක් හේතුවෙන්;
  • විෂමතාව අහම්බයක් නොවන අතර ජනගහනය සාමාන්‍යයෙන් බෙදා හරිනු ලැබේ යන සංඛ්‍යානමය උපකල්පනය වැරදි බව පැහැදිලි කරයි.

මේ අනුව, එකඟතා නිර්ණායකඅනුභූතික ශ්‍රේණියේ ව්‍යාප්තියේ ස්වභාවය පිළිබඳව ශ්‍රේණි පෙළගැස්වීමේදී ඉදිරිපත් කරන ලද කල්පිතයේ නිවැරදි බව ප්‍රතික්ෂේප කිරීමට හෝ තහවුරු කිරීමට හැකි වේ.

ආනුභවික සංඛ්යාතනිරීක්ෂණ ප්රතිඵලයක් ලෙස ලබා ගන්නා ලදී. න්යායික සංඛ්යාතසූත්ර භාවිතයෙන් ගණනය කරනු ලැබේ.

සඳහා සාමාන්ය බෙදාහැරීමේ නීතියඒවා පහත පරිදි සොයාගත හැකිය:

  • මම - සමුච්චිත (සමුච්චිත) අනුභූතික සංඛ්‍යාතවල එකතුව
  • h - අසල්වැසි විකල්ප දෙකක් අතර වෙනස
  • σ - නියැදි සම්මත අපගමනය
  • t-සාමාන්‍ය (ප්‍රමිතිගත) අපගමනය
  • φ(t)–සාමාන්‍ය ව්‍යාප්තියේ සම්භාවිතා ඝනත්ව ශ්‍රිතය (t හි අනුරූප අගය සඳහා සොයා ගනී)

යෝග්‍යතාවයට ගැලපෙන පරීක්ෂණ කිහිපයක් ඇත, ඒවායින් වඩාත් සුලභ වන්නේ: චි-චතුරස්‍ර පරීක්ෂණය (පියර්සන්), කොල්මොගොරොව් පරීක්ෂණය, රොමානොව්ස්කි පරීක්ෂණය.

Pearson's goodness-of-fit test χ 2- න්‍යායාත්මක (f T) සහ ආනුභවික (f) සංඛ්‍යාත සහ න්‍යායාත්මක සංඛ්‍යාත අතර වෙනසෙහි වර්ගවල අනුපාතවල එකතුව ලෙස නිරූපණය කළ හැකි ප්‍රධාන ඒවායින් එකක්:

  • k යනු ආනුභවික ව්‍යාප්තිය බෙදී ඇති කණ්ඩායම් ගණනයි.
  • f i - i-th කාණ්ඩයේ ලක්ෂණයේ නිරීක්ෂිත සංඛ්යාතය,
  • f ටී - න්යායික සංඛ්යාතය.

χ 2 ව්‍යාප්තිය සඳහා, තෝරාගත් වැදගත්කමේ මට්ටම α සහ නිදහසේ df (හෝ ν) සඳහා χ 2 යහපත්කම-සුදුසු නිර්ණායකයේ තීරණාත්මක අගය පෙන්නුම් කරන වගු සම්පාදනය කර ඇත.
වැදගත්කම මට්ටම α යනු යෝජිත කල්පිතය වැරදි ලෙස ප්‍රතික්ෂේප කිරීමේ සම්භාවිතාවයි, i.e. නිවැරදි කල්පිතයක් ප්‍රතික්ෂේප වීමේ සම්භාවිතාව. ආර් - සංඛ්යානමය වැදගත්කමනිවැරදි කල්පිතය පිළිගැනීම. සංඛ්යා ලේඛනවලදී, වැදගත්කමේ මට්ටම් තුනක් බොහෝ විට භාවිතා වේ:

α=0.10, පසුව P=0.90 (අවස්ථා 100න් 10කදී)

α=0.05, පසුව P=0.95 (අවස්ථා 100න් 5කදී)

α=0.01, පසුව P=0.99 (100 න් 1 අවස්ථාවක) නිවැරදි කල්පිතය ප්‍රතික්ෂේප කළ හැක

නිදහසේ df අංශක ගණන අර්ථ දක්වා ඇත්තේ බෙදාහැරීමේ ශ්‍රේණියේ කණ්ඩායම් සංඛ්‍යාව සම්බන්ධතා සංඛ්‍යාව අඩු කිරීමෙනි: df = k –z. සම්බන්ධතා ගණන න්‍යායාත්මක සංඛ්‍යාත ගණනය කිරීමේදී භාවිතා කරන ආනුභවික ශ්‍රේණියේ දර්ශක ගණන ලෙස වටහාගෙන ඇත, i.e. ආනුභවික සහ න්‍යායාත්මක සංඛ්‍යාත සම්බන්ධ කරන දර්ශක.උදාහරණයක් ලෙස, සීනු වක්‍රයක් සමඟ පෙළගැස්වූ විට, සම්බන්ධතා තුනක් ඇත.එබැවින්, පෙළගස්වන විටසීනුව වක්රයනිදහසේ අංශක ගණන df =k–3 ලෙස අර්ථ දක්වා ඇත.වැදගත්කම තක්සේරු කිරීම සඳහා, ගණනය කළ අගය χ වගුව සමඟ සංසන්දනය කරයිමේස 2 ක්

න්‍යායික සහ ආනුභවික ව්‍යාප්තිය සම්පූර්ණ අහඹු ලෙස χ 2 =0, එසේ නොමැතිනම් χ 2 >0. χ 2 calc > χ 2 ටැබ් නම් , පසුව දී ඇති වැදගත්කමේ මට්ටමක් සහ නිදහසේ අංශක ගණන සඳහා, නොගැලපීම්වල නොවැදගත්කම (අහඹු බව) පිළිබඳ උපකල්පනය අපි ප්‍රතික්ෂේප කරමු.χ 2 ගණනය කළහොත්< χ 2 табл то අපි කල්පිතය පිළිගන්නා අතර P=(1-α) සම්භාවිතාව සමඟින් අපට න්‍යායික සහ ආනුභවික සංඛ්‍යාත අතර විෂමතාව අහඹු බව ප්‍රකාශ කළ හැකිය. එබැවින් ආනුභවික ව්‍යාප්තිය කීකරු වන බව ප්‍රකාශ කිරීමට හේතුවක් ඇත සාමාන්ය බෙදා හැරීම. ජනගහන ප්‍රමාණය ප්‍රමාණවත් තරම් විශාල නම් (N>50) Pearson's goodness-of-fit පරීක්ෂණය භාවිතා කරනු ලබන අතර, එක් එක් කාණ්ඩයේ සංඛ්‍යාතය අවම වශයෙන් 5 විය යුතුය.

සමුච්චිත ආනුභවික සහ න්‍යායාත්මක සංඛ්‍යාත අතර උපරිම විෂමතාව තීරණය කිරීම මත පදනම්ව:

මෙහි D සහ d පිළිවෙලින්, ආනුභවික සහ න්‍යායාත්මක ව්‍යාප්තියේ සමුච්චිත සංඛ්‍යාත සහ සමුච්චිත සංඛ්‍යාත අතර උපරිම වෙනස වේ.
Kolmogorov සංඛ්යාලේඛනවල බෙදාහැරීමේ වගුව භාවිතා කරමින්, සම්භාවිතාව තීරණය කරනු ලැබේ, එය 0 සිට 1 දක්වා වෙනස් විය හැක. P (λ) = 1 වන විට, සංඛ්යාතවල සම්පූර්ණ අහඹුතාවයක් ඇත, P (λ) = 0 - සම්පූර්ණ විෂමතාවයක්. සොයාගත් අගය λ ට සාපේක්ෂව P සම්භාවිතා අගය සැලකිය යුතු නම්, න්‍යායාත්මක සහ ආනුභවික ව්‍යාප්තිය අතර විෂමතා නොවැදගත් ය, එනම් ඒවා අහඹු බව අපට උපකල්පනය කළ හැකිය.
Kolmogorov නිර්ණායකය භාවිතා කිරීම සඳහා ප්රධාන කොන්දේසිය ප්රමාණවත් තරම් විශාල නිරීක්ෂණ සංඛ්යාවකි.

Kolmogorov යහපත්කම-සුදුසුකම් පරීක්ෂණය

Kolmogorov නිර්ණායකය (λ) යෙදෙන විට අපි සලකා බලමු සාමාන්ය ව්යාප්තිය පිළිබඳ උපකල්පනය පරීක්ෂා කිරීමසාමාන්ය ජනගහනය.සීනු වක්‍රය සමඟ සැබෑ ව්‍යාප්තිය පෙළගැස්වීම පියවර කිහිපයකින් සමන්විත වේ:

  1. සැබෑ සහ න්‍යායික සංඛ්‍යාත සසඳන්න.
  2. සත්‍ය දත්ත මත පදනම්ව, සාමාන්‍යකරණය වූ අපගමනයෙහි ශ්‍රිතයක් වන සාමාන්‍ය ව්‍යාප්ති වක්‍රයේ න්‍යායික සංඛ්‍යාත තීරණය කරනු ලැබේ.
  3. ලක්ෂණයේ ව්‍යාප්තිය සාමාන්‍ය මට්ටමට කෙතරම් දුරට අනුරූප වේද යන්න ඔවුන් පරීක්ෂා කරයි.

සඳහාIVවගු තීරු:

MS Excel හි, සාමාන්‍යකරණය වූ අපගමනය (t) ගණනය කරනු ලබන්නේ NORMALIZATION ශ්‍රිතය භාවිතා කරමිනි. විකල්ප ගණන (පැතුරුම්පත් පේළි) මගින් නිදහස් සෛල පරාසයක් තෝරා ගැනීම අවශ්ය වේ. තේරීම ඉවත් නොකර, NORMALIZE ශ්‍රිතය අමතන්න. දිස්වන සංවාද කොටුවෙහි, පහත දැක්වෙන සෛල සඳහන් කරන්න, පිළිවෙලින්, නිරීක්ෂණය කළ අගයන් (X i), සාමාන්‍ය (X) සහ සම්මත අපගමනය Ϭ අඩංගු වේ. මෙහෙයුම සම්පූර්ණ කළ යුතුය සමගාමී Ctrl+Shift+Enter එබීමෙන්

සඳහාවීවගු තීරු:

සාමාන්‍ය ව්‍යාප්තිය φ(t) හි සම්භාවිතා ඝනත්ව ශ්‍රිතය සාමාන්‍යකරණය වූ අපගමනය (t) හි අනුරූප අගය සඳහා දේශීය ලැප්ලේස් ශ්‍රිතයේ අගයන් වගුවෙන් සොයාගත හැකිය.

සඳහාVIවගු තීරු:

න්‍යායාත්මක බෙදා හැරීමේ නීතියට අනුභූතික ව්‍යාප්තියේ අනුරූප පිළිබඳ උපකල්පනය පරීක්ෂා කිරීම සඳහා, විශේෂ සංඛ්‍යාන දර්ශක භාවිතා කරනු ලැබේ - යහපත්කම-සුදුසු නිර්ණායක (හෝ අනුකූලතා නිර්ණායක). මේවාට Pearson, Kolmogorov, Romanovsky, Yastremsky යනාදී නිර්ණායක ඇතුළත් වේ. බොහෝ ගිවිසුම් නිර්ණායක පදනම් වී ඇත්තේ න්‍යායාත්මක ඒවායින් අනුභූතික සංඛ්‍යාතවල අපගමනය භාවිතා කිරීම මත ය.

පැහැදිලිවම, මෙම අපගමනය කුඩා වන තරමට, න්‍යායික ව්‍යාප්තිය ආනුභවික එකට අනුරූප වේ (හෝ එය විස්තර කරයි).එකඟතා නිර්ණායක

- මේවා න්‍යායික සම්භාවිතා ව්‍යාප්තියට ආනුභවික ව්‍යාප්තියේ අනුරූප පිළිබඳ උපකල්පන පරීක්ෂා කිරීමේ නිර්ණායක වේ. එවැනි නිර්ණායක පන්ති දෙකකට බෙදා ඇත: සාමාන්ය සහ විශේෂ. සාමාන්‍ය හොඳ යෝග්‍යතා පරීක්ෂණ උපකල්පනයක වඩාත් සාමාන්‍ය සූත්‍රගත කිරීම සඳහා අදාළ වේ, එනම්, ප්‍රතිඵල නිරීක්ෂණය කරන ලද කල්පිතය ඕනෑම පූර්ව උපකල්පිත සම්භාවිතා ව්‍යාප්තියක් සමඟ එකඟ වේ. විශේෂ හොඳ-සුදුසුකම් පරීක්ෂණවලට විශේෂිත ශුන්‍ය උපකල්පන ඇතුළත් වන අතර එය යම් ආකාරයක සම්භාවිතා ව්‍යාප්තියක් සමඟ එකඟ වේ. ස්ථාපිත බෙදාහැරීමේ නීතිය මත පදනම් වූ ගිවිසුම් නිර්ණායක, න්‍යායික සහ ආනුභවික සංඛ්‍යාත අතර විෂමතා නොවැදගත් (අහඹු ලෙස) සැලකිය යුත්තේ කවදාද සහ කවදාද - සැලකිය යුතු (අහඹු නොවන) ස්ථාපිත කිරීමට හැකි වේ. අනුභූතික ශ්‍රේණියේ බෙදා හැරීමේ ස්වභාවය පිළිබඳව මාලාව පෙළගැස්වීමේදී ඉදිරිපත් කරන ලද උපකල්පනයේ නිවැරදි බව ප්‍රතික්ෂේප කිරීමට හෝ තහවුරු කිරීමට ගිවිසුම් නිර්ණායක මඟින් හැකි වන අතර ලබා දී ඇති ආනුභවික ව්‍යාප්තිය සඳහා පිළිගත හැකිද යන්න පිළිතුරු දීමට ඉඩ සලසයි. සමහරුන් විසින් ප්රකාශිත ආකෘතියක්බෙදාහැරීම්.

න්යායික නීතියපියර්සන්ගේ හොඳ යෝග්‍යතා පරීක්ෂණය

c 2 (chi-square) යනු ගිවිසුම සඳහා වන ප්‍රධාන නිර්ණායකයකි. ඉංග්‍රීසි ගණිතඥ කාල් පියර්සන් (1857-1936) විසින් ආනුභවික සහ න්‍යායික ව්‍යාප්ති සංඛ්‍යාත අතර විෂමතාවන්හි අහඹු බව (වැදගත්කම) තක්සේරු කිරීම සඳහා යෝජනා කරන ලදී:

න්‍යායාත්මක සහ ආනුභවික බෙදාහැරීම්වල අනුකූලතාව තක්සේරු කිරීම සඳහා නිර්ණායක c 2 යෙදීමේ යෝජනා ක්‍රමය පහත දක්වා ඇත:

1. විෂමතාවයේ ගණනය කරන ලද මිනුම තීරණය කරනු ලැබේ.

2. නිදහසේ අංශක ගණන තීරණය වේ.

3. නිදහසේ අංශක ගණන මත පදනම්ව n, විශේෂ වගුවක් භාවිතා කරමින්, තීරණය කරනු ලැබේ.

වැදගත්කම මට්ටමඉදිරිපත් කරන ලද කල්පිතය වැරදි ලෙස ප්‍රතික්ෂේප කිරීමේ සම්භාවිතාවයි, i.e. නිවැරදි කල්පිතයක් ප්‍රතික්ෂේප වීමේ සම්භාවිතාව. සංඛ්‍යානමය අධ්‍යයනයන්හිදී, විසඳන ගැටළු වල වැදගත්කම සහ වගකීම මත පදනම්ව, පහත දැක්වෙන වැදගත්කමේ මට්ටම් තුන භාවිතා වේ:

1) a = 0.1, එවිට ආර් = 0,9;

2) a = 0.05, එවිට ආර් = 0,95;

3) a = 0.01, එවිට ආර් = 0,99.

ගිවිසුමේ නිර්ණායක c 2 භාවිතා කරමින්, පහත කොන්දේසි සපුරාලිය යුතුය:

1. අධ්‍යයනයට ලක්වන ජනගහනයේ පරිමාව ප්‍රමාණවත් තරම් විශාල විය යුතුය ( එන්≥ 50), සංඛ්‍යාතය හෝ කණ්ඩායම් ප්‍රමාණය අවම වශයෙන් 5 විය යුතුය. මෙම කොන්දේසිය උල්ලංඝනය වී ඇත්නම්, පළමුව කුඩා සංඛ්‍යාත (5 ට අඩු) ඒකාබද්ධ කිරීම අවශ්‍ය වේ.

2. ආනුභවික ව්‍යාප්තිය අහඹු නියැදීමේ ප්‍රතිඵලයක් ලෙස ලබාගත් දත්ත වලින් සමන්විත විය යුතුය, i.e. ඔවුන් ස්වාධීන විය යුතුය.

Pearson goodness-of-fit නිර්ණායකයේ අවාසිය නම් නිරීක්ෂණ ප්‍රතිඵල කාලාන්තරවලට සමූහගත කිරීමේ අවශ්‍යතාවය හා සම්බන්ධ මුල් තොරතුරු සමහරක් නැතිවීම සහ නිරීක්ෂණ කුඩා සංඛ්‍යාවක් සමඟ තනි කාල පරතරයන් ඒකාබද්ධ කිරීමයි. මේ සම්බන්ධයෙන්, වෙනත් නිර්ණායක 2 ක් සමඟ නිර්ණායකයට අනුව බෙදා හැරීමේ අනුකූලතාව පරීක්ෂා කිරීම අතිරේකව නිර්දේශ කරනු ලැබේ. සාපේක්ෂව කුඩා නියැදි ප්‍රමාණයකින් මෙය විශේෂයෙන් අවශ්‍ය වේ ( n ≈ 100).

සංඛ්යා ලේඛන තුළ Kolmogorov යහපත්කම-සුදුසුකම් පරීක්ෂණය(Kolmogorov-Smirnov goodness-of-fit test ලෙසද හැඳින්වේ) ආනුභවික බෙදාහැරීම් දෙකක් එකම නීතියට කීකරු වන්නේද යන්න තීරණය කිරීමට හෝ ප්‍රතිඵලයක් ලෙස බෙදාහැරීම උපකල්පිත ආකෘතියකට කීකරු වන්නේද යන්න තීරණය කිරීමට භාවිතා කරයි. Kolmogorov නිර්ණායකය පදනම් වී ඇත්තේ ආනුභවික හෝ න්‍යායාත්මක බෙදාහැරීම්වල සමුච්චිත සංඛ්‍යාත හෝ සංඛ්‍යාත අතර උපරිම විෂමතාවය තීරණය කිරීම මත ය. Kolmogorov නිර්ණායකය පහත සූත්ර භාවිතා කර ගණනය කරනු ලැබේ:

කොහෙද ඩීසහ - ඒ අනුව, සමුච්චිත සංඛ්යාත අතර උපරිම වෙනස ( ff¢) සහ සමුච්චිත සංඛ්‍යාත අතර ( පිපි¢) අනුභූතික සහ න්‍යායාත්මක බෙදාහැරීම් මාලාවක්; එන්- එකතුවෙහි ඇති ඒකක ගණන.

අනුව, λ හි අගය ගණනය කර ඇත විශේෂ වගුවන්‍යායික සංඛ්‍යාතවලින් ආනුභවික සංඛ්‍යාතවල අපගමනය අහඹු බව ප්‍රකාශ කළ හැකි සම්භාවිතාව තීරණය වේ. ලකුණ 0.3 දක්වා අගයන් ගන්නේ නම්, මෙයින් අදහස් කරන්නේ සංඛ්‍යාතවල සම්පූර්ණ අහඹු සිදුවීමක් ඇති බවයි. නිරීක්ෂණ විශාල සංඛ්යාවක් සමඟ, Kolmogorov පරීක්ෂණය උපකල්පිතයෙන් කිසියම් අපගමනය හඳුනා ගැනීමට සමත් වේ. මෙයින් අදහස් කරන්නේ ප්‍රමාණවත් තරම් විශාල නිරීක්ෂණ සංඛ්‍යාවක් තිබේ නම් න්‍යායාත්මක එකකින් නියැදි ව්‍යාප්තියේ යම් වෙනසක් එහි ආධාරයෙන් අනාවරණය වන බවයි. ප්රායෝගික වැදගත්කමමෙම දේපල අත්‍යවශ්‍ය නොවේ, මන්ද බොහෝ අවස්ථාවන්හිදී ලැබීම මත ගණන් කිරීම දුෂ්කර ය විශාල සංඛ්යාවක්නිරන්තර තත්ව යටතේ නිරීක්ෂණ, නියැදියට කීකරු විය යුතු බෙදාහැරීමේ නීතියේ න්‍යායාත්මක අදහස සෑම විටම ආසන්න වන අතර සංඛ්‍යාන පරීක්ෂණවල නිරවද්‍යතාවය තෝරාගත් ආකෘතියේ නිරවද්‍යතාවය නොඉක්මවිය යුතුය.

රොමානොව්ස්කිගේ හොඳ යෝග්‍යතා පරීක්ෂණයපියර්සන් නිර්ණායකය භාවිතා කිරීම මත පදනම් වේ, i.e. දැනටමත් c 2 හි අගයන් සොයාගෙන ඇති අතර නිදහසේ අංශක ගණන:

මෙහි n යනු විචලනය වීමේ නිදහසේ අංශක ගණනයි.

සඳහා වගු නොමැති විට Romanovsky නිර්ණායකය පහසු වේ. නම්< 3, то расхождения распределений случайны, если же >3, එවිට ඒවා අහඹු නොවන අතර න්‍යායික ව්‍යාප්තිය අධ්‍යයනය කරනු ලබන ආනුභවික ව්‍යාප්තිය සඳහා ආදර්ශයක් ලෙස සේවය කළ නොහැක.

B. S. Yastremsky ගිවිසුමේ නිර්ණායකයේ භාවිතා කළේ නිදහසේ අංශක ගණන නොව කණ්ඩායම් ගණන ( කේ), කණ්ඩායම් ගණන අනුව q හි විශේෂ අගයක් සහ chi-square අගයක්. යස්ට්‍රෙම්ස්කිගේ හොඳ යෝග්‍යතා පරීක්ෂණය Romanovsky නිර්ණායකයට සමාන අර්ථයක් ඇති අතර එය සූත්රය මගින් ප්රකාශ කරනු ලැබේ

මෙහි c 2 යනු පියර්සන්ගේ යහපත්කම-සුදුසු නිර්ණායකය වේ; - කණ්ඩායම් සංඛ්යාව; q - සංගුණකය, 20 ට අඩු කණ්ඩායම් ගණන සඳහා, 0.6 ට සමාන වේ.

නම් එල්සත්‍යය > 3, න්‍යායික සහ ආනුභවික ව්‍යාප්තිය අතර විෂමතා අහඹු නොවේ, i.e. ආනුභවික ව්‍යාප්තිය සාමාන්‍ය ව්‍යාප්තියක අවශ්‍යතා සපුරාලන්නේ නැත. නම් එල්ඇත්ත< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.