Hozzájárulási feltételek. Hozzájárulási feltételek Hozzájárulási feltételek és mire használják őket

A ξ valószínűségi változó független méréseinek feldolgozásával létrehozhatunk egy F * (x) statisztikai eloszlásfüggvényt. Ennek a függvénynek a formája alapján elfogadhatjuk azt a hipotézist, hogy az igazi elméleti eloszlásfüggvény F(x). Maguk a mintát alkotó független mérések (x 1 , x 2 ,…,x n) azonos eloszlású valószínűségi változóknak tekinthetők F(x) hipotetikus eloszlásfüggvénnyel.

Nyilvánvaló, hogy lesz némi eltérés az F * (x) és F(x) függvények között. Felmerül a kérdés, hogy ezek az eltérések a korlátozott mintaszám következményei-e, vagy abból, hogy hipotézisünk nem helytálló, i.e. a valós eloszlásfüggvény nem F(x), hanem valami más. A probléma megoldására beleegyezési feltételeket alkalmaznak, amelyek lényege a következő. Egy bizonyos Δ(F, F *) érték kerül kiválasztásra, amely az F * (x) és F(x) függvények közötti eltérés mértékét jellemzi. Például Δ(F, F *)=Sup|F(x)-F * (x)|, azaz. a különbség modulusának x felső korlátja.

A hipotézist helyesnek tekintve, i.e. az F(x) eloszlásfüggvény ismeretében megtalálhatjuk a Δ(F, F *) valószínűségi változó eloszlási törvényét (ennek mikéntjét nem érintjük). Állítsuk be a p 0 számot olyan kicsire, hogy az esemény (Δ(F, F *)>Δ 0 ) bekövetkezését ezzel a valószínűséggel gyakorlatilag lehetetlennek tekintsük. Az állapottól

keressük meg a Δ 0 értéket. Itt f(x) a Δ(F,F *) eloszlássűrűség.

Számítsuk ki most az eredmények alapján a Δ(F, F *)= Δ 1 értéket

minták, azaz Keressük meg a Δ(F, F *) valószínűségi változó egyik lehetséges értékét. Ha Δ 1 ≥Δ 0, akkor ez azt jelenti, hogy gyakorlatilag lehetetlen esemény történt. Ez azzal magyarázható, hogy hipotézisünk nem helytálló. Tehát, ha Δ 1 ≥Δ 0, akkor a hipotézist elvetjük, és ha Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Különféle értékek vehetők fel a Δ(F, F *) eltérés mértékeként. Ettől függően különböző beleegyezési kritériumok születnek. Például a Kolmogorov, Mises, Pearson alkalmassági teszt vagy a khi-négyzet teszt.

Mutassuk be n mérés eredményét csoportosított, k számjegyű statisztikai sorozat formájában.

KIBOCSÁTÁS (x 0 ,x 1) (valójában feltételezzük, hogy a mérési hibák egyenletesen oszlanak el egy bizonyos szakaszon). Ekkor a hét kategória mindegyikébe való bejutás valószínűsége egyenlő lesz. A 11. §-ból származó csoportosított sorozatok felhasználásával az (1) képlet segítségével kiszámítjuk Δ(F, F *)= Δ 1 =. Ebben az esetben.

Mivel a hipotetikus eloszlási törvény két ismeretlen paramétert tartalmaz, α és β – a szegmens eleje és vége, a szabadsági fokok száma 7-1-2=4 lesz. A khi-négyzet eloszlástáblázatot p 0 =10 -3 kiválasztott valószínűséggel használva Δ 0 =18-at kapunk. Mert Δ 1 >Δ 0, akkor a mérési hiba egyenletes eloszlására vonatkozó hipotézist el kell vetni.

Bevezetés

A téma relevanciája, hogy a biostatisztika alapjainak tanulmányozása során feltételeztük, hogy ismert a sokaság eloszlási törvénye. De mi van akkor, ha az eloszlási törvény ismeretlen, de okkal feltételezhető, hogy van egy bizonyos formája (nevezzük A-nak), akkor a nullhipotézist teszteljük: a sokaságot az A törvény szerint osztjuk el. Ezt a hipotézist egy speciálisan kiválasztott valószínűségi változó – az illeszkedési jóság kritériuma.

Az illeszkedési jóság kritériumai az empirikus eloszlás és az elméleti valószínűségi eloszlás megfelelésére vonatkozó hipotézisek tesztelésének kritériumai. Az ilyen kritériumok két csoportra oszthatók:

  • Ш Az általános beleegyezési feltételek a legtöbbre érvényesek általános megfogalmazás hipotéziseket, nevezetesen azt a hipotézist, hogy a megfigyelt eredmények megegyeznek bármely a priori feltételezett valószínűségi eloszlással.
  • Ш A speciális illeszkedési tesztek speciális nullhipotéziseket foglalnak magukban, amelyek egy bizonyos valószínűségi eloszlási formával egyeznek meg.

Megállapodási kritérium

A leggyakoribb illeszkedési tesztek az omega-négyzet, a chi-négyzet, a Kolmogorov és a Kolmogorov-Smirnov.

A Kolmogorov, Smirnov és omega square nemparaméteres illeszkedési teszteket széles körben használják. Ezek azonban széles körben elterjedt alkalmazási hibákkal is járnak. statisztikai módszerek.

A tény az, hogy a felsorolt ​​kritériumokat egy teljesen ismert elméleti eloszlású egyezés tesztelésére fejlesztették ki. A számítási képleteket, az eloszlási táblázatokat és a kritikus értékeket széles körben használják. A Kolmogorov-, omega-négyzet- és hasonló tesztek fő ötlete az empirikus eloszlásfüggvény és az elméleti eloszlásfüggvény közötti távolság mérése. Ezek a kritériumok az eloszlásfüggvények terében lévő távolságok típusában különböznek.

Pearson alkalmassági tesztek egy egyszerű hipotézishez

K. Pearson tétele a véges számú kimenetelű független próbákra vonatkozik, pl. Bernoulli tesztekhez (kicsit kiterjesztett értelemben). Lehetővé teszi annak megítélését, hogy az eredmények gyakoriságának nagyszámú kísérletében végzett megfigyelések összhangban vannak-e a becsült valószínűségükkel.

Sok gyakorlati probléma esetében a pontos elosztási törvény ismeretlen. Ezért egy hipotézist állítunk fel a meglévő, megfigyelésekből felépített empirikus törvény valamely elméletinek való megfeleléséről. Ez a hipotézis statisztikai tesztelést igényel, amelynek eredményeit megerősítik vagy cáfolják.

Legyen X a tárgy valószínűségi változó. Meg kell vizsgálni azt a H0 hipotézist, hogy ez a valószínűségi változó megfelel az F(x) eloszlási törvénynek. Ehhez n független megfigyelésből álló mintát kell készíteni, és ennek alapján meg kell alkotni az F "(x) empirikus eloszlási törvényt. Az empirikus és a hipotetikus törvények összehasonlításához az illeszkedési jósági kritériumnak nevezett szabályt használjuk. Az egyik népszerű a K. Pearson-féle khi-négyzet illeszkedési tesztje.

ahol N azoknak az intervallumoknak a száma, amelyek alapján az empirikus eloszlási törvényt megszerkesztettük (a megfelelő hisztogram oszlopainak száma), i az intervallum száma, pt i annak valószínűsége, hogy a valószínűségi változó értéke beleesik i-edik intervallum az elméleti eloszlástörvény esetében pe i annak a valószínűsége, hogy a valószínűségi változó értéke az i-edik intervallumba esik az empirikus eloszlástörvény esetében. Engedelmeskednie kell a khi-négyzet eloszlásnak.

Ha a statisztika számított értéke egy adott szignifikanciaszint mellett meghaladja a k-p-1 szabadságfokú khi-négyzet eloszlás kvantilisét, akkor a H0 hipotézist elvetjük. Ellenkező esetben a megadott szignifikanciaszinten fogadják el. Itt k a megfigyelések száma, p az eloszlási törvény becsült paramétereinek száma.

Nézzük a statisztikákat:

A h2 statisztikát Pearson khi-négyzet statisztikának nevezzük egy egyszerű hipotézishez.

Nyilvánvaló, hogy h2 egy bizonyos távolság négyzetét jelenti két r-dimenziós vektor között: a relatív gyakoriságok vektora (mi /n, ..., mr /n) és a valószínűségi vektor (pi, ..., pr) között. ). Ez a távolság csak annyiban tér el az euklideszi távolságtól, hogy különböző koordináták különböző súllyal lépnek be.

Vizsgáljuk meg a h2 statisztika viselkedését abban az esetben, ha a H hipotézis igaz, és abban az esetben, amikor H hamis. Ha H igaz, akkor h2 aszimptotikus viselkedése n > ? K. Pearson tételét jelzi. Hogy megértsük, mi történik (2.2)-vel, ha H hamis, vegyük észre, hogy a nagy számok törvénye szerint mi /n > pi, ha n > ?, ha i = 1, …, r. Ezért n > ? esetén:

Ez az érték egyenlő 0-val. Ezért, ha H helytelen, akkor h2 >? (n > ? esetén).

A fentiekből következik, hogy H-t el kell vetni, ha a kísérletben kapott h2 érték túl nagy. Itt is, mint mindig, a „túl nagy” szavak azt jelentik, hogy a h2 megfigyelt értéke meghaladja a kritikus értéket, amely ebben az esetben a khi-négyzet eloszlási táblázatokból vehető ki. Más szóval, a P(ch2 npi h2) valószínűség kicsi érték, és ezért nem valószínű, hogy véletlenül ugyanazt kapja, mint a kísérletben, vagy még nagyobb eltérést a frekvenciavektor és a valószínűségi vektor között.

A szabály alapjául szolgáló K. Pearson-tétel aszimptotikus jellege óvatosságot igényel a használatakor. gyakorlati használat. Csak nagy n esetén lehet rá támaszkodni. Meg kell ítélni, hogy n elég nagy-e, figyelembe véve a pi, ..., pr valószínűségeket. Ezért nem mondható el például, hogy száz megfigyelés elég lesz, hiszen nemcsak n legyen nagy, hanem az npi , ..., npr szorzatok (várható frekvenciák) se legyenek kicsik. Ezért nehéznek bizonyult a h2 (folytonos eloszlás) közelítése a diszkrét eloszlású h2 statisztikához. Az elméleti és a kísérleti érvek kombinációja arra a meggyőződésre vezetett, hogy ez a közelítés akkor alkalmazható, ha az összes várható gyakoriság npi>10. ha az r szám (a különböző kimenetelek száma) növekszik, a for határértéke csökken (5-re vagy akár 3-ra is, ha r több tízes nagyságrendű). E követelmények teljesítéséhez a gyakorlatban néha több kimenet kombinálására van szükség, pl. váltson Bernoulli-sémára kisebb r-vel.

A leírt egyezés-ellenőrzési módszer nemcsak Bernoulli tesztekre, hanem véletlenszerű mintákra is alkalmazható. Először is, megfigyeléseiket csoportosítással Bernoulli-tesztekké kell alakítani. Ezt így teszik: a megfigyelési teret véges számú nem átfedő régióra osztják, majd minden régióra kiszámítják a megfigyelt gyakoriságot és a hipotetikus valószínűséget.

Ebben az esetben a korábban felsorolt ​​közelítési nehézségekhez még egy hozzáadódik - az eredeti tér ésszerű partíciójának kiválasztása. Ebben az esetben ügyelni kell arra, hogy a minta kezdeti eloszlására vonatkozó hipotézis tesztelésének szabálya általában kellően érzékeny legyen a lehetséges alternatívákra. Végezetül megjegyzem, hogy a Bernoulli-féle séma redukcióján alapuló statisztikai kritériumok általában nem konzisztensek minden alternatívával. Tehát a hozzájárulás ellenőrzésének ez a módszere korlátozott értékű.

A Kolmogorov-Smirnov illeszkedési jósági kritérium klasszikus formájában erősebb, mint a h2 kritérium, és felhasználható annak a hipotézisnek a tesztelésére, hogy az empirikus eloszlás megfelel-e bármilyen elméleti folytonos F(x) eloszlásnak, korábban ismert paraméterekkel. Ez utóbbi körülmény korlátozza e kritérium széles körű gyakorlati alkalmazásának lehetőségét a mechanikai vizsgálatok eredményeinek elemzésekor, mivel a jellemzők eloszlási függvényének paraméterei mechanikai tulajdonságai rendszerint magának a mintának az adataiból becsüljük meg.

A Kolmogorov-Smirnov kritériumot csoportosítatlan adatokra vagy csoportosított adatokra alkalmazzuk kis intervallumszélesség esetén (például erőmérő, terhelési ciklusszámláló stb. skálaosztásával egyenlő). Legyen n mintából álló sorozat vizsgálatának eredménye a mechanikai tulajdonságok jellemzőinek variációs sorozata

x1? x2 ? ...? xi? ...? xn. (3,93)

Meg kell vizsgálni azt a nullhipotézist, hogy a mintavételi eloszlás (3.93) az F(x) elméleti törvényhez tartozik.

A Kolmogorov-Smirnov-kritérium a halmozott partikuláris eloszlásfüggvény értékétől való maximális eltérésének eloszlásán alapul. Használatakor statisztikákat számítanak ki

ami a Kolmogorov-kritérium statisztikája. Ha az egyenlőtlenség fennáll

Dnvn? homlok (3,97)

nagy mintaméreteknél (n > 35) ill

Dn(vn + 0,12 + 0,11/vn) ? homlok (3,98)

n-re? 35, akkor a nullhipotézist nem utasítják el.

Ha a (3,97) és a (3,98) egyenlőtlenségek nem teljesülnek, egy alternatív hipotézist fogadunk el, miszerint a (3,93) minta ismeretlen eloszláshoz tartozik.

A lb kritikus értékei: l0,1 = 1,22; l0,05 = 1,36; l0,01 = 1,63.

Ha az F(x) függvény paraméterei nem ismertek előre, hanem mintaadatokból becsüljük meg, a Kolmogorov-Smirnov-kritérium elveszti univerzalitását, és csak bizonyos kísérleti adatok megfelelőségének ellenőrzésére használható. konkrét funkciókat disztribúciók.

Ha nullhipotézisként használjuk, hogy a kísérleti adatok normális vagy lognormális eloszláshoz tartoznak, a statisztikák kiszámítása történik:

ahol Ц(zi) a Laplace-függvény értéke

Ц(zi) = (xi - xср)/s A Kolmogorov-Smirnov-kritérium bármely n mintaméretre a következő formában van írva

A lb kritikus értékei ebben az esetben: l0,1 = 0,82; l0,05 = 0,89; l0,01 = 1,04.

Ha azt a hipotézist teszteljük, hogy a minta megfelel a *** exponenciális eloszlásnak, amelynek paraméterét kísérleti adatokból becsüljük meg, hasonló statisztikákat számolunk:

kritérium empirikus valószínűség

és alkotják a Kolmogorov-Smirnov kritériumot.

A lb kritikus értékei ebben az esetben: l0,1 = 0,99; l0,05 = 1,09; l0,01 = 1,31.

UKRAJNA OKTATÁSI ÉS TUDOMÁNYOS MINISZTÉRIUMA

AZOV REGIONÁLIS IRÁNYÍTÁSI INTÉZET

ZAPORIZSJE NEMZETI MŰSZAKI EGYETEM

Matematika Tanszék

TANFOLYAM MUNKA

3 tudományág "STATISZTIKA"

A témában: „BEJELENTKEZÉS KRITÉRIUMAI”

2. éves hallgatók

207. csoport Gazdálkodástudományi Kar

Batura Tatyana Olegovna

Tudományos felügyelő

Docens Kosenkov O.I.

Berdyansk - 2009


BEVEZETÉS

1.2 Pearson χ 2 illeszkedési tesztek egy egyszerű hipotézishez

1.3 Az illeszkedési kritériumok jósága összetett hipotézishez

1.4 Fisher-féle χ 2 illeszkedési tesztek egy összetett hipotézishez

1.5 Egyéb hozzájárulási feltételek. Jósági tesztek a Poisson-eloszláshoz

SZAKASZ II. A MEGÁLLAPODÁS KRITÉRIUMÁNAK GYAKORLATI ALKALMAZÁSA

ALKALMAZÁSOK

A HASZNÁLT HIVATKOZÁSOK JEGYZÉKE


BEVEZETÉS

Ez a kurzusmunka leírja a leggyakoribb illeszkedési teszteket - omega-négyzet, chi-négyzet, Kolmogorov és Kolmogorov-Smirnov. Különös figyelmet kell fordítani arra az esetre, amikor ellenőrizni kell, hogy az adateloszlás egy bizonyos paraméteres családba tartozik-e, például normál. Bonyolultsága miatt ezt a gyakorlatban igen gyakori helyzetet nem tanulmányozták teljes körűen, és nem tükrözik teljes mértékben az oktatási és referencia irodalomban.

Az illeszkedési kritériumok olyan statisztikai kritériumok, amelyeket a kísérleti adatok és az elméleti modell közötti egyezés tesztelésére terveztek. Ezt a kérdést akkor lehet a legjobban kidolgozni, ha a megfigyelések véletlenszerű mintát képviselnek. Az elméleti modell ebben az esetben az eloszlási törvényt írja le.

Az elméleti eloszlás a véletlenszerű kiválasztást szabályozó valószínűségi eloszlás. Nem csak az elmélet adhat ötleteket róla. A tudás forrása itt a hagyomány, a múltbeli tapasztalat és a korábbi megfigyelések lehetnek. Csak hangsúlyoznunk kell, hogy ezt az eloszlást kell választani, függetlenül attól, hogy milyen adatok alapján fogjuk ellenőrizni. Más szavakkal, elfogadhatatlan, hogy először egy minta segítségével „illesztünk” egy bizonyos eloszlási törvényt, majd ugyanazon a mintán próbálják ellenőrizni a kapott törvénnyel való egyezést.

Egyszerű és összetett hipotézisek. Az elméleti eloszlási törvényről szólva, amelyet egy adott minta elemeinek hipotetikusan követniük kell, meg kell különböztetni az egyszerű és összetett hipotéziseket erről a törvényről:

· egy egyszerű hipotézis közvetlenül jelez egy bizonyos valószínűségi törvényt (valószínűségi eloszlást), amely szerint a mintaértékek keletkeztek;

· egy összetett hipotézis egyetlen eloszlást jelez, de ezek egy részét (például egy parametrikus családot).

Az illeszkedési kritériumok a vizsgált empirikus eloszlás és a jellemző sokaságbeli eloszlásfüggvénye közötti távolságok különböző mértékeinek használatán alapulnak.

A Kolmogorov, Smirnov és omega square nemparaméteres illeszkedési teszteket széles körben használják. Ezek azonban a statisztikai módszerek alkalmazásának széles körben elterjedt hibáival is járnak.

A tény az, hogy a felsorolt ​​kritériumokat egy teljesen ismert elméleti eloszlású egyezés tesztelésére fejlesztették ki. A számítási képleteket, az eloszlási táblázatokat és a kritikus értékeket széles körben használják. A Kolmogorov-, omega-négyzet- és hasonló tesztek fő ötlete az empirikus eloszlásfüggvény és az elméleti eloszlásfüggvény közötti távolság mérése. Ezek a kritériumok az eloszlásfüggvények terében lévő távolságok típusában különböznek.

Kezdő lépések ezzel tanfolyami munka, azt a célt tűztem ki magam elé, hogy kiderítsem, milyen beleegyezési kritériumok léteznek, hogy rájöjjek, miért van rájuk szükség. A cél eléréséhez a következő feladatokat kell végrehajtania:

1. Feltárja a „beleegyezési kritériumok” fogalmának lényegét;

2. Határozza meg, milyen beleegyezési kritériumok léteznek, és tanulmányozza azokat külön-külön;

3. Az elvégzett munkából vonjon le következtetéseket!


I. SZAKASZ. A BEJELENTÉSI KRITÉRIUM ELMÉLETI HÁTTERE

1.1 Kolmogorov illeszkedési tesztek és omega-négyzet egyszerű hipotézis esetén

Egyszerű hipotézis. Tekintsünk egy olyan helyzetet, amikor a mért adatok számok, más szóval egydimenziós valószínűségi változók. Az egydimenziós valószínűségi változók eloszlása ​​teljes mértékben leírható eloszlási függvényeik megadásával. Sok illeszkedési teszt pedig az elméleti és empirikus (minta) eloszlásfüggvények közelségének ellenőrzésén alapul.

Tegyük fel, hogy van egy n mintánk. Jelöljük a valódi eloszlásfüggvényt, amelyre a megfigyelések vonatkoznak, G(x), az empirikus (minta) eloszlásfüggvényt, az Fn(x) és az F(x) hipotetikus eloszlásfüggvényt. Ekkor azt a H hipotézist, hogy a valódi eloszlásfüggvény F(x) H alakban írjuk fel: G(·) = F(·).

Hogyan teszteljük a H hipotézist? Ha H igaz, akkor F n és F bizonyos hasonlóságot mutat, és a köztük lévő különbségnek n növekedésével csökkennie kell. A Bernoulli-tétel miatt F n (x) → F(x) mint n → ∞. Az F n és F függvények hasonlóságának kvantitatív kifejezéséhez használja különféle módokon.

A függvények hasonlóságának kifejezésére ezeknek a függvényeknek a távolsága használható. Például összehasonlíthatja az F n-t és az F-et az egységes metrikában, azaz. vegye figyelembe az értéket:

(1.1)

A D n statisztikát Kolmogorov statisztikának nevezzük.

Nyilvánvaló, hogy D n egy valószínűségi változó, mivel az értéke az F n véletlenszerű objektumtól függ. Ha a H 0 hipotézis igaz és n → ∞, akkor F n (x) → F(x) bármely x esetén. Ezért természetes, hogy ilyen feltételek mellett D n → 0. Ha a H 0 hipotézis hamis, akkor F n → G és G ≠ F, tehát sup -∞

Mint mindig, amikor egy hipotézist tesztelünk, úgy érvelünk, mintha a hipotézis igaz lenne. Nyilvánvaló, hogy H 0-t el kell utasítani, ha a D n statisztika kísérletileg kapott értéke hihetetlenül nagynak tűnik. Ehhez azonban tudnia kell, hogyan oszlik meg a D n statisztika a H hipotézis szerint: F = G adott n és G esetén.

D n figyelemre méltó tulajdonsága, hogy ha G = F, azaz. ha a hipotetikus eloszlást helyesen adjuk meg, akkor a D n statisztika eloszlási törvénye minden folytonos G függvényre azonos. Csak az n mintanagyságtól függ.

Ennek bizonyítása azon alapul, hogy a statisztika nem változtatja meg értékét az x tengely monoton transzformációi során. Ezzel a transzformációval bármely G folytonos eloszlás egyenletes eloszlásúvá alakítható az intervallumon. Ebben az esetben az F n (x) ebből az egyenletes eloszlásból a minta eloszlásfüggvényévé válik.

Kis n esetén a H 0 hipotézis alapján a D n statisztikához százalékpontos táblázatokat állítottak össze. Nagy n esetén a D n eloszlását (a H 0 hipotézis alatt) az A.N. Kolmogorov által 1933-ban talált határtétel jelzi. Statisztikáról beszél

(mivel maga az érték D n → 0 H 0-nál, ezért az eloszlás stabilizálódásához meg kell szorozni egy korlátlanul növekvő értékkel). Kolmogorov tétele kimondja, hogy ha H 0 igaz és ha G folytonos:
(1.2)

Ez az összeg nagyon könnyen kiszámítható Maple-ben. Egy egyszerű H 0 hipotézis: G = F teszteléséhez ki kell számítani a D n statisztika értékét az eredeti mintából. Erre egy egyszerű képlet működik:

(1.3)

Itt x k az eredeti mintából összeállított variációs sorozat elemei. A kapott Dn-értéket ezután össze kell hasonlítani a táblázatokból kinyert vagy aszimptotikus képlettel kiszámított kritikus értékekkel. A H 0 hipotézist el kell vetni (a kiválasztott szignifikanciaszinten), ha a kísérletileg kapott D n értéke meghaladja az elfogadott szignifikanciaszintnek megfelelő kiválasztott kritikus értéket.

Egy másik népszerű megegyezési kritériumot kapunk, ha megmérjük az F n és F távolságát az integrálmetrikában. Az úgynevezett omega-négyzet statisztikán alapul:

(1.4)

A valós adatokkal történő kiszámításához használhatja a következő képletet:

(1.5)

Ha a H 0 hipotézis igaz és a G függvény folytonos, akkor az omega-négyzet statisztika eloszlása, akárcsak a D n statisztika eloszlása, csak n-től függ, G-től nem.

Ugyanaz, mint D n, for

kis n-hez százalékpontos táblázatok vannak, n nagy értékéhez pedig az n statisztika határeloszlását kell használni (mint n → ∞). Itt ismét egy végtelenül növekvő tényezővel kell szoroznunk. A korlátozó eloszlást N. V. Smirnov találta meg 1939-ben. Részletes táblázatokat és számítási programokat állítottak össze hozzá. A kritériumok D n alapján és elméleti szempontból fontos tulajdonsága: konzisztensek bármely G ≠ F alternatívával szemben.

A variációs eloszlási sorozatok elemzésekor nagy jelentősége van annak, hogyan empirikus eloszlás jele megfelel normál. Ehhez össze kell hasonlítani a tényleges eloszlás gyakoriságait az elméletiekkel, amelyek egy normális eloszlásra jellemzőek. Ez azt jelenti, hogy a tényleges adatok alapján ki kell számítani a normális eloszlási görbe elméleti gyakoriságait, amelyek a normalizált eltérések függvényei.

Más szóval, az empirikus eloszlási görbét a normál eloszlási görbéhez kell igazítani.

A megfelelés objektív jellemzői elméletiÉs empirikus frekvenciákúgynevezett speciális statisztikai mutatók segítségével lehet beszerezni beleegyezési kritériumok.

Megállapodási kritérium kritériumnak nevezzük, amely lehetővé teszi annak meghatározását, hogy az eltérés van-e empirikusÉs elméleti az eloszlások véletlenszerűek vagy szignifikánsak, azaz a megfigyelési adatok egyeznek-e a felállított statisztikai hipotézissel vagy nem. A sokaság eloszlását, amelyet a feltett hipotézisnek köszönhet, elméletinek nevezünk.

Telepítésre van szükség kritérium(szabály), amely lehetővé teszi annak megítélését, hogy az empirikus és az elméleti eloszlás közötti eltérés véletlenszerű vagy szignifikáns-e. Ha az eltérésről kiderül véletlen, akkor úgy vélik, hogy a megfigyelési adatok (minta) összhangban vannak az általános sokaság eloszlási törvényére vonatkozó hipotézissel, és ezért a hipotézist elfogadják; ha az eltérésről kiderül jelentős, akkor a megfigyelési adatok nem egyeznek a hipotézissel, és elvetjük.

Az empirikus és az elméleti gyakoriságok általában azért különböznek, mert:

  • az eltérés véletlenszerű és korlátozott számú megfigyelésből adódik;
  • az eltérés nem véletlen, és azzal magyarázható, hogy az a statisztikai hipotézis, amely szerint a sokaság normális eloszlású, téves.

Így, beleegyezési kritériumok lehetővé teszik az empirikus sorozat eloszlásának természetére vonatkozó sorozatok összehangolásakor feltett hipotézis helyességének elutasítását vagy megerősítését.

Empirikus frekvenciák megfigyelés eredményeként kapott. Elméleti frekvenciák képletekkel számítjuk ki.

Mert normál elosztási törvény az alábbiak szerint találhatók meg:

  • Σƒ i - a felhalmozott (halmozott) empirikus gyakoriságok összege
  • h - különbség a két szomszédos lehetőség között
  • σ - minta szórása
  • t – normalizált (standardizált) eltérés
  • φ(t) – a normális eloszlás valószínűségi sűrűségfüggvénye (a t megfelelő értékére található)

Számos illeszkedési teszt létezik, ezek közül a leggyakoribbak: khi-négyzet teszt (Pearson), Kolmogorov teszt, Romanovszkij teszt.

Pearson-féle illeszkedési teszt χ 2– az egyik fő, amely az elméleti (f T) és az empirikus (f) frekvenciák közötti különbségek négyzeteinek az elméleti gyakoriságokhoz viszonyított arányának összegeként ábrázolható:

  • k azon csoportok száma, amelyekre az empirikus eloszlás fel van osztva,
  • f i – a tulajdonság megfigyelt gyakorisága az i-edik csoportban,
  • f T – elméleti gyakoriság.

A χ 2 eloszláshoz olyan táblázatokat állítottak össze, amelyek a χ 2 illeszkedési kritérium kritikus értékét jelzik a kiválasztott α szignifikanciaszinthez és a df (vagy ν) szabadsági fokokhoz.
Az α szignifikancia szint a javasolt hipotézis téves elutasításának valószínűsége, azaz. annak a valószínűsége, hogy a helyes hipotézist elutasítják. R - statisztikai szignifikancia a helyes hipotézis elfogadása. A statisztikákban leggyakrabban három szignifikanciaszintet használnak:

α=0,10, majd P=0,90 (100-ból 10 esetben)

α=0,05, majd P=0,95 (100-ból 5 esetben)

α=0,01, akkor P=0,99 (100-ból 1 esetben) a helyes hipotézis elvethető

A df szabadsági fokok számát úgy definiáljuk, mint az eloszlási sorozat csoportjainak számát mínusz a kapcsolatok száma: df = k –z. A kapcsolatok száma alatt az elméleti gyakoriságok számításánál használt empirikus sorozatok mutatóinak számát értjük, pl. empirikus és elméleti frekvenciákat összekötő mutatók.Például ha egy haranggörbéhez igazodik, három kapcsolat létezik.Ezért, ha aharanggörbea szabadsági fokok száma df =k–3.A szignifikancia értékeléséhez a számított értéket összehasonlítjuk a χ táblázattal 2 asztal

Az elméleti és tapasztalati eloszlások teljes egybeesésével χ 2 =0, egyébként χ 2 >0. Ha χ 2 számítás > χ 2 tab , akkor adott szignifikanciaszint és szabadságfokszám esetén elvetjük az eltérések jelentéktelenségére (véletlenségére) vonatkozó hipotézist. Ha χ 2-t számolunk< χ 2 табл то Elfogadjuk a hipotézist, és P = (1-α) valószínűséggel állíthatjuk, hogy az elméleti és az empirikus gyakoriságok közötti eltérés véletlenszerű. Ezért van okunk azt állítani, hogy az empirikus eloszlás engedelmeskedik normál eloszlás. A Pearson-féle illeszkedési tesztet akkor alkalmazzuk, ha a populáció mérete elég nagy (N>50), és az egyes csoportok gyakoriságának legalább 5-nek kell lennie.

A kumulált empirikus és elméleti gyakoriságok közötti maximális eltérés meghatározása alapján:

ahol D és d a legnagyobb különbség az empirikus és elméleti eloszlások halmozott gyakoriságai és halmozott gyakoriságai között.
A Kolmogorov-statisztika eloszlási táblázatának felhasználásával meghatározzuk a valószínűséget, amely 0-tól 1-ig változhat. Ha P(λ) = 1, akkor a frekvenciák teljes egybeeséséről van szó, P(λ) = 0 - teljes eltérés. Ha a P valószínűségi érték szignifikáns a talált λ értékhez képest, akkor feltételezhetjük, hogy az elméleti és az empirikus eloszlás közötti eltérések jelentéktelenek, azaz véletlenszerűek.
A Kolmogorov-kritérium használatának fő feltétele a kellően nagy számú megfigyelés.

Kolmogorov illeszkedési teszt

Vizsgáljuk meg, hogyan alkalmazzuk a Kolmogorov-kritériumot (λ) mikor a normális eloszlás hipotézisének teszteléseáltalános népesség.A tényleges eloszlás és a haranggörbe igazítása több lépésből áll:

  1. Hasonlítsa össze a tényleges és elméleti frekvenciákat.
  2. A tényleges adatok alapján meghatározzuk a normál eloszlási görbe elméleti gyakoriságait, amely a normalizált eltérés függvénye.
  3. Ellenőrzik, hogy a jellemző eloszlása ​​mennyiben felel meg a normálnak.

MertIVtáblázat oszlopai:

Az MS Excelben a normalizált eltérés (t) kiszámítása a NORMALIZÁLÁS függvény segítségével történik. Ki kell választani a szabad cellák tartományát az opciók (táblázatsorok) számával. A kijelölés törlése nélkül hívja meg a NORMALIZÁLÁS funkciót. A megjelenő párbeszédpanelen jelölje meg a következő cellákat, amelyek a megfigyelt értékeket (X i), átlagot (X) és szórást Ϭ tartalmazzák. A műveletet be kell fejezni egyidejű a Ctrl+Shift+Enter megnyomásával

MertVtáblázat oszlopai:

A φ(t) normális eloszlás valószínűségi sűrűségfüggvényét a lokális Laplace-függvény értéktáblázatából találjuk meg a normalizált eltérés (t) megfelelő értékéhez.

MertVItáblázat oszlopai:

Az empirikus eloszlás elméleti eloszlási törvénynek való megfelelésére vonatkozó hipotézis tesztelésére speciális statisztikai mutatókat – az illeszkedési jósági kritériumokat (vagy megfelelőségi kritériumokat) – alkalmazunk. Ide tartoznak Pearson, Kolmogorov, Romanovsky, Yastremsky stb. kritériumai. A legtöbb egyetértési kritérium az empirikus frekvenciák elméletitől való eltérésén alapul.

Nyilvánvaló, hogy minél kisebbek ezek az eltérések, az elméleti eloszlás annál jobban megfelel (vagy leírja) az empirikusnak. Hozzájárulási feltételek

- ezek a kritériumok az empirikus eloszlás és az elméleti valószínűségi eloszlás megfelelésére vonatkozó hipotézisek tesztelésére. Az ilyen kritériumok két csoportra oszthatók: általános és speciális. Az általános illeszkedési tesztek a hipotézis legáltalánosabb megfogalmazására vonatkoznak, nevezetesen arra a hipotézisre, hogy a megfigyelt eredmények megegyeznek bármely a priori feltételezett valószínűségi eloszlással. A speciális illeszkedési tesztek speciális nullhipotéziseket foglalnak magukban, amelyek kijelentik, hogy egyetértenek a valószínűségi eloszlás egy bizonyos formájával. A kialakult elosztási törvényen alapuló megállapodási kritériumok lehetővé teszik annak megállapítását, hogy az elméleti és tapasztalati gyakoriságok közötti eltérések mikor tekinthetők jelentéktelennek (véletlenszerű), és mikor jelentősnek (nem véletlenszerű). Ebből az következik, hogy az egyetértési kritériumok lehetővé teszik az empirikus sorozatbeli eloszlás természetére vonatkozó sorozatok igazítása során feltett hipotézis helyességének elutasítását vagy megerősítését, valamint annak megválaszolását, hogy egy adott empirikus eloszlásra elfogadható-e. egyesek által kifejezett modell disztribúciók.

elméleti törvény Pearson alkalmassági teszt

A c 2 (khi-négyzet) az egyetértés egyik fő kritériuma. Karl Pearson (1857-1936) angol matematikus javaslata az empirikus és elméleti eloszlások gyakorisága közötti eltérések véletlenszerűségének (szignifikanciájának) felmérésére:

Az elméleti és empirikus eloszlások konzisztenciájának értékelésére a c 2 kritérium alkalmazásának sémája a következő:

1. Meghatározzuk az eltérés számított mértékét.

2. Meghatározzuk a szabadságfokok számát.

3. Az n szabadságfokok száma alapján, egy speciális táblázat segítségével meghatározzuk.

Jelentősségi szint a feltett hipotézis téves elutasításának valószínűsége, azaz. annak a valószínűsége, hogy a helyes hipotézist elutasítják. A statisztikai vizsgálatok során a megoldandó problémák fontosságától és felelősségétől függően a következő három szignifikanciaszintet alkalmazzák:

1) a = 0,1, akkor R = 0,9;

2) a = 0,05, akkor R = 0,95;

3) a = 0,01, akkor R = 0,99.

A c 2 megállapodási kritériumot alkalmazva a következő feltételeknek kell teljesülniük:

1. A vizsgált populáció mennyiségének elég nagynak kell lennie ( N≥ 50), míg a gyakoriságnak vagy a csoportlétszámnak legalább 5-nek kell lennie. Ha ez a feltétel megsérül, először össze kell kapcsolni a kis frekvenciákat (5-nél kisebb).

2. Az empirikus eloszlásnak véletlenszerű mintavétel eredményeként kapott adatokból kell állnia, pl. függetleneknek kell lenniük.

A Pearson-féle illeszkedési kritérium hátránya az eredeti információ egy részének elvesztése, ami azzal jár, hogy a megfigyelési eredményeket intervallumokba kell csoportosítani, és az egyes intervallumokat kis számú megfigyeléssel kell kombinálni. Ezzel kapcsolatban a kritérium szerinti elosztási megfelelőség ellenőrzését 2 további kritériummal is javasolt kiegészíteni. Ez különösen szükséges viszonylag kis minta esetén ( n ≈ 100).

A statisztikákban Kolmogorov illeszkedési teszt(más néven Kolmogorov-Smirnov illeszkedési teszt) arra szolgál, hogy meghatározzuk, hogy két empirikus eloszlás engedelmeskedik-e ugyanannak a törvénynek, vagy annak meghatározására, hogy az eredményül kapott eloszlás engedelmeskedik-e egy feltételezett modellnek. A Kolmogorov-kritérium a halmozott frekvenciák vagy az empirikus vagy elméleti eloszlások gyakoriságai közötti maximális eltérés meghatározásán alapul. A Kolmogorov-kritérium kiszámítása a következő képletekkel történik:

Ahol DÉs d- ennek megfelelően a felhalmozott frekvenciák közötti maximális különbség ( ff¢) és a felhalmozott frekvenciák között ( pp¢) eloszlások empirikus és elméleti sorozatai; N- az egységek száma az aggregátumban.

Kiszámítva λ értékét, aszerint speciális asztal Meghatározzuk annak a valószínűségét, amellyel kijelenthető, hogy az empirikus gyakoriságok eltérései az elméletitől véletlenszerűek. Ha az előjel 0,3-ig terjedő értékeket vesz fel, akkor ez azt jelenti, hogy a frekvenciák teljes egybeeséséről van szó. A Kolmogorov-teszt nagyszámú megfigyeléssel képes kimutatni a hipotézistől való bármilyen eltérést. Ez azt jelenti, hogy a mintaeloszlás és az elméleti eloszlás közötti különbséget kellően nagy számú megfigyelés esetén észleljük. Gyakorlati jelentősége ez a tulajdonság nem lényeges, mivel a legtöbb esetben nehéz számítani a fogadásra nagy számban Az állandó feltételek melletti megfigyelések során az eloszlási törvény elméleti elképzelése, amelynek a mintának engedelmeskednie kell, mindig közelítő, és a statisztikai tesztek pontossága nem haladhatja meg a kiválasztott modell pontosságát.

Romanovszkij alkalmassági tesztje a Pearson-kritérium használatán alapul, azaz. már talált c 2 értékeket és a szabadsági fokok számát:

ahol n a variációs szabadsági fokok száma.

A Romanovszkij-kritérium megfelelő táblázatok hiányában. Ha< 3, то расхождения распределений случайны, если же >3, akkor ezek nem véletlenszerűek, és az elméleti eloszlás nem szolgálhat modellként a vizsgált empirikus eloszláshoz.

B. S. Yastremsky az egyetértési kritériumban nem a szabadsági fokok számát, hanem a csoportok számát használta ( k), egy speciális q értéke a csoportok számától függően, és egy khi-négyzet érték. Yastremski alkalmassági tesztje jelentése megegyezik a Romanovszkij-kritériuméval, és a képlettel fejezzük ki

ahol c 2 a Pearson-féle illeszkedési kritérium; - csoportok száma; q - együttható, a 20-nál kisebb csoportok száma esetén 0,6.

Ha L tény > 3, az elméleti és az empirikus eloszlások közötti eltérések nem véletlenszerűek, pl. az empirikus eloszlás nem felel meg a normál eloszlás követelményeinek. Ha L tény< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.