Дисперсія, види та властивості дисперсії. Рішення та аналіз Кореляційно-регресійний метод аналізу

Дисперсія у статистицізнаходиться як індивідуальних значень ознаки у квадраті від . Залежно від вихідних даних вона визначається за формулами простої та зваженої дисперсій:

1. (Для несгрупованих даних) обчислюється за формулою:

2. Зважена дисперсія (для варіаційного ряду):

де n - Частота (повторюваність фактора Х)

Приклад знаходження дисперсії

На цій сторінці описано стандартний приклад знаходження дисперсії, також Ви можете переглянути інші завдання на її знаходження

Приклад 1. Є такі дані щодо групи з 20 студентів заочного відділення. Потрібно побудувати інтервальний ряд розподілу ознаки, розрахувати середнє значення ознаки та вивчити його дисперсію

Побудуємо інтервальне угруповання. Визначимо розмах інтервалу за формулою:

де X max - максимальне значення групувального ознаки;
X min-мінімальне значення групувального ознаки;
n – кількість інтервалів:

Приймаємо n=5. Крок дорівнює: h = (192 - 159) / 5 = 6,6

Складемо інтервальне угруповання

Для подальших розрахунків збудуємо допоміжну таблицю:

X'i - середина інтервалу. (наприклад, середина інтервалу 159 – 165,6 = 162,3)

Середню величину зростання студентів визначимо за формулою середньої арифметичної зваженої:

Визначимо дисперсію за формулою:

Формулу дисперсії можна перетворити так:

З цієї формули випливає, що дисперсія дорівнює різниці середньої з квадратів варіантів і квадрата та середньої.

Дисперсія у варіаційних рядахз рівними інтервалами за способом моментів може бути розрахована наступним способом при використанні другої властивості дисперсії (розділивши всі варіанти на величину інтервалу). Визначення дисперсії, обчисленої за способом моментів, за такою формулою менш трудомісткий:

де i – величина інтервалу;
А - умовний нуль, як який зручно використовувати середину інтервалу, що володіє найбільшою частотою;
m1 - квадрат моменту першого порядку;
m2 - момент другого порядку

(якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи до цієї формули дисперсії q =1- р, отримуємо:

Види дисперсії

Загальна дисперсіявимірює варіацію ознаки у всій сукупності загалом під впливом всіх чинників, що зумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значень ознаки х від загального середнього значення х може бути визначена як проста дисперсія або зважена дисперсія.

характеризує випадкову варіацію, тобто. частина варіації, яка обумовлена ​​впливом неврахованих факторів і не залежить від ознаки-фактора, покладеної в основу угруповання. Така дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи X від середньої арифметичної групи і може бути обчислена як проста дисперсія або зважена дисперсія.

Таким чином, внутрішньогрупова дисперсія вимірюєваріацію ознаки всередині групи та визначається за формулою:

де хі - групова середня;
ni – число одиниць у групі.

Наприклад, внутрішньогрупові дисперсії, які треба визначити в задачі вивчення впливу кваліфікації робітників на рівень продуктивності праці в цеху показують варіації виробітку в кожній групі, викликані всіма можливими факторами (технічний стан обладнання, забезпеченість інструментами та матеріалами, вік робітників, інтенсивність праці тощо) .), крім відмінностей у кваліфікаційному розряді (всередині групи всі робітники мають одну й ту саму кваліфікацію).

Середня з внутрішньо групових дисперсій відображає випадкову , тобто ту частину варіації, яка відбувалася під впливом всіх інших факторів, за винятком фактора угруповання. Вона розраховується за такою формулою:

Характеризує систематичну варіацію результативної ознаки, яка обумовлена ​​впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої. Міжгрупова дисперсія розраховується за такою формулою:

Правило складання дисперсії у статистиці

Згідно правилу складання дисперсійзагальна дисперсія дорівнює сумі середньої із внутрішньогрупових та міжгрупових дисперсій:

Сенс цього правилаполягає в тому, що загальна дисперсія, яка виникає під впливом всіх факторів, дорівнює сумі дисперсій, що виникають під впливом всіх інших факторів, та дисперсії, що виникає за рахунок угруповання.

Користуючись формулою складання дисперсій, можна визначити за двома відомими дисперсіями третю невідому, а також судити про силу впливу групувальної ознаки.

Властивості дисперсії

1. Якщо всі значення ознаки зменшити (збільшити) на ту саму постійну величину, то дисперсія від цього не зміниться.
2. Якщо всі значення ознаки зменшити (збільшити) в те саме число разів n, то дисперсія відповідно зменшиться (збільшити) в n^2 разів.

1. Сутність кореляційно-регресійного аналізу та його завдання.

2. Визначення регресії та її види.

3. Особливості специфікації моделі. Причин існування випадкової величини.

4. Методи вибору парної регресії.

5. Метод найменших квадратів.

6. Показники вимірювання тісноти та сили зв'язку.

7. Оцінки статистичної значимості.

8. Прогнозоване значення змінної і довірчі інтервали прогнозу.

1. Сутність кореляційно-регресійного аналізу та його завдання.Економічні явища, будучи досить різноманітними, характеризуються безліччю ознак, що відображають певні властивості цих процесів і явищ і схильних до взаємозумовлених змін. В одних випадках залежність між ознаками виявляється дуже тісною (наприклад, годинник працівника та його заробітна плата), а в інших випадках такий зв'язок не виражений зовсім або вкрай слабкий (наприклад, стать студентів та їх успішність). Чим тісніше зв'язок між цими ознаками, тим точніше прийняті рішення.

Розрізняють два типи залежностей між явищами та їх ознаками:

    функціональна (детермінована, причинна) залежність . Задається як формули, яка кожному значенню однієї змінної ставить у відповідність суворо певне значення інший змінної (впливом випадкових чинників у своїй нехтують). Іншими словами, функціональна залежність – це зв'язок, при якому кожному значенню незалежної змінної x відповідає точно певне значення залежної змінної у. В економіці функціональні зв'язки між змінними є винятками із загального правила;

    статистична (стохастична, недетермінована) залежність – це зв'язок змінних, яку накладається вплив випадкових чинників, тобто. це зв'язок, при якому кожному значенню незалежної змінної х відповідає безліч значень залежної змінної у, причому заздалегідь невідомо, яке саме значення прийме у.

Окремим випадком статистичної залежності є кореляційна залежність.

Кореляційна залежність – це зв'язок, при якому кожному значенню незалежної змінної x відповідає певне математичне очікування (середнє значення) залежної змінної у.

Кореляційна залежність є «неповною» залежністю, яка проявляється над кожному окремому випадку, лише у середніх величинах за досить великому числі випадків. Наприклад, відомо, підвищення кваліфікації працівника веде до зростання продуктивність праці. Це твердження часто підтверджується на практиці, але не означає, що у двох і більше працівників одного розряду/рівня, зайнятих аналогічним процесом, буде однакова продуктивність праці.

Кореляційна залежність досліджується за допомогою методів кореляційного та регресійного аналізу.

Кореляційно-регресійний аналіз дозволяє встановити тісноту, напрям і форму зв'язку між змінними, тобто. її аналітичний вираз.

Основне завдання кореляційного аналізу полягає в кількісному визначенні тісноти зв'язку між двома ознаками при парному зв'язку та між результативними та декількома факторними ознаками при багатофакторному зв'язку та статистичній оцінці надійності встановленого зв'язку.

2. Визначення регресії та її види.Регресійний аналіз є основним математико-статистичним інструментом економетриці. Регресією прийнято називати залежність середнього значення будь-якої величини (y) від деякої іншої або від кількох величин (x i).

Залежно кількості факторів, включених у рівняння регресії, прийнято розрізняти просту (парну) і множинну регресії.

Проста (парна) регресія являє собою модель, де середнє значення залежної (пояснюється) змінної у розглядається як функція однієї незалежної (пояснюючої) змінної х. У неявному вигляді парна регресія - це модель виду:

У явному вигляді:

,

де a та b – оцінки коефіцієнтів регресії.

Множинна регресія являє собою модель, де середнє значення залежної (пояснюється) змінної у розглядається як функція декількох незалежних (пояснюючих) змінних х 1, х 2, ... х n. У неявному вигляді парна регресія - це модель виду:

.

У явному вигляді:

де a та b 1 , b 2 , b n – оцінки коефіцієнтів регресії.

Прикладом такої моделі може бути залежність заробітної плати працівника від його віку, освіти, кваліфікації, стажу, галузі тощо.

Щодо форми залежності розрізняють:

      лінійну регресію;

      нелінійну регресію, яка передбачає існування нелінійних співвідношень між факторами, що виражаються відповідною нелінійною функцією. Найчастіше нелінійні на вигляд моделі можуть бути приведені до лінійного вигляду, що дозволяє їх відносити до класу лінійних.

3. Особливості специфікації моделі. Причин існування випадкової величини.Будь-яке економетричне дослідження починається зі специфікації моделі , тобто. з формулювання виду моделі виходячи з відповідної теорії зв'язку між змінними.

Насамперед із усього кола факторів, що впливають на результативну ознаку, необхідно виділити найбільш суттєві фактори. Парна регресія достатня, якщо є домінуючий фактор, який і використовується як пояснювальна змінна. Рівняння простої регресії характеризує зв'язок між двома змінними, що проявляється як певна закономірність лише загалом загалом за сукупністю спостережень. У рівнянні регресії кореляційна зв'язок представляється як функціональної залежності, вираженої відповідної математичної функцією. Практично в кожному окремому випадку величина складається з двох доданків:

,

де у – фактичне значення результативної ознаки;

– теоретичне значення результативної ознаки, знайдене з рівняння регресії;

- Випадкова величина, що характеризує відхилення реального значення результативної ознаки від теоретичного, знайденого за рівнянням регресії.

Випадкова величина називається також обуренням. Вона включає вплив не врахованих у моделі факторів, випадкових помилок та особливостей виміру. Присутність у моделі випадкової величини породжена трьома джерелами:

    специфікацією моделі,

    вибірковим характером вихідних даних,

    особливостями виміру змінних.

До помилок специфікації відноситимуться не тільки неправильний вибір тієї чи іншої математичної функції, але й недооблік у рівнянні регресії будь-якого суттєвого фактора (використання парної регресії замість множинної).

Поряд із помилками специфікації можуть мати місце помилки вибірки, оскільки дослідник найчастіше має справу з вибірковими даними при встановленні закономірностей зв'язку між ознаками. Помилки вибірки мають місце і з неоднорідності даних у вихідної статистичної сукупності, що, зазвичай, буває щодо економічних процесів. Якщо сукупність неоднорідна, то рівняння регресії немає практичного сенсу. Для отримання хорошого результату зазвичай виключають із сукупності одиниці з аномальними значеннями досліджуваних ознак. І в цьому випадку результати регресії є вибірковими характеристиками. Вихідні дані

Однак найбільшу небезпеку у практичному використанні методів регресії становлять помилки виміру. Якщо помилки специфікації можна зменшити, змінюючи форму моделі (вид математичної формули), а помилки вибірки – збільшуючи обсяг вихідних даних, то помилки вимірювання практично зводять нанівець всі зусилля щодо кількісної оцінки зв'язку між ознаками.

4. Методи вибору парної регресії.Припускаючи, що помилки вимірювання зведені до мінімуму, основна увага в економетричних дослідженнях приділяється помилкам специфікації моделі. У парній регресії вибір виду математичної функції
може бути здійснено трьома методами:

    графічним;

    аналітичним, тобто. виходячи з теорії взаємозв'язку, що вивчається;

    експериментальним.

При вивченні залежності між двома ознаками графічний метод підбору виду рівняння регресії досить наочний. Він ґрунтується на полі кореляції. Основні типи кривих, що використовуються при кількісній оцінці зв'язків




Клас математичних функцій для опису зв'язку двох змінних досить широкий, також використовуються інші типи кривих.

Аналітичний метод Вибір типу рівняння регресії заснований на вивченні матеріальної природи зв'язку досліджуваних ознак, а також візуальної оцінки характеру зв'язку. Тобто. якщо ми говоримо про криву Лаффера, що показує залежність між прогресивністю оподаткування та доходами бюджету, то йдеться про параболічну криву, а в мікроаналізі ізокванти є гіперболами.

Припустимо, що ми знайшли ці оцінки і можна записати рівняння:

ŷ = a + bх,

де а- регресійна постійна, точка перетину лінії регресії з віссю OY;

b- Коефіцієнт регресії, кут нахилу лінії регресії, що характеризує відношення DY¤DX;

ŷ - теоретичне значення змінної, що пояснюється.

Як відомо у парній регресії вибір виду математичної моделі може здійснюватися трьома видами:

1. Графічним.

2. Аналітичним.

3. Експериментальним.

Для вибору функції, що описує спостереження, можна використовувати графічний метод. Вихідні дані наносяться на координатну площину. На осі абсцис відкладають значення факторного ознаки, але в осі ординат - значення результуючого ознаки. Розташування точок покаже зразкову форму зв'язку. Як правило, цей зв'язок є криволінійним. Якщо кривизна цієї лінії невелика, можна прийняти гіпотезу про існування прямолінійного зв'язку.

Функцію споживання зобразимо у вигляді діаграми розсіювання. І тому системі координат на осі абсцис відкладемо значення доходу, але в осі ординат - Витрати споживання умовного товару. Розташування точок, відповідних наборам значень "дохід - витрата споживання", покаже зразкову форму зв'язку (рисунок 1).

Візуально, за діаграмою, майже ніколи не вдається однозначно назвати найкращу залежність.

Перейдемо до оцінки параметрів вибраної функції aі bспособом найменших квадратів.

Проблема оцінювання може бути зведена до "класичної" задачі відшукання мінімуму. Змінними тепер виявляються оцінки аі bневідомих параметрів передбачуваного зв'язку уі х. Для віднайдення найменшого значення будь-якої функції спочатку треба визначити приватні похідні I порядку. Потім кожну з них прирівняти нулю та дозволити отриману систему рівнянь щодо змінних. У нашому випадку такою функцією є сума квадратів відхилень - S, а змінними - аі b. Тобто ми повинні знайти = 0 і = 0 і дозволити отриману систему рівнянь щодо аі b.

Виведемо оцінки параметрів методом найменших квадратів, припускаючи, що рівняння зв'язку має вигляд ŷ = a + bх. Тоді функція Sмає вигляд

. Диференціюючи функцію Sпо а, ми отримуємо перше нормальне рівняння, диференціюючи по b- Друге нормальне рівняння. , ,

Після відповідних перетворень отримаємо:

(*)

Існують спрощені правила побудови системи нормальних рівнянь. Застосуємо їх до лінійної функції:

1) Перемножимо кожен член рівняння ŷ = a + bхна коефіцієнт при першому параметрі ( а), тобто на одиницю.

2) Перед кожною змінною поставимо знак підсумовування.

3) Вільний член рівняння помножимо на n.

4) Отримаємо перше нормальне рівняння

5) Перемножити кожен член вихідного рівняння на коефіцієнт при другому параметрі ( b), тобто на х.

6) Перед кожною змінною ставимо знак підсумовування.

7) Отримуємо друге нормальне рівняння

За цими правилами складається система нормальних рівнянь будь-якої лінійної функції. Правила вперше було сформульовано англійським економістом Р. Перлом.

Параметри рівнянь розраховуються за такими формулами:

, ,

Побудуємо, використовуючи вихідні дані у таблиці 1 , систему нормальних рівнянь (*) та розв'яжемо її щодо невідомих аі b:


1677 = 11 * a + 4950 * ba = -3309

790 400 = 4950 * a +2 502 500 * bb = 7,6923

Рівняння регресії має вигляд:

ŷ =-3309 + 7,6923 х ,

Порівняємо фактичні та розрахункові витрати на споживання товару А (таблиця 2).

Таблиця 2 Порівняння фактичних та розрахункових значень витрат на споживання товару Апри прямолінійній залежності:

№ групи

Витрати споживання

товару А

Відхилення фактичних витрат від розрахункових

фактичні (у)

розрахункові

абсолютні

(у – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
всього - - 0

Побудуємо графік отриманої функції ŷ і діаграму розсіювання, використовуючи фактичні значення (y) та розрахункові ( ŷ) .

Розрахункові значення відхиляються від фактичних через те, що зв'язок між ознаками кореляційна.

Як міра тісноти взаємозв'язку використовується коефіцієнт кореляції:

=

Отримаємо, використовуючи вихідні дані з таблиці 1:

σ x =158;

σ y = 20,76;

r = 0,990.

Лінійний коефіцієнт кореляції може набувати будь-яких значень в межах від мінус 1 до плюс 1. Чим ближче коефіцієнт кореляції по абсолютній величині до 1, тим тісніше зв'язок між ознаками. Знак при лінійному коефіцієнті кореляції вказує напрям зв'язку - прямої залежності відповідає знак плюс, а зворотної залежності – знак мінус.

Висновок: зв'язок між значеннями хта відповідними значеннями у

тісна, пряма залежність.

У нашому прикладі d = 0,9801

Це означає, що зміна витрат на товар Аможна на 98,01% пояснити зміною доходу.

Інші 1,99% можуть бути наслідком:

1) недостатньо добре підібраної форми зв'язку;

2) впливу на залежну змінну будь-яких інших неврахованих факторів.

Статистична перевірка гіпотез.

Висуваємо нуль-гіпотезу про те, що коефіцієнт регресії статистично незначний:

H 0 : b = 0.

Статистична значимість коефіцієнта регресії перевіряється за допомогою t-Крітерія Стьюдента. Для цього спочатку визначаємо залишкову суму квадратів

s 2 ост= å (y i – ŷ i) 2

s 2 ост = 1,3689.

та її середнє квадратичне відхилення

s = 0,39. se ( b ) = 0,018.

Фактичне значення t-критерія Стьюдента для коефіцієнта регресії:

.

t b = 427,35.

Значення |t b |>t кр (t кр =2,26 для 95% рівня значимості) дозволяє зробити висновок про відмінність від нуля (на відповідному рівні значущості) коефіцієнта регресії і, отже, наявність впливу (зв'язку) хі у.

Висновок: фактичне значення t-Критерія Стьюдента перевищує табличне, отже нуль-гіпотеза відхиляється і з ймовірністю 95% приймається альтернативна гіпотеза про статистичну значущість коефіцієнта регресії.

[b- t кр * se ( b), b+ t кр * se ( b)]- 95% довірчий інтервал для b.

Довірчий інтервал накриває дійсне значення параметра b c заданою ймовірністю (у разі 95%).

7,6516 < b < 7,7329.

Перейдемо до перевірки статистичної значущості коефіцієнтів кореляції та детермінації:

r = 0,990;

d = r 2 = 0,9801.

Висуваємо нуль-гіпотезу у тому, що рівняння регресії загалом статистично незначимо:

H 0 : r 2 = 0.

Оцінка статистичної значущості збудованої моделі регресії в цілому проводиться за допомогою F-Крітерія Фішера. Фактичне значення F-критерію для рівняння парної регресії, лінійної за параметрами визначається як:

де s 2 фактор - дисперсія для теоретичних значень ŷ (Пояснена варіація);

s 2 ост - залишкова сума квадратів;

r 2 - Коефіцієнт детермінації.

Фактичне значення F-критерія Фішера:

F ф = 443,26

Висновок: відхиляємо нуль-гіпотезу і з ймовірністю 95% приймаємо альтернативну гіпотезу про статистичну значущість рівняння регресії.

    Кореляційна залежність між фактором х (середньодушовим прожитковим мінімумом на день одного працездатного) та результуючою ознакою у (середньоденною заробітною платою). Параметри рівняння лінійної регресії, економічна інтерпретація коефіцієнта регресії.

y=f(x)+E ,y т =f(x) – теоретична функція, Е=у- y т

y т = a + bx - кореляційна залежність середньоденної заробітної плати від середньодушового прожиткового мінімуму в день одного працездатного (х)

a+b =

a +b =

b=
- Коефіцієнт регресії.

Він показує, наскільки одиниць у середньому змінюється середня заробітна плата (У) зі збільшенням середньодушового прожиткового мінімуму на день одного працездатного (Х) на 1 одиницю.

b=
= 0,937837482

Це означає, що зі збільшенням середньодушового прожиткового мінімуму на день одного працездатного (х) на 1 одиницю, середньоденна вести збільшиться загалом на 0,937 одиниць.

a= -b , a = 135,4166667-0,937837482 86,75 = 54,05926511

3) Коефіцієнт варіації

p align="justify"> Коефіцієнт варіації показує, яку частку середнього значення СВ становить її середній розкид.

х = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Коефіцієнт кореляції

Коефіцієнт кореляції використовується для оцінки тісноти лінійного зв'язку між середньодушовим прожитковим мінімумом на день одного працездатного та середньоденною заробітною платою.

rxy = b δх/δy = 0,823674909 т.к. rxy ˃0 , то кореляційний зв'язок між змінними називається прямий

Все це свідчить про залежність середньоденної заробітної плати від середньодушового прожиткового мінімуму в день одного працездатного.

5) Коефіцієнт детермінації

Коефіцієнт детермінації використовується з метою оцінки якості підбору рівнянь лінійної регресії.

Коефіцієнт детермінації характеризує частку дисперсії результативної ознаки У (середньоденної заробітної плати), що пояснюється регресією загальної дисперсії результативної ознаки.

R 2 xy = (∑(y т - y ср) 2) / (∑(y - y ср) 2) = 0,678440355, 0,5< R 2 < 0,7 ,

отже сила зв'язку помітна, близька до високої, і рівняння регресії добре підібрано.

6) Оцінка точності моделі, або оцінка апроксимації.

=1/n ∑ ׀(y i - y т)/y i ׀ 100% - середня помилка апроксимації.

Помилка менше 5-7% свідчить про хороший вибір моделі.

При помилці більше 10% слід подумати про вибір іншого рівняння моделі.

Помилка апроксимації =0,015379395 100%=1,53% , що свідчить про хороший вибір моделі до вихідних даних

7) Схема дисперсійного аналізу.

∑(y - y ср) 2 = ∑(y т - y ср) 2 +∑(y i - y т) 2 n – число спостережень, m – число параметрів при змінній х

Компоненти дисперсії

Сума квадратів

Число ступенів свободи

Дисперсія на один ступінь свободи

∑(y - y ср) 2

S 2 заг =(∑(y - y ср) 2)/(n-1)

Факторна

∑(y т - y ср) 2

S 2 факт =(∑(y т - y ср) 2)/m

Залишкова

∑(y i - y т) 2

S 2 ост =(∑(y i - y т) 2)/(n-m-1)

Дисперсійний аналіз

Компоненти

Сума квадратів

Число ступеня свободи

Дисперсія

загальна

факторна

залишкова

8) Перевірка адекватності моделі заF-Крітерію Фішера (α=0,05).

Оцінка статистичної значущості рівняння регресії загалом здійснюється з допомогоюF-Крітерія Фішера.

H 0 - гіпотеза про статистичну значущість рівняння регресії.

H 1 - Статистична значущість рівняння регресії.

F розрахунковий визначається із співвідношення значень факторної та залишкової дисперсій, розрахованих на один ступінь свободи.

F розрахунок = S 2 факт / S 2 ост = ((∑(y т - y ср) 2) / m) / ((∑ (y i - y т) 2) / (n-m-1)) = 1669,585177 / 79,13314895 = 21,09842966

F табличне - максимально можливе значення критерію, що могло сформуватися під впливом випадкових чинників за даних ступенях свободи, тобто. До 1 = m, К 2 = n- m-1, та рівні значимості α (α=0,05)

F табл (0,05; 1; n-2) , F табл (0,05; 1; 10), F табл = 4,964602701

ЯкщоF табл < F розрах , то гіпотезаH 0 про випадкову природу оцінюваних показників відхиляється, і визнається їх статистична значимість і надійність рівняння регресії. В іншому випадкуH 0 не відхиляється, і визнається статистична незначущість та ненадійність рівняння регресії.У нашому випадку F табл< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Оцінка статистичної значущості коефіцієнтів регресії та кореляції заt-критерію Стьюдента (? = 0,05).

Оцінка значимості коеф. регресії., t - критерій Student., Перевіримо статистичну значущість параметра b.

Гіпотеза H 0: b = 0, t b (розрах.) = ׀b ׀/ m b , m b = S ост / (δ х
) , де n – кількість спостережень

m b = 79,13314895/(12,57726123
) = 0,204174979

t b (розрах.) = 0,937837482 / 0,204174979 = 4,593302697

t табл – це максимально можливе значення критерію під впливом випадкових факторів при даних ступенях свободи (К=n-2), та рівні значущості α (α=0,05). t табл = 2,2281, Якщо t (розрах.) > t табл, тоді гіпотеза H 0 відхиляється, і визнається значущість параметрів рівняння.

У нашому випадку t b (розрахунок) > t табл, отже гіпотеза H 0 відхиляється, і визнається статистична значущість параметра b .

Перевіримо статистичну значущість параметра a. Гіпотеза H 0: a = 0 t а (розрах.) = ׀а ׀/ m а

m а = (S зуст
)/(n δ х) , m a = (79,13314895
) / (12 12,57726123) = 17,89736655, ta (розрах.) = 54,05926511 / 17,89736655 = 3,020515055

t a (розрах) > t табл Отже гіпотеза H 0 відхиляється, і визнається статистична значущість параметрa a.

Оцінка важливості кореляції.Перевіримо статистичну значущість коефіцієнта кореляції.

mrxy =
mrxy =
= 0,179320842, trxy = 0,823674909 / 0,179320842 = 4,593302697

tr = t b , tr > t табл, отже визнається статистична значущість коефіцієнта кореляції.

Економетрика- Це наука, яка дає кількісне вираження взаємозв'язків економічних явищ та процесів. На даний момент в онлайн режимі доступні рішення наступних задач з економетрики:

Кореляційно-регресійний метод аналізу

Непараметричні показники зв'язку

Гетероскедастичність випадкової складової

Автокореляція

  1. Автокореляція рівнів часового ряду. Перевірка на автокореляцію з побудовою корелограми;

Економетричні методи проведення експертних досліджень

  1. Методом дисперсійного аналізу перевірити нульову гіпотезу про вплив чинника якість об'єкта.

Отримане рішення оформляється у форматі Word. Відразу після рішення слід посилання на завантаження шаблону в Excel, що дає можливість перевірити всі отримані показники. Якщо завдання потрібне рішення в Excel , можна скористатися статистичними функціями в Excel .

Компоненти часових рядів

  1. Сервіс Аналітичне вирівнювання можна використовувати для аналітичного згладжування часового ряду (прямий) і для знаходження параметрів рівняння тренду. Для цього необхідно вказати кількість вихідних даних. Якщо даних багато, можна вставити з Excel.
  2. Розрахунок параметрів рівняння тренду.
    При виборі функції тренда можна скористатися методом кінцевих різниць. Якщо загальна тенденція виражається параболою другого порядку, отримаємо постійними кінцеві різниці другого порядку. Якщо приблизно постійними виявляються темпи зростання, то вирівнювання застосовується показова функція.
    При виборі форми рівняння слід з обсягу наявної інформації. Чим більше параметрів містить рівняння, тим більше має бути спостережень за однієї ступеня надійності оцінювання.
  3. Згладжування методом ковзної середньої. З використанням