Решение и анализ. Дисперсия, виды и свойства дисперсии Правило сложения дисперсии в статистике

    Корреляционная зависимость между фактором х (среднедушевым прожиточным минимумом в день одного трудоспособного) и результирующим признаком у (среднедневной заработной платой). Параметры уравнения линейной регрессии, экономическая интерпретация коэффициента регрессии.

y=f(x)+E ,y т =f(x) – теоретическая функция, Е=у- y т

y т =a+bx – корреляционная зависимость среднедневной заработной платы (у) от среднедушевого прожиточного минимума в день одного трудоспособного (х)

a+b=

a+b=

b=
- коэффициент регрессии.

Он показывает, на сколько единиц в среднем изменяется средняя заработная плата (У) при увеличении среднедушевого прожиточного минимума в день одного трудоспособного (Х) на 1 единицу.

b=
= 0,937837482

Это означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного (х) на 1 единицу, среднедневная заработная плата увеличится в среднем на 0,937 единиц.

a=-b, a=135,4166667-0,937837482 86,75=54,05926511

3) Коэффициент вариации

Коэффициент вариации показывает, какую долю среднего значения СВ составляет её средний разброс.

υ х = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Коэффициент корреляции

Коэффициент корреляции используется для оценки тесноты линейной связи между среднедушевым прожиточным минимумом в день одного трудоспособного и среднедневной заработной платой.

rxy = b δх/δy = 0,823674909 т.к. rxy ˃0 , то корреляционная связь между переменными называется прямой

Всё это показывает зависимость среднедневной заработной платы от среднедушевого прожиточного минимума в день одного трудоспособного.

5) Коэффициент детерминации

Коэффициент детерминации используется для оценки качества подбора уравнений линейной регрессии.

Коэффициент детерминации характеризует долю дисперсии результативного признака У (среднедневной заработной платы), объясняемую регрессией в общей дисперсии результативного признака.

R 2 xy = (∑(y т - y ср) 2) / (∑(y - y ср) 2) = 0,678440355, 0,5 < R 2 < 0,7 ,

значит сила связи заметная, близка к высокой, и уравнение регрессии хорошо подобрано.

6) Оценка точности модели, или оценка аппроксимации.

=1/n ∑ ׀(y i - y т)/y i ׀ 100% - средняя ошибка аппроксимации.

Ошибка менее 5-7% свидетельствует о хорошем подборе модели.

При ошибке более 10% следует подумать о выборе другого типа уравнения модели.

Ошибка аппроксимации =0,015379395 100%=1,53% , что свидетельствует о хорошем подборе модели к исходным данным

7) Схема дисперсионного анализа.

∑(y - y ср) 2 =∑(y т - y ср) 2 +∑(y i - y т) 2 n – число наблюдений, m – число параметров при переменной х

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия на одну степень свободы

∑(y - y ср) 2

S 2 общ =(∑(y - y ср) 2)/(n-1)

Факторная

∑(y т - y ср) 2

S 2 факт =(∑(y т - y ср) 2)/m

Остаточная

∑(y i - y т) 2

S 2 ост =(∑(y i - y т) 2)/ (n-m-1)

Дисперсионный анализ

Компоненты

Сумма квадратов

Число степени свободы

Дисперсия

общая

факторная

остаточная

8) Проверка адекватности модели по F -критерию Фишера (α=0,05).

Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F -критерия Фишера.

H 0 – гипотеза о статистической значимости уравнения регрессии.

H 1 – статистическая значимость уравнения регрессии.

F расчетное определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.

F расч = S 2 факт / S 2 ост = ((∑(y т - y ср) 2)/m) / ((∑(y i - y т) 2)/ (n-m-1)) =1669,585177 / 79,13314895 = 21,09842966

F табличное - максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы, т.е. К 1 = m , К 2 = n - m -1, и уровне значимости α (α=0,05)

F табл (0,05; 1; n-2) , F табл (0,05; 1; 10), F табл = 4,964602701

Если F табл < F расч , то гипотеза H 0 о случайной природе оцениваемых характеристик отклоняется, и признаётся их статистическая значимость и надёжность уравнения регрессии. В противном случае H 0 не отклоняется, и признаётся статистическая незначимость и ненадёжность уравнения регрессии. В нашем случае F табл < F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Оценка статистической значимости коэффициентов регрессии и корреляции по t -критерию Стьюдента (α=0,05).

Оценка значимости коэфф. регрессии., t – критерий Student., Проверим статистическую значимость параметра b.

Гипотеза H 0: b=0, t b (расч) = ׀b ׀/ m b , m b = S ост / (δ х
) , где n – число наблюдений

m b = 79,13314895 / (12,57726123
) = 0,204174979

t b (расч) = 0,937837482 / 0,204174979 = 4,593302697

t табл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы (К=n-2), и уровне значимости α (α=0,05). t табл = 2,2281, Если t (расч) > t табл, тогда гипотеза H 0 отклоняется, и признаётся значимость параметров уравнения.

В нашем случае t b (расч) > t табл, следовательно гипотеза H 0 отклоняется, и признаётся статистическая значимость параметрa b .

Проверим статистическую значимость параметра a. Гипотеза H 0: a=0 t а (расч) = ׀а ׀/ m а

m а = (S ост
)/(n δ х) , m a = (79,13314895
)/(12 12,57726123)= 17,89736655, t a (расч) = 54,05926511 / 17,89736655=3,020515055

t a (расч) > t табл следовательно гипотеза H 0 отклоняется, и признаётся статистическая значимость параметрa a.

Оценка значимости корреляции. Проверим статистическую значимость коэффициента корреляции.

mrxy =
, mrxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t табл, следовательно признаётся статистическая значимость коэффициента корреляции.

Предположим, что мы нашли эти оценки и можно записать уравнение:

ŷ = a + b х,

где а - регрессионная постоянная, точка пересечения линии регрессии с осью OY ;

b - коэффициент регрессии, угол наклона линии регрессии, характеризующий отношение D Y ¤D X ;

ŷ - теоретическое значение объясняемой переменной.

Как известно в парной регрессии выбор вида математической модели может осуществляться тремя видами:

1. Графическим.

2. Аналитическим.

3. Экспериментальным.

Для выбора функции, описывающей наблюденные значения, можно использовать графический метод. Исходные данные наносятся на координатную плоскость. На оси абсцисс откладывают значения факторного признака, а на оси ординат - значения результирующего признака. Расположение точек покажет примерную форму связи. Как правило, эта связь является криволинейной. Если кривизна этой линии невелика, то можно принять гипотезу о существовании прямолинейной связи.

Функцию потребления изобразим в виде диаграммы рассеивания. Для этого в системе координат на оси абсцисс отложим значение дохода, а на оси ординат - расходы на потребление условно­го товара. Расположение точек, соответствующих наборам значений "доход - расход на потребление", покажет пример­ную форму связи (рисунок 1).

Визуально, по диаграмме, почти никогда не удаётся однозначно назвать наилучшую зависимость.

Перейдём к оценке параметров выбранной функции a и b способом наименьших квадратов.

Проблема оценивания может быть сведена к "классической" задаче отыскания минимума. Переменными теперь оказываются оценки а и b неизвестных параметров предполагаемой связи у и х . Для отыскания наименьшего значения какой-либо функции сначала надо найти частные производные I порядка. Затем каждую из них приравнять нулю и разрешить полученную систему уравнений относительно переменных. В нашем случае такой функцией является сумма квадратов отклонений - S , а переменными - а и b . То есть мы должны найти = 0 и = 0 и разрешить полученную систему уравнений относительно а и b .

Выведем оценки параметров по методу наименьших квадратов, предполагая, что уравнение связи имеет вид ŷ = a + b х . Тогда функция S имеет вид

. Дифференцируя функцию S по а , мы получаем первое нормальное уравнение, дифференцируя по b - второе нормальное уравнение. , ,

После соответствующих преобразований получим:

(*)

Существуют упрощенные правила построения системы нормальных уравнений. Применим их к линейной функции:

1) Перемножим каждый член уравнения ŷ = a + b х на коэффициент при первом параметре (а ), то есть на единицу.

2) Перед каждой переменной поставим знак суммирования.

3) Свободный член уравнения умножим на n .

4) Получим первое нормальное уравнение

5) Перемножим каждый член исходного уравнения на коэффициент при втором параметре (b ), то есть на х .

6) Перед каждой переменной ставим знак суммирования.

7) Получаем второе нормальное уравнение

По этим правилам составляется система нормальных уравнений для любой линейной функции. Правила впервые были сформулированы английским экономистом Р. Перлом.

Параметры уравнений рассчитываются по следующим формулам:

, ,

Построим, используя исходные данные в таблице 1 , систему нормальных уравнений (*) и решим ее относительно неизвестных а и b :


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Уравнение регрессии имеет вид:

ŷ =-3309 + 7,6923 х ,

Сравним фактические и расчетные расходы на потребление товара А (таблица 2).

Таблица 2 Сравнение фактических и расчетных значений расходов на потребление товара А при прямолинейной зависимости:

№ группы

Расходы на потребление

товара А

Отклонение фактических расходов от расчетных

фактические (у)

расчетные

абсолютные

(у – ŷ )

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
всего - - 0

Построим график полученной функции ŷ и диаграмму рассеивания, используя фактические значения (y) и расчётные (ŷ) .

Расчетные значения отклоняются от фактических в силу того, что связь между признаками корреляционная.

В качестве меры тесноты взаимосвязи используется коэффициент корреляции:

=

Получим, используя исходные данные из таблицы 1:

σ x =158;

σ y = 20,76;

r = 0,990.

Линейный коэффициент корреляции может принимать любые значения в пределах от минус 1 до плюс 1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.

Вывод: связь между значениями х и соответствующими значениями у

тесная, прямая зависимость.

В нашем примере d = 0,9801

Это значит, что изменение расходов на товар А можно на 98,01 % объяснить изменением дохода.

Остальные 1,99 % могут явиться следствием:

1) недостаточно хорошо подобранной формы связи;

2) влияния на зависимую переменную каких-либо других неучтенных факторов.

Статистическая проверка гипотез.

Выдвигаем ноль-гипотезу о том, что коэффициент регрессии статистически незначим:

H 0 : b = 0.

Статистическая значимость коэффициента регрессии проверяется с помощью t -критерия Стьюдента. Для этого сначала определяем остаточную сумму квадратов

s 2 ост = å (y i – ŷ i ) 2

s 2 ост = 1,3689.

и ее среднее квадратическое отклонение

s = 0,39. se ( b ) = 0,018.

Фактическое значение t -критерия Стьюдента для коэффициента регрессии:

.

t b = 427,35.

Значение |t b |>t кр (t кр =2,26 для 95% уровня значимости) позволяет сделать заключение об отличии от нуля (на соответствующем уровне значимости) коэффициента регрессии и, следовательно, о наличии влияния (связи) х и у.

Вывод: фактическое значение t -критерия Стьюдента превышает табличное, значит ноль-гипотеза отклоняется и с вероятностью 95% принимается альтернативная гипотеза о статистической значимости коэффициента регрессии.

[b – t кр *se(b ), b + t кр *se(b )]- 95% доверительный интервал для b.

Доверительный интервал накрывает истинное значение параметра b c заданной вероятностью (в данном случае 95%).

7,6516 < b < 7,7329.

Перейдем к проверке статистической значимости коэффициентов корреляции и детерминации:

r = 0,990;

d = r 2 = 0,9801.

Выдвигаем ноль-гипотезу о том, что уравнение регрессии в целом статистически незначимо:

H 0 : r 2 = 0.

Оценка статистической значимости построенной модели регрессии в целом производится с помощью F -критерия Фишера. Фактическое значение F -критерия для уравнения парной регрессии, линейной по параметрам определяется как:

где s 2 фактор –дисперсия для теоретических значений ŷ (объясненная вариация);

s 2 ост - остаточная сумма квадратов;

r 2 - коэффициент детерминации.

Фактическое значение F -критерия Фишера:

F ф = 443,26

Вывод: отклоняем ноль-гипотезу и с вероятностью 95% принимаем альтернативную гипотезу о статистической значимости уравнения регрессии.

Эконометрика – это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. На данный момент в онлайн режиме доступны решения следующих задач по эконометрике:

Корреляционно-регрессионный метод анализа

Непараметрические показатели связи

Гетероскедастичность случайной составляющей

Автокорреляция

  1. Автокорреляция уровней временного ряда . Проверка на автокорреляцию с построением коррелограммы;

Эконометрические методы проведения экспертных исследований

  1. Методом дисперсионного анализа проверить нулевую гипотезу о влиянии фактора на качество объекта.

Полученное решение оформляется в формате Word . Сразу после решения следует ссылка на скачивание шаблона в Excel, что дает возможность проверить все полученные показатели. Если в задании требуется решение в Excel , то можно воспользоваться статистическими функциями в Excel .

Компоненты временных рядов

  1. Сервис Аналитическое выравнивание можно использовать для аналитического сглаживания временного ряда (по прямой) и для нахождения параметров уравнения тренда. Для этого необходимо указать количество исходных данных. Если данных много, их можно вставить из Excel.
  2. Расчет параметров уравнения тренда .
    При выборе вида функции тренда можно воспользоваться методом конечных разностей. Если общая тенденция выражается параболой второго порядка, то получим постоянными конечные разности второго порядка. Если примерно постоянными оказываются темпы роста, то для выравнивания применяется показательная функция.
    При выборе формы уравнения следует исходить из объема имеющейся информации. Чем больше параметров содержит уравнение, тем больше должно быть наблюдений при одной и той же степени надежности оценивания.
  3. Сглаживание методом скользящей средней . С использованием

Дисперсия в статистике находится как индивидуальных значений признака в квадрате от . В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:

1. (для несгруппированных данных) вычисляется по формуле:

2. Взвешенная дисперсия (для вариационного ряда):

где n — частота (повторяемость фактора Х)

Пример нахождения дисперсии

На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение

Пример 1. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию

Построим интервальную группировку. Определим размах интервала по формуле:

где X max– максимальное значение группировочного признака;
X min–минимальное значение группировочного признака;
n – количество интервалов:

Принимаем n=5. Шаг равен: h = (192 — 159)/ 5 = 6,6

Составим интервальную группировку

Для дальнейших расчетов построим вспомогательную таблицу:

X’i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)

Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:

Определим дисперсию по формуле:

Формулу дисперсии можно преобразовать так:

Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.

Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии , вычисленной по способу моментов, по следующей формуле менее трудоемок:

где i - величина интервала;
А - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m1 — квадрат момента первого порядка;
m2 — момент второго порядка

(если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:

Подставляя в данную формулу дисперсии q =1- р, получаем:

Виды дисперсии

Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.

характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.

Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где хi - групповая средняя;
ni - число единиц в группе.

Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).

Средняя из внутри групповых дисперсий отражает случайную , т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:

Характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:

Правило сложения дисперсии в статистике

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

Смысл этого правила заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки.

Пользуясь формулой сложения дисперсий, можно определить по двум известным дисперсиям третью неизвестную, а также судить о силе влияния группировочного признака.

Свойства дисперсии

1. Если все значения признака уменьшить (увеличить) на одну и ту же постоянную величину, то дисперсия от этого не изменится.
2. Если все значения признака уменьшить (увеличить) в одно и то же число раз n, то дисперсия соответственно уменьшится (увеличить) в n^2 раз.

1. Сущность корреляционно-регрессионного анализа и его задачи.

2. Определение регрессии и ее виды.

3. Особенности спецификации модели. Причины существования случайной величины.

4. Методы выбора парной регрессии.

5. Метод наименьших квадратов.

6. Показатели измерения тесноты и силы связи.

7. Оценки статистической значимости.

8. Прогнозируемое значение переменной у и доверительные интервалы прогноза.

1. Сущность корреляционно-регрессионного анализа и его задачи. Экономические явления, будучи весьма разнообразными, характеризуются множеством признаков, отражающих определенные свойства этих процессов и явлений и подверженных взаимообусловленным изменениям. В одних случаях зависимость между признаками оказывается очень тесной (например, часовая выработка работника и его заработная плата), а в других случаях такая связь не выражена вовсе или крайне слаба (например, пол студентов и их успеваемость). Чем теснее связь между этими признаками, тем точнее принимаемые решения.

Различают два типа зависимостей между явлениями и их признаками:

    функциональная (детерминированная, причинная) зависимость . Задается в виде формулы, которая каждому значению одной переменной ставит в соответствие строго определенное значение другой переменной (воздействием случайных факторов при этом пренебрегают). Иными словами, функциональная зависимость – это связь, при которой каждому значению независимой переменной х соответствует точно определенное значение зависимой переменной у. В экономике функциональные связи между переменными являются исключениями из общего правила;

    статистическая (стохастическая, недетерминированная) зависимость – это связь переменных, на которую накладывается воздействие случайных факторов, т.е. это связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем заранее неизвестно, какое именно значение примет у.

Частным случаем статистической зависимости является корреляционная зависимость.

Корреляционная зависимость – это связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у.

Корреляционная зависимость является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев. Например, известно, что повышение квалификации работника ведет к росту производительности труда. Это утверждение часто подтверждается на практике, но не означает, что у двух и более работников одного разряда / уровня, занятых аналогичным процессом, будет одинаковая производительность труда.

Корреляционная зависимость исследуется с помощью методы корреляционного и регрессионного анализа.

Корреляционно-регрессионный анализ позволяет установить тесноту, направление связи и форму этой связи между переменными, т.е. ее аналитическое выражение.

Основная задача корреляционного анализа состоит в количественном определении тесноты связи между двумя признаками при парной связи и между результативными и несколькими факторными признаками при многофакторной связи и статистической оценке надежности установленной связи.

2. Определение регрессии и ее виды. Регрессионный анализ является основным математико-статистическим инструментом в эконометрике. Регрессией принято называть зависимость среднего значения какой-либо величины (y) от некоторой другой величины или от нескольких величин (x i).

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.

Простая (парная) регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция одной независимой (объясняющей) переменной х. В неявном виде парная регрессия – это модель вида:

В явном виде:

,

где a и b – оценки коэффициентов регрессии.

Множественная регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция нескольких независимых (объясняющих) переменных х 1 , х 2 , … х n . В неявном виде парная регрессия – это модель вида:

.

В явном виде:

где a и b 1 , b 2 , b n – оценки коэффициентов регрессии.

Примером такой модели может служить зависимость заработной платы работника от его возраста, образования, квалификации, стажа, отрасли и т.д.

Относительно формы зависимости различают:

      линейную регрессию;

      нелинейную регрессию, предполагающую существование нелинейных соотношений между факторами, выражающихся соответствующей нелинейной функцией. Зачастую нелинейные по внешнему виду модели могут быть приведены к линейному виду, что позволяет их относить к классу линейных.

3. Особенности спецификации модели. Причины существования случайной величины. Любое эконометрическое исследование начинается со спецификации модели , т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными.

Прежде всего из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии корреляционная связь представляется в виде функциональной зависимости, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых:

,

где у – фактическое значение результативного признака;

– теоретическое значении результативного признака, найденное исходя из уравнения регрессии;

– случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Случайная величина называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Присутствие в модели случайной величины порождено тремя источниками:

    спецификацией модели,

    выборочным характером исходных данных,

    особенностями измерения переменных.

К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции, но и недоучет в уравнении регрессии какого-либо существенного фактора (использование парной регрессии вместо множественной).

Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего имеет дело с выборочными данными при установлении закономерностей связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики. Исходных данных

Однако наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки – увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками.

4. Методы выбора парной регрессии. Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях отводится ошибкам спецификации модели. В парной регрессии выбор вида математической функции
может быть осуществлен тремя методами:

    графическим;

    аналитическим, т.е. исходя из теории изучаемой взаимосвязи;

    экспериментальным.

При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. Основные типы кривых, используемых при количественной оценке связей




Класс математических функций для описания связи двух переменных достаточно широк, также используются и другие типы кривых.

Аналитический метод выбор типа уравнения регрессии основан на изучении материальной природы связи исследуемых признаков, а также визуальной оценке характера связи. Т.е. если мы говорим о кривой Лаффера, показывающей зависимость между прогрессивностью налогообложения и доходами бюджета, то речь идет о параболической кривой, а в микроанализе изокванты представляют собой гиперболы.