Методи математичної статистики (2) - Реферат Математична статистика для спеціалістів різних областей Методи математичної статистики коротко

Математична статистика - Наука про те, як систематизувати та використовувати статистичні дані для наукових та прикладних цілей.

Математична статистика у психології

У психології як науці математична статистика застосовується дуже широко. За допомогою тих чи інших способів, наприклад, тестування, різним особливостям поведінки людини зіставляються числа (шкалюються), і з цими числами вже працюють методами математичної статистики. Після застосування цих методів утворюються нові дані, які слід осмислити.

Без застосування математичної статистики психологія була досить плоскою і малоінформативною наукою, заснованої на домислах і спекуляціях (як це, наприклад, має місце бути в психоаналізі). Зрозуміло, використання математичної статистики не є "протиотрутою" проти домислів і спекуляцій, проте предмет міркувань стає значно багатшим.

Розглянемо типовий та простий випадок використання математичної статистики. Допустимо, хтось провів дослідження групи школярів. Серед інших було знайдено такі параметри, як екстраверсія-інтроверсія та рівень інтелекту. Психолога-дослідника зацікавило, як пов'язані ці параметри між собою. Чи правда, що інтроверти в середньому розумніші за екстраверти? Для цього групу випробуваних (вибірку) можна поділити на дві підгрупи: екстравертів та інтровертів. Далі по кожній підгрупі знаходиться середнє арифметичне за рівнем інтелекту. Якщо, скажімо, у інтровертів в середньому IQ вище, значить, вони розумніші за екстраверти. Це є один підхід. Інший може полягати в тому, щоб розділити піддослідних на підгрупу з високим IQ (більше 100) і низьким (менше 100), а потім порахувати середнє екстраверсії-інтроверсії в кожній групі. Третій підхід може полягати в тому, щоб замість поділу на підгрупи та вирахування в них середніх задіяти складніший метод – кореляційний аналіз. Всі ці три методи по-різному, але покажуть той самий зв'язок.

Математична статистика дозволяє робити цікаві, інколи дивовижні відкриття. Продовжимо наш гіпотетичний приклад. Припустимо, що психолог знайшов парадоксальний результат, який суперечить його минулим досвідом, знаннями. Скажімо, він встановив, що в одній школі екстраверти розумніші за інтроверти, хоча в усіх інших школах було навпаки. Чому так? Прискіпливий психолог може розпочати своє розслідування і встановить, що, наприклад, це пов'язано з тим, що в цій школі екстраверти ходять на факультатив з фізики (бо там «заводний учитель») і розвивають свій інтелект, а інтроверти ходять на факультатив з літератури (бо там «душевний учитель»), де розвивають інші якості своєї душі. Чи може, наприклад, психоаналітик дійти такого відкриття? Вкрай малоймовірно.

У психологічних дослідженнях беруться до уваги не тільки такі суто психологічні параметри, як, скажімо, інтелект, екстравертованість або тривожність. Можуть використовуватися і такі дані, як вік, стать, рівень освіти, зростання, вага, фізична сила, політичні погляди, стаж роботи та багато іншого. Часто буває, що без таких непсихологічних показників дослідження виявляються неповними, малоінформативними. Також часто буває, що представники інших наук (наприклад, соціології чи біології) також використовують психологічні параметри у своїх дослідженнях.

Математична статистика дозволяє багато речей:

Практичні психологи у своїй роботі зазвичай обмежуються знаходженням середньої арифметичної, з поділом на підгрупи (як у прикладі вище). Вчені-психологи використовують найрізноманітніший арсенал методів математичної статистики. Розглянемо основні.

Знаходження середньої арифметичної

Найбанальніший і найпростіший метод. Показники (наприклад, зростання випробуваних) складаються, потім діляться на кількість випробуваних. Незважаючи на простоту, метод, звичайно, дуже інформативний та наочний. Наочність - важлива якість методу для практичного психолога. Коли він репрезентує результати своїх досліджень замовнику (наприклад, директору школи), той далеко не завжди здатний зрозуміти сутність кореляційного чи дисперсійного аналізу. Поділ піддослідних на підгрупи з довільної основи посилює потенціал середньої арифметичної, дозволяючи закрити більшість потреб дослідника.

Знаходження моди та медіани

Припустимо, ми обстежили 1000 студентів – вимірювали їхнє зростання з точністю до сантиметра. Ці дані заносили до таблиці. Якщо в таблиці найчастіше зустрічається значення, скажімо, 172 сантиметри, це і є моданашої вибірки. Аналогічним, до речі, слово "мода" використовується і в побуті: якщо цього сезону найчастіше можна зустріти шапочки червоного кольору, значить це мода, хоча на частку цих шапочок може припадати лише 20 або 30 відсотків.

У психологічних дослідженнях зазвичай мода знаходиться десь поряд із середньою арифметичною. Якщо мода 172 см, то середня буде близько того. Чим більша вибірка, тим ближче мода і середнє арифметичне.

Далі. Припустимо, що ми поділили своїх студентів на дві рівні групи: у першій групі 500 низьких студентів, у другій групі 500 високих студентів. Значення зростання, яке припадає на 500-го чи 501-го студента і є медіана. Медіана зазвичай теж знаходиться поряд із середньою арифметичною.

Виявлення розсіювання значень

Як відомо, середня температура по лікарні не така вже й важлива. І в гарній лікарні, де добре лікують, середня температура може бути 36,6°C; і в поганій може бути така сама: просто у когось жар 40 °C, а хтось уже помер, і у нього 18 °C.

Найпростіший спосіб оцінити розсіювання вибірки – знайти її розмах(інакше – розкид). Якщо в нашій вибірці найнижчий студент має зріст 148 см, а найвищий 205 см, значить розмах вибірки становитиме 205-148=57 см. Ця величина важлива в першу чергу для того, щоб оцінити, в яких межах змінюється даний параметр.

Далі. Припустимо таку ситуацію. Років через двадцять після забаганки якоїсь багатої людини у нього з'являться діти-клони. Ще через двадцять років вони вступлять до університету. І буде в університеті вибірка студентів обсягом 1000 осіб, з яких 998 мають зріст 177 см, одна – 148 см, одна – 205 см. За основними параметрами – середньою арифметичною, модою, медіаною, розмахом – ця вибірка може не відрізнятися від іншої вибірки студентів (там будуть такі самі значення). Але при цьому в другій (нормальній) вибірці буде якась кількість студентів зі зростом 150-160 см, якась зі зростом 180-190 см тощо. То що, виходить, що з погляду математичної статистики ці групи однакові?

Одного погляду цей малюнок достатньо, щоб зрозуміти, що групи різняться по розсіянню значень. Тому в статистиці є точніший інструмент для оцінки розсіювання – дисперсія. Дисперсію обчислюють так: знаходять середнє арифметичне, потім для кожного випадку знаходять відхилення від середнього, зводять це значення квадрат, в кінці ділять на загальну кількість випадків. Зі значення дисперсії легко отримати стандартне відхилення: воно є квадратним коренем з дисперсії. Стандартне відхилення означає, що зрозуміло стандартне відхилення: тобто міра того, наскільки в середньому значення взагалі відхиляються.

Стандартне відхилення вимірюється в тих самих одиницях, що і сам параметр. У першій нашій гіпотетичній групі, де майже всі студенти однакові, стандартне відхилення буде вкрай малим (менше 1 см). У другій групі буде значно більше – сантиметрів 10-15. Якщо нам скажуть, що середнє зростання студентів становить 175 см за стандартного відхилення 12 см, ми знатимемо, що більшість студентів (приблизно 2/3) знаходиться в діапазоні від 163 до 187 см.

t-критерій Стьюдента

Припустимо, ми вирішили провести експеримент такого роду. Ми взяли групу випробуваних. Перед початком експерименту їх протестували, скажімо, на рівень креативності. Далі вони цілий місяць займалися по годині на день малюванням. Наприкінці експерименту ми знову перевірили їх у рівень креативності. Був помічений результат, але досить малий, і скептики стали нам заявляти, що рівень креативності не підвищився, невелике підвищення середньої арифметичної це лише випадковість.

Для таких ситуацій вигадали різні критерії. Один з них – найпопулярніший – це t-критерій Стьюдента. У чисельнику в нього різниця середніх арифметичних. У знаменнику – корінь із суми квадратів дисперсій (мається на увазі перший та другий випадок тестування). Чим більша різниця між середніми арифметичними, тим краще (наша праця не залишилася марною), і чим менший розкид значень в обох випадках діагностики, тим краще: коли розкид значень більший, тоді й випадкові коливання теж більші.

Для застосування даного критерію є суттєве обмеження – розподіл показників має бути близьким до так званого нормальному(Дзвоноподібного).

Існують спеціальні критерії визначення ступеня нормальності розподілу.

Кореляція

У психології, як це ні в одній іншій науці, люблять знаходити коефіцієнти кореляції. Існує кілька різних підходів, у тому числі і для нормального, і для нормального розподілу. Усі вони показують рівень залежності одного параметра від іншого. Якщо один параметр (наприклад, вага людини) залежить від іншого параметра (наприклад, зростання людини), тоді коефіцієнт кореляції буде близький до +1. Якщо залежність зворотна (наприклад, чим людина вища, тим менш спритна вона), тоді коефіцієнт кореляції буде прагнути до -1. Якщо залежності немає (скажімо, успіх при грі в карти не залежить від зростання людини), тоді коефіцієнт кореляції буде близько 0.

Якщо взяти групу піддослідних, зафіксувати їх зростання і вагу, а потім результати перенести на двомірний графік, то вийде приблизно така картина, яка свідчить про те, що позитивна кореляція, приблизно на рівні +0.5.

Факторний аналіз

Найбільше, мабуть, таємничий аналіз. Деяка загадковість його пояснюється тим, що він призначений для того, щоб знайти новий параметр, який багато що пояснює, але при цьому безпосередньо в ході експерименту не досліджувався. Як правило, в ході факторного аналізу знаходяться найвпливовіші параметри, від яких залежать дрібніші, приватні.

Допустимо, ми проводили дослідження зі школярами. Серед інших фіксувалися такі параметри: загальна успішність, успішність з точних предметів, успішність з гуманітарних предметів, обсяг короткочасної пам'яті, обсяг і розподіл уваги, активність мислення, просторова уява, загальна поінформованість, товариськість, тривожність. Якщо застосувати кореляційний аналіз і скласти так звану матрицю кореляцій (де відображено зв'язок кожного параметра з кожним), можна побачити, більшість цих параметрів між собою добре корелює. Виняток становить останні два, які з іншими пов'язані слабко. Вже дивлячись на цю матрицю можна припустити, що за більшістю параметрів стоїть один загальний (понад-параметр), який на них на всіх впливає. Ми проводимо процедуру факторного аналізу, і після цього у нашій матриці з'являється ще один стовпець – стовпець без назви. Цей загадковий параметр дуже добре корелює з усіма (крім комунікабельності та тривожності). Після деякого творчого роздуму психолог приходить до єдино можливої ​​інтерпретації – загадковий параметр це є інтелект. Він і впливає на все інше, вплив його сильний, хоч і не стовідсотковий.

Існують методи факторного аналізу, які допомагають виявити не один, а кілька факторів, що впливають на інші параметри. Часто так буває, звичайно, що загадковий параметр виявляється не таким загадковим, а повністю збігається з одним з тих параметрів, які фіксувалися. Але іноді буває і так, що доведеться довго поламати голову, перш ніж вдасться інтерпретувати цей секретний фактор.

Факторний аналіз застосовується переважно вченими для глибокого розуміння предмета дослідження. При цьому слід враховувати, що для точності результату потрібна досить велика кількість випробуваних: бажано, щоб кількість випробуваних у рази перевищувала кількість параметрів.

За допомогою факторного аналізу можна вивчати якість психологічних тестів. Якщо взяти, наприклад, якийсь особистісний опитувальник з декількома параметрами, піддати ці параметри факторного аналізу, то може випливти якийсь дивний загальний фактор, що впливає на всі параметри. Значного психологічного сенсу він може не мати – це просто тенденція досліджуваного відповідати так чи інакше за формальною ознакою (хтось відповідає вдумливо, хтось схильний вибирати перші пункти з варіантів, хтось останні). Великий вплив цього загального фактора може говорити про недостатньо якісне опрацювання завдань.

Література

Єрмолаєв О. Ю. Математична статистика для психологів: Підручник. - 2-ге вид. випр. - М: МПСІ, Флінта, 2003. - 336 с.

ВИПАДКОВІ ВЕЛИЧИНИ І ЗАКОНИ ЇХ РОЗПОДІЛУ.

Випадковийназивають таку величину, яка набуває значення залежно від збігу випадкових обставин. Розрізняють дискретні та випадкові безперервні величини.

Дискретноюназивають величину, якщо вона приймає лічильну множину значень. ( Приклад:кількість пацієнтів на прийомі у лікаря, число літер на сторінці, число молекул у заданому обсязі).

Безперервнийназивають величину, яка може набувати значення всередині деякого інтервалу. ( Приклад:температура повітря, маса тіла, зростання людини тощо)

Законом розподілувипадкової величини називається сукупність можливих значень цієї величини і, що відповідають цим значенням, ймовірностей (або частот народження).

П р і м е р:

x x 1 x 2 x 3 x 4 ... x n
p р 1 р 2 р 3 р 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

ЧИСЛОВІ ХАРАКТЕРИСТИКИ ВИПАДКОВИХ ВЕЛИЧИН.

У багатьох випадках поряд із розподілом випадкової величини або замість нього інформацію про ці величини можуть дати числові параметри, що отримали назву числових характеристик випадкової величини . Найбільш уживані з них:

1 .Математичне очікування - (Середнє значення) випадкової величини є сума творів всіх можливих її значень на ймовірності цих значень:

2 .Дисперсія випадкової величини:


3 .Середнє квадратичне відхилення :

Правило "ТРОХ СИГМ" -якщо випадкова величина розподілена за нормальним законом, то відхилення цієї величини від середнього значення по абсолютній величині не перевищує потрійного середнього квадратичного відхилення

ЗАОН ГАУССА – НОРМАЛЬНИЙ ЗАКОН РОЗПОДІЛУ

Часто зустрічаються величини, розподілені за нормальному закону (Закон Гауса). Головна особливість : він є граничним законом, до якого наближаються інші закони розподілу

Випадкова величина розподілена за нормальним законом, якщо її щільність імовірності має вигляд:



M(X)- Математичне очікування випадкової величини;

s- Середнє квадратичне відхилення.

Щільність ймовірності(функція розподілу) показує, як змінюється ймовірність, віднесена до інтервалу dx випадкової величини, залежно від значення самої величини:


ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Математична статистика- Розділ прикладної математики, що безпосередньо примикає до теорії ймовірностей. Основна відмінність математичної статистики від теорії ймовірностей полягає в тому, що в математичній статистиці розглядаються не події над законами розподілу та числовими характеристиками випадкових величин, а наближені методи відшукання цих законів та числових характеристик за результатами експериментів.

Основними поняттямиматематичної статистики є:

1. Генеральна сукупність;

2. вибірка;

3. варіаційний ряд;

4. мода;

5. медіана;

6. процентиль,

7. полігон частот,

8. гістограма.

Генеральна сукупність- велика статистична сукупність, з якої відбирається частина об'єктів на дослідження

(Приклад:все населення області, студенти вузів цього міста тощо)

Вибірка (вибіркова сукупність)- безліч об'єктів, відібраних із генеральної сукупності.

Варіаційний ряд- Статистичне розподіл, що складається з варіант (значень випадкової величини) та відповідних їм частот.

Приклад:

X, кг
m

x- значення випадкової величини (маса дівчаток віком 10 років);

m- Частота народження.

Мода- Значення випадкової величини, якому відповідає найбільша частота народження. (У наведеному вище прикладі моді відповідає значення 24 кг, воно зустрічається частіше за інших: m = 20).

Медіана- Значення випадкової величини, яке ділить розподіл навпіл: половина значень розташована правіше медіани, половина (не більше) - лівіше.

Приклад:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

У прикладі спостерігаємо 40 значень випадкової величини. Всі значення розташовані в порядку зростання з урахуванням частоти їхнього народження. Видно, що праворуч від виділеного значення 7 розташовані 20 (половина) із 40 значень. Отже, 7 – це медіана.

Для характеристики розкиду знайдемо значення, не вище за які виявилося 25 і 75% результатів вимірювання. Ці величини називаються 25-м та 75-м відсотками . Якщо медіана ділить розподіл навпіл, то 25-й та 75-й проценти відсікають від нього по четвертушці. (Саму медіану, до речі, можна вважати 50-м відсотком.) Як видно з прикладу, 25-й і 75-й відсотки рівні відповідно 3 і 8.

Використовують дискретне (точковий) статистичний розподіл та безперервне (інтервальний) статистичний розподіл.

Для наочності статистичні розподіли зображують графічно як полігону частот або - гістограми .

Полігон частот- ламана лінія, відрізки якої з'єднують точки з координатами ( x 1 ,m 1), (x 2 ,m 2), ..., або для полігону відносних частот - З координатами ( x 1, р * 1), (x 2, р * 2), ... (Мал.1).


m m i /n f(x)

Рис.1 Рис.2

Гістограма частот- Сукупність суміжних прямокутників, побудованих на одній прямій лінії (Рис.2), основи прямокутників однакові і рівні dx , а висоти дорівнюють відношенню частоти до dx , або р * до dx (Щільність ймовірності).

Приклад:

х, кг 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Полігон частот

Відношення відносної частоти до ширини інтервалу має назву густини ймовірності f(x)=m i / n dx = p* i / dx

Приклад побудови гістограми .

Скористайтеся даними попереднього прикладу.

1. Розрахунок кількості класових інтервалів

де n - Число спостережень. У нашому випадку n = 100 . Отже:

2. Розрахунок ширини інтервалу :

,

3. Складання інтервального ряду:

2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Гістограма

Методи математичної статистики


1. Вступ

Математичною статистикою називається наука, що займається розробкою методів отримання, опису та обробки дослідних даних з метою вивчення закономірностей випадкових масових явищ.

У математичній статистиці можна назвати два напрями: описову статистику і індуктивну статистику (статистичний висновок). Описова статистика займається накопиченням, систематизацією та поданням досвідчених даних у зручній формі. Індуктивна статистика на основі цих даних дозволяє зробити певні висновки щодо об'єктів, про які зібрані дані або оцінки їх параметрів.

Типовими напрямками математичної статистики є:

1) теорія вибірок;

2) теорія оцінок;

3) перевірка статистичних гіпотез;

4) регресійний аналіз;

5) дисперсійний аналіз.

В основі математичної статистики лежить ряд вихідних понять, без яких неможливе вивчення сучасних методів обробки досвідчених даних. У перших їх можна поставити поняття генеральної сукупності і вибірки.

При масовому промисловому виробництві часто потрібно без перевірки кожного виробу встановити, чи відповідає якість продукції стандартам. Так як кількість продукції дуже велика або перевірка продукції пов'язана з приведенням її в непридатність, то перевіряється невелика кількість виробів. На основі цієї перевірки потрібно дати висновок про всю серію виробів. Звичайно не можна стверджувати, що всі транзистори з партії в 1 млн штук придатні або непридатні, перевіривши один з них. З іншого боку, оскільки процес відбору зразків для випробувань і самі випробування можуть виявитися тривалими за часом і призвести до великих витрат, то обсяг перевірки виробів повинен бути таким, щоб він зміг дати достовірне уявлення про всю партію виробів, будучи мінімальним розміром. З цією метою введемо низку понять.

Вся сукупність об'єктів, що вивчаються, або експериментальних даних називається генеральною сукупністю. Будемо позначати через N число об'єктів чи кількість даних, що становлять генеральну сукупність. Величину N називають обсягом генеральної сукупності. Якщо N>>1, тобто N дуже велике, то зазвичай вважають N = ¥.

Випадковою вибіркою або просто вибіркою називають частину генеральної сукупності, навмання відібрану з неї. Слово " навмання " означає, що можливість вибору будь-якого об'єкта з генеральної сукупності однакова. Це важливе припущення, однак, часто важко перевірити на практиці.

Об'ємом вибірки називають кількість об'єктів або кількість даних, що становлять вибірку, і позначають n. Надалі вважатимемо, що елементам вибірки можна приписати відповідно числові значення х 1, х 2, ... х n. Наприклад, у процесі контролю якості вироблених біполярних транзисторів це можуть бути вимірювання їхнього коефіцієнта посилення по постійному струму.


2. Числові характеристики вибірки

2.1 Вибіркове середнє

Для конкретної вибірки обсягу n її вибіркове середнє

визначається співвідношенням

де х i – значення елементів вибірки. Зазвичай потрібно описати статистичні властивості довільних випадкових вибірок, а чи не однієї з них. Це означає, що розглядається математична модель, яка передбачає досить велику кількість вибірок обсягу n. У цьому випадку елементи вибірки розглядаються як випадкові величини Х i , що приймають значення х i з густиною ймовірностей f(x), що є густиною ймовірностей генеральної сукупності. Тоді вибіркове середнє також є випадковою величиною

рівною

Як і раніше позначатимемо випадкові величини великими літерами, а значення випадкових величин - малими.

Середнє значення генеральної сукупності, з якої проводиться вибірка, називатимемо генеральним середнім і позначатим m x . Очікується, що якщо обсяг вибірки значний, то вибіркове середнє не помітно відрізнятиметься від генерального середнього. Оскільки вибіркове середнє є випадковою величиною, для неї можна знайти математичне очікування:

Таким чином, математичне очікування вибіркового середнього дорівнює генеральному середньому. І тут кажуть, що вибіркове середнє є незміщеною оцінкою генерального середнього. Надалі ми повернемось до цього терміну. Так як вибіркове середнє є випадковою величиною, що флуктує навколо генерального середнього, то бажано оцінити цю флуктуацію за допомогою дисперсії вибіркового середнього. Розглянемо вибірку, обсяг якої n значно менший за обсяг генеральної сукупності N (n<< N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Випадкові величини Х i і X j (i¹j) можна вважати незалежними, отже,

Підставимо отриманий результат у формулу для дисперсії:

де s 2 - Дисперсія генеральної сукупності.

З цієї формули випливає, що зі збільшенням обсягу вибірки флуктуації середнього вибіркового близько середнього генерального зменшуються як s 2 /n. Проілюструємо сказане прикладом. Нехай є випадковий сигнал з математичним очікуванням та дисперсією відповідно рівними m x = 10, s 2 = 9.

Відліки сигналу беруться в рівновіддалені моменти часу t 1 , t 2 , ... ,

X(t)

X 1

t 1 t 2 . . . t n t

Оскільки відліки є випадковими величинами, то їх позначатимемо X(t 1), X(t 2), . . . , X(t n).

Визначимо кількість відліків, щоб середнє відхилення оцінки математичного очікування сигналу не перевищило 1% його математичного очікування. Оскільки m x = 10, потрібно, щоб

З іншого боку, тому або Звідси отримуємо, що n ³ 900 відліків.

2.2 Вибіркова дисперсія

За вибірковими даними важливо знати як вибіркове середнє, а й розкид вибіркових значень біля вибіркового середнього. Якщо вибіркове середнє є оцінкою генерального середнього, то вибіркова дисперсія має бути оцінкою генеральної дисперсії. Вибіркова дисперсія

для вибірки, що складається з випадкових величин, визначається наступним чином

Використовуючи це представлення вибіркової дисперсії, знайдемо її математичне очікування

Математична статистика одна із основних розділів такий науки, як математика, і є галузь, вивчаючу методи і правила обробки певних даних. Іншими словами, вона досліджує способи розкриття закономірностей, які властиві великим сукупностям однакових об'єктів, ґрунтуючись на їхньому вибірковому обстеженні.

Завдання цього розділу полягає у побудові методів оцінки ймовірності чи прийнятті певного рішення про характер подій, що розвиваються, спираючись на отримані результати. Для опису даних використовуються таблиці, діаграми та кореляційні поля. застосовуються рідко.

Математична статистика використовують у різних галузях науки. Наприклад, для економіки важливо обробляти відомості про однорідні сукупності явищ та об'єктів. Ними можуть бути вироби, що випускаються промисловістю, персонал, дані про прибуток і т. д. Залежно від математичної природи результатів спостережень, можна виділити статистику чисел, аналіз функцій та об'єктів нечислової природи, багатовимірний аналіз. Крім цього, розглядають загальні та приватні (пов'язані з відновленням залежностей, використанням класифікацій, вибірковими дослідженнями) завдання.

Автори деяких підручників вважають, що теорія математичної статистики є лише розділом теорії ймовірності, інші – що це самостійна наука, що має власні цілі, завдання та методи. Однак у будь-якому випадку її використання дуже широке.

Так, найяскравіше математична статистика застосовна у психології. Її використання дозволить фахівцеві правильно обґрунтувати знайти залежність між даними, узагальнити їх, уникнути багатьох логічних помилок та багато іншого. Слід зазначити, що виміряти той чи інший психологічний феномен чи властивість особистості без обчислювальних процедур часто просто неможливо. Це свідчить, що ази цієї науки необхідні. Іншими словами, її можна назвати джерелом та базою теорії ймовірностей.

p align="justify"> Метод дослідження, який спирається на розгляд статистичних даних, використовується і в інших областях. Проте відразу слід зазначити, що його риси щодо об'єктів, мають різну природу походження, завжди своєрідні. Тому об'єднувати в одну науку фізичну чи немає сенсу. Загальні ж риси даного методу зводяться до підрахунку певної кількості об'єктів, що входять до тієї чи іншої групи, а також до вивчення розподілу кількісних ознак та застосування теорії ймовірностей для отримання тих чи інших висновків.

Елементи математичної статистики використовуються в таких галузях, як фізика, астрономія і т. д. Тут можуть розглядатися значення характеристик та параметрів, гіпотези про збіг будь-яких характеристик у двох вибірках, про симетрію розподілу та багато іншого.

Велику роль математична статистика грає у проведенні Їх метою найчастіше є побудова адекватних методів оцінювання та перевірка гіпотез. Нині велике значення у цій науці мають комп'ютерні технології. Вони дозволяють як значно спростити процес розрахунку, а й створити для розмноження вибірок чи щодо придатності отриманих результатів практично.

У загальному випадку методи математичної статистики допомагають зробити два висновки: або прийняти судження про характер або властивості досліджуваних даних та їх взаємозв'язків, або довести, що отриманих результатів недостатньо для того, щоб робити висновки.

Даним, отриманим в результаті експерименту, властива мінливість, що може бути викликана випадковою помилкою: похибкою вимірювального приладу, неоднорідністю зразків і т.д. Після проведення великої кількості однорідних даних експериментатору необхідно їх обробити для отримання якомога більш точної інформації про величину, що розглядається. Для обробки великих масивів даних вимірювань, спостережень тощо, які можуть бути отримані під час проведення експерименту, зручно застосовувати методи математичної статистики.

Математична статистика нерозривно пов'язана з теорією ймовірностей, але між цими науками є суттєва відмінність. Теорія ймовірностей використовує вже відомі розподіли випадкових величин, на основі яких розраховуються ймовірності подій, математичне очікування тощо. Завдання математичної статистики– отримати якнайдостовірнішу інформацію про розподіл випадкової величини з урахуванням експериментальних даних.

Типові напрямкиматематичної статистики:

  • теорія вибірок;
  • теорія оцінок;
  • перевірка статистичних гіпотез;
  • регресійний аналіз;
  • дисперсійний аналіз.

Методи математичної статистики

Методи оцінки та перевірки гіпотез ґрунтуються на імовірнісних та гіпервипадкових моделях походження даних.

Математична статистика оцінює параметри та функції від них, які представляють важливі характеристики розподілів (медіану, математичне очікування, стандартне відхилення, квантили та ін), щільності та функції розподілу та ін. Використовуються точкові та інтервальні оцінки.

Сучасна математична статистика містить великий розділ статистичний послідовний аналіз, В якому допускається формування масиву спостережень по одному масиву.

Математична статистика також містить загальну теорію перевірки гіпотезі велика кількість методів для перевірки конкретних гіпотез(наприклад, про симетрію розподілу, про значення параметрів та характеристик, про згоду емпіричної функції розподілу із заданою функцією розподілу, гіпотеза перевірки однорідності (збіг характеристик або функцій розподілу у двох вибірках) та ін.).

Проведенням вибіркових обстежень, пов'язаних з побудовою адекватних методів оцінки та перевірки гіпотез, із властивостями різних схем організації вибірок, займається розділ математичної статистики, що має велике значення. Методи математичної статистики безпосередньо використовують такі основні поняття.

Вибірка

Визначення 1

Вибіркоюназиваються дані, отримані під час проведення експерименту.

Наприклад, результати дальності польоту кулі при пострілі того самого або групи однотипних знарядь.

Емпірична функція розподілу

Зауваження 1

Функція розподілудає можливість висловити всі найважливіші показники випадкової величини.

У математичній статистиці існує поняття теоретичної(заздалегідь не відомою) та емпіричноїфункції розподілу.

Емпірична функція визначається за даними досвіду (емпіричні дані), тобто. за вибіркою.

Гістограма

Гістограми використовуються для наочного, але досить наближеного уявлення про невідомий розподіл.

Гістограмає графічне зображення розподілу даних.

Для отримання якісної гістограми дотримуються наступних правил:

  • Кількість елементів вибірки має бути істотно меншою за обсяг вибірки.
  • Інтервали розбиття мають містити достатню кількість елементів вибірки.

Якщо вибірка дуже велика, часто інтервал елементів вибірки розбивають на однакові частини.

Вибіркова середня та вибіркова дисперсія

За допомогою даних понять можна отримати оцінку необхідних числових характеристик невідомого розподілу, не вдаючись до побудови розподілу функції, гістограми і т.п.