/
Завдання 1
По території регіону приводяться дані у табл. 1 за 200X р.
Таблиця 1 Вихідні дані
Номер регіону |
Середній добовий прожитковий мінімум на одного трудоспроможного громадянина, грн., х |
Середня добова заробітна плата, грн., у |
|
1 |
88 |
142 |
|
2 |
89 |
148 |
|
3 |
87 |
145 |
|
4 |
79 |
154 |
|
5 |
106 |
167 |
|
6 |
116 |
195 |
|
7 |
67 |
139 |
|
8 |
98 |
167 |
|
9 |
82 |
152 |
|
10 |
87 |
162 |
|
11 |
86 |
155 |
|
12 |
120 |
173 |
Необхідно:
1. Побудувати лінійне рівняння парної регресії y по x .
2. Розрахувати лінійний коефіцієнт парної кореляції, коефіцієнт детермінації й середню помилку апроксимації.
3. Оцінити статистичну значимість рівняння регресії в цілому й окремих параметрах регресії й кореляції за допомогою F-критерію Фішера й t-критерію Стьюдента.
4. Виконати прогноз заробітної плати y при прогнозному значенні середнього добового прожиткового мінімуму x , що становить 107% від середнього рівня.
5. Оцінити точність прогнозу, розрахувавши помилку прогнозу і його довірчий інтервал.
6. На одному графіку відкласти вихідні дані й теоретичну пряму.
7. Перевірити обчислення за допомогою Аналізу даних у MS Excel.
Розв'язання
1. Для розрахунків параметрів рівняння лінійної регресії побудуємо наступну таблицю (рис. 1).
заробітний плата кореляція апроксимація
Рис. 1
За наступними формулами знаходимо параметри регресії a, b (у завданні до лабораторної роботи це відповідно).
Отримано рівняння регресії:
Параметр регресії дозволяє зробити висновок, що зі збільшенням середнього прожиткового мінімуму на 1 грн. середня добова заробітна плата зростає в середньому на 0,86 грн. (або 86 коп.).
Після знаходження рівняння регресії заповнюємо стовпці 7-10 таблиці
2. Тісноту лінійного зв'язку оцінить коефіцієнт кореляції:
Так як значення коефіцієнта кореляції більше за 0,7, то це свідчить про наявність досить тісного лінійного зв'язку між ознаками.
Коефіцієнт детермінації:
Це означає, що 52% варіації заробітної плати (y) пояснюється варіацією фактору x - середнього добового прожиткового мінімуму.
Якість моделі визначає середня помилка апроксимації:
Якість побудованої моделі оцінюється як гарна, тому що A не перевищує 10%.
3. Оцінку статистичної значимості рівняння регресії в цілому проведемо за допомогою F-критерію Фішера. Фактичне значення F-критерію за наступною формулою складатиме:
Табличне значення критерію при 5% рівні значимості та степенях свободи і складає
Так як
то рівняння регресії вважається статистично значимим.
Оцінку статистичної значимості параметрів регресії й кореляції проведемо за допомогою t-статистики Стьюдента й шляхом розрахунку довірчого інтервалу кожного з параметрів.
Табличне значення t-критерію для числа степеней свободи df = n-2 = 12-2= 10 та рівня значимості б=0,05 складає
Визначимо стандартні помилки (залишкова дисперсія на одну степінь свободи ):
Тоді:
Фактично значення t-статистики перевищують табличне значення:
тому параметри a, b й rxy не випадково відрізняються від нуля, а є статистично значимими.
Розрахуємо довірчі інтервали для параметрів регресії a та b. Для цього визначимо граничну похибку для кожного показника:
Довірчі інтервали:
Аналіз верхньої й нижньої границь довірчих інтервалів приводить до висновку про те, що з ймовірністю параметри a і b, перебуваючи в зазначених границях, не приймають нульових значень, тобто є статистично значимими й істотно відмінні від нуля.
4. Отримані оцінки рівняння регресії дозволяють використати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму складе:
грн.
то індивідуальне прогнозне значення заробітної плати складе:
грн.
5. Похибка прогнозу складатиме:
Гранична похибка прогнозу, яка в 95% випадків не буде перевищувати, складатиме:
Довірчий інтервал прогнозу:
Виконаний прогноз середньої добової заробітної плати є надійним та знаходиться в межах від 223,02 грн. до 262,92 грн.
Розв'язування типової задачі регресійного аналізу в MS Excel.
За допомогою інструмента аналізу даних Регрессия можна отримати результати регресійної статистики, дисперсійного аналізу, довірчих інтервалів, залишки та графіки підбору лінії регресії.
1. Якщо вихідні дані вже занесені, то обираємо
Сервис>Анализ данных>Регрессия.
2. Заповнюємо діалогове вікно введення даних та параметрів виведення (рис. 2).
Рис. 2
Тут маємо:
Входной интервал Y - діапазон, що містить дані результативної ознаки;
Входной интервал X - діапазон, що містить дані ознаки-фактору;
Метки - 'флажок', що вказує, чи місти перший рядок назви стовпців;
Константа - ноль - 'флажок', що вказує на наявність або відсутність вільного члена в рівнянні;
Выходной интервал - досить указати ліву верхню клітинку майбутнього діапазону;
Новый рабочий лист - можна вказати довільне ім'я нового аркуша (або не вказувати, тоді результати виводяться на знову створений аркуш).
Одержуємо наступні результати для нашого приклада (рис. 3).
Рис. 3
Звідки виписуємо, округляючи до 4 знаків після коми й переходячи до наших позначень.
Рівняння регресії:
Коефіцієнт кореляції:
Коефіцієнт детермінації:
Фактичне значення F-критерію Фішера:
Залишкова дисперсія на одну степінь свободи:
Квадратний корінь з залишкової дисперсії (стандартна похибка):
Стандартні похибки для параметрів регресії:
Фактичні значення t-критерію Стьюдента:
Довірчі інтервали:
Як бачимо, знайдені всі розглянуті вище параметри й характеристики рівняння регресії, за винятком середньої похибки апроксимації (значення t-критерію Стьюдента для коефіцієнта кореляції збігається с ). Результати 'ручного розрахунку' від машинного відрізняються незначно (відмінності пов'язані з помилками округлення).