/
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн.руб.) от объема капиталовложений (Х, млн.руб.).
Требуется:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретация коэффициента регрессии.
2. Вычислите остатки; найти остаточную сумму квадратов; оценить дисперсию остатков S2; построить график остатков.
3. Проверить выполнение предпосылок МНК.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (б = 0,05)/
5. Вычислить коэффициент детерминации, проверить значимость уравнения с помощью F-критерия Фишера (б = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
6. Осуществить прогнозирование среднего значения показателя Y при уровне значимости б = 0,1, если прогнозное значение фактора Х составить 80% от его максимального значения.
7. Представить графически фактические и модельные значения Y точки прогноза.
8. Составить уравнения нелинейной регрессии:
- гиперболической;
- степенной;
- показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
продукция капиталовложение экономический аппроксимация
Исходные данные
Х |
17 |
22 |
10 |
7 |
12 |
21 |
14 |
7 |
20 |
3 |
|
Y |
26 |
27 |
22 |
19 |
21 |
26 |
20 |
15 |
30 |
13 |
Решение:
Для решения воспользуемся пакетом анализа данных MS Excel.
Результаты расчетов
Регрессионная статистика |
||
Множественный R |
0,9256 |
|
R-квадрат |
0,8567 |
|
Нормированный R-квадрат |
0,8388 |
|
Стандартная ошибка |
2,1783 |
|
Наблюдения |
10 |
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
226,939 |
226,939 |
47,826 |
0,000 |
|
Остаток |
8 |
37,961 |
4,745 |
|||
Итого |
9 |
264,9 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
11,782 |
1,617 |
7,285 |
0,000 |
8,053 |
15,511 |
|
Х |
0,761 |
0,110 |
6,916 |
0,000 |
0,507 |
1,014 |
Наблюдение |
Предсказанное У |
Остатки |
|
1 |
14,064 |
-1,064 |
|
2 |
17,107 |
1,893 |
|
3 |
17,107 |
-2,107 |
|
4 |
19,389 |
2,611 |
|
5 |
20,911 |
0,089 |
|
6 |
22,433 |
-2,433 |
|
7 |
24,715 |
1,285 |
|
8 |
26,997 |
3,003 |
|
9 |
27,758 |
-1,758 |
|
10 |
28,519 |
-1,519 |
Рис.1
Уравнение линейной регрессии имеет вид
у = 11,782 + 0,761х
Показатели уравнения регрессии говорят о том, что независимая величина выпуска продукции составляет 11,782 млн.руб. и он увеличивается на 0,761 млн.руб. при увеличении величины капиталовложений на 1 млн.руб.
Остаточная сумма квадратов = 37,961
Дисперсия остатков S2 = остаточная сумма квадратов / n = 37,961 / 10 = 3,796
Исследования остатков еi предполагают проверку наличия следующих пяти предпосылок МНК:
1) случайный характер остатков. С этой целью строится график отклонения остатков от теоретических значений признака. Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и применение МНК оправдано. В других случаях необходимо применить либо другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.
В данном случае график остатков представляет из себя горизонтальную полосу, т.е. остатки равномерно распределены вокруг 'нулевой' линии.
2) нулевая средняя величина остатков, т.е. е = (ух - ух.расч) = 0, не зависящая от хi. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков еi от теоретических значений результативного признака ух строится график зависимости случайных остатков еi от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj. Если же график показывает наличие зависимости еi и хj то модель неадекватна. Причины неадекватности могут быть разные.
В данном случае сумма остатков = 0, т.е. это условие выполняется.
3. Гомоскедастичность - дисперсия каждого отклонения еi одинакова для всех значений хj. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции.
Данное условие логично проверять при большом количестве данных в совокупности.
4. Отсутствие автокорреляции остатков. Значения остатков еi распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
Проверить наличие автокорреляции можно по коэффициенту Дарбина-Уотсона.
d = = 2,613
Расчетное значение d может попадать в один из 5 интервалов:
0 - d1 - есть положительная автокорреляция остатков
d1 - d2 - зона неопределенности
d2 - (4-d2) - автокорреляция остатков отсутствует
(4-d2) - (4-d1) - зона неопределенности
(4-d1) - 4 - есть отрицательная автокорреляция остатков.
В качестве критических табличных уровней при n=10, двух объясняющих факторах при уровне значимости в 5% возьмем величины d1= 0,70 d2=1,64
Расчетное значение попадает в интервал (4-d2) - (4-d1), т.е. в зону неопределенности. В данном случае нельзя ни подтвердить, ни опровергнуть наличие автокорреляции остатков.
5. Остатки подчиняются нормальному распределению.
Соответствие остаточного ряда нормальному распределению можно проверить при помощи RS-критерия:
, где , S = 2,054
Eмакс = 3,003
Емин = - 2,433
RS = 2,647
Критические границы R / S-критерия для числа наблюдений n = 10 и уровня значимости a=0,05 имеют значения: (R/S)1 = 2,67 и (R/S)2 = 3,69.
Расчетное значение находится почти на нижней границе, но все таки ниже него.
Таким образом, можно сказать, что выполняются четыре из пяти предпосылок МНК.
В тех случаях, когда все пять предпосылок выполняются, оценки, полученные по МНК и методу максимального правдоподобия, совпадают между собой. Если распределение случайных остатков еi не соответствует некоторым предпосылкам МНК, то следует корректировать модель, изменить ее спецификацию, добавить (исключить) некоторые факторы, преобразовать исходные данные, что в конечном итоге позволяет получить оценки коэффициентов регрессии aj, которые обладают свойством несмещаемости, имеют меньшее значение дисперсии остатков, и в связи с этим более эффективную статистическую проверку значимости параметров регрессии.
Расчетные значения t-критерия Стьюдента рассчитаны в ходе анализа данных.
ta = 7,285
tb = 6,916
Критическое (табличное) значение составляет 2,3. Поскольку оба расчетных значения больше табличного, то можно сказать, что оба уравнения регрессии статистически значимы.
Коэффициент детерминации R2 = 0,8567
Коэффициент эластичности Э = = = 0,462
Расчетное значение F-критерия Фишера F = (n - 2) = 47,826
Табличное значение составляет 5,32. Поскольку расчетное значение больше табличного, то можно сделать вывод, что уравнение регрессии в целом статистически значимо.
Средняя относительная ошибка аппроксимации
*100% = 8,4%
Качество модели можно оценить как недостаточно высокое, поскольку величина средней относительной ошибка больше 5%.
Максимальное значение фактора Х = 22.
Если прогнозное значение фактора Х составит 80% от его максимального значения, то Хпрогн = 22 * 0,8 = 17,6
Расчетное значение показателя У = 11,782 + 0,761 * 17,6 = 25,18
График фактических и расчетных значений
Рис.2
Для построения гиперболической функции преобразуем
у = а + b/х - линеаризуется при замене Х = 1/x.
Расчетные данные
Регрессионная статистика |
||
Множественный R |
0,8199 |
|
R-квадрат |
0,6723 |
|
Нормированный R-квадрат |
0,6314 |
|
Стандартная ошибка |
3,2940 |
|
Наблюдения |
10 |
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
178,096 |
178,096 |
16,414 |
0,004 |
|
Остаток |
8 |
86,804 |
10,851 |
|||
Итого |
9 |
264,900 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
27,383 |
1,708 |
16,034 |
0,000 |
23,445 |
31,321 |
|
Х1 = 1 / Х |
-50,970 |
12,581 |
-4,051 |
0,004 |
-79,981 |
-21,958 |
Наблюдение |
Предсказанное У |
Остатки |
|
1 |
10,393 |
2,607 |
|
2 |
20,101 |
-1,101 |
|
3 |
20,101 |
-5,101 |
|
4 |
22,286 |
-0,286 |
|
5 |
23,135 |
-2,135 |
|
6 |
23,742 |
-3,742 |
|
7 |
24,385 |
1,615 |
|
8 |
24,834 |
5,166 |
|
9 |
24,956 |
1,044 |
|
10 |
25,066 |
1,934 |
Уравнение гиперболической модели имеет вид
у = 27,383 - 50,97 / х
Коэффициент детерминации R2 = 1 - = 0,6723
Коэффициент эластичности Э = = = 0,163
Средняя относительная ошибка Еотн = 19,03
График фактических данных и расчетных по гиперболической модели.
Рис.3
Уравнение степенной модели имеет вид
Уравнение степенной модели имеет вид у = ахb.
Для построения этой модели проведем линеаризацию переменных путем логарифмирования обеих частей уравнения: lg у = lg a + b lg x
Обозначим Y= lg у, Х= lg x, A= lg a.
Результаты анализа
Регрессионная статистика |
||
Множественный R |
0,9356 |
|
R-квадрат |
0,8753 |
|
Нормированный R-квадрат |
0,8597 |
|
Стандартная ошибка |
0,0433 |
|
Наблюдения |
10 |
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
0,105 |
0,105 |
56,138 |
0,000 |
|
Остаток |
8 |
0,015 |
0,002 |
|||
Итого |
9 |
0,120 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
0,9103 |
0,0573 |
15,8824 |
0,0000 |
0,7781 |
1,0425 |
|
lgX |
0,3938 |
0,0526 |
7,4926 |
0,0001 |
0,2726 |
0,5150 |
Наблюдение |
Предсказанное lgY |
Остатки |
Устеп |
|
1 |
1,098 |
0,016 |
12,5 |
|
2 |
1,243 |
0,036 |
17,5 |
|
3 |
1,243 |
-0,067 |
17,5 |
|
4 |
1,304 |
0,038 |
20,1 |
|
5 |
1,335 |
-0,013 |
21,6 |
|
6 |
1,362 |
-0,061 |
23,0 |
|
7 |
1,395 |
0,020 |
24,8 |
|
8 |
1,423 |
0,054 |
26,5 |
|
9 |
1,431 |
-0,016 |
27,0 |
|
10 |
1,439 |
-0,008 |
27,5 |
Уравнение линейной модели имеет вид
у = 0,9103 + 0,3938*х
Переходим к исходным переменным х и у, выполнив потенцирование данного уравнения, получим уравнение степенной модели регрессии.
у = 100,9103 *х0,3938= 8,134 *х0,3938
Коэффициент детерминации = 0,862
Коэффициент эластичности Э = b = 0,3938
Средняя относительная ошибка Еотн = 68,45%
График фактических и расчетных данных по степенной модели
Рис.4
Уравнение показательной модели имеет вид у = abx.
Для построения этой кривой произведем линеаризацию переменных при логарифмировании обеих частей уравнения: lg у = lg а + х*lg b
Обозначим Y= lg у, В= lg b, A=lg a.
Результаты анализа
Регрессионная статистика |
||
Множественный R |
0,9176 |
|
R-квадрат |
0,8420 |
|
Нормированный R-квадрат |
0,8222 |
|
Стандартная ошибка |
0,0488 |
|
Наблюдения |
10 |
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
0,101 |
0,101 |
42,626 |
0,000 |
|
Остаток |
8 |
0,019 |
0,002 |
|||
Итого |
9 |
0,120 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
1,1135 |
0,0362 |
30,7644 |
0,0000 |
1,0300 |
1,1970 |
|
Х |
0,0161 |
0,0025 |
6,5289 |
0,0002 |
0,0104 |
0,0218 |
Линейная функция имеет вид
у = 1,1135 + 0,0161х
Переходим к исходным переменным
Y=101,1135(100,0161)х
у =12,9871,038х
Наблюдение |
Предсказанное lgY |
Остатки |
Упоказательная |
|
1 |
1,162 |
-0,048 |
14,512 |
|
2 |
1,226 |
0,053 |
16,827 |
|
3 |
1,226 |
-0,050 |
16,827 |
|
4 |
1,274 |
0,068 |
18,804 |
|
5 |
1,306 |
0,016 |
20,248 |
|
6 |
1,339 |
-0,038 |
21,804 |
|
7 |
1,387 |
0,028 |
24,365 |
|
8 |
1,435 |
0,042 |
27,226 |
|
9 |
1,451 |
-0,036 |
28,253 |
|
10 |
1,467 |
-0,036 |
29,318 |
Коэффициент детерминации R2 = 0,8294
Коэффициент эластичности Э = хср * ln(b) = 13,3 * ln (1,038) = 0,469
Средняя относительная ошибка Еотн = 67,83%
График фактических данных и расчетных по показательной модели
Рис.5
Для сравнения моделей построим таблицу
Показатель |
Линейная |
Гиперболическая |
Степенная |
Показательная |
|
Коэф.детерминации |
0,8567 |
0,6723 |
0,8753 |
0,842 |
|
К-т эластичности |
0,462 |
0,163 |
0,3938 |
0,469 |
|
Средняя относительная ошибка |
8,4 |
19,03 |
68,45 |
67,83 |
Наибольшие коэффициенты детерминации у линейной, степенной и показательной функций. Максимальный - у степенной. Однако у данной модели максимальное значение средней относительной ошибки. Можно сделать вывод, что наилучшим образом зависимость между величиной выпуска и величиной капиталовложений описывает линейная функция.
Список литературы
Эконометрика: Учебник / И.И.Елисеева, С.В. Курышева, Т.В.Костеева и др.; Под ред.И.И.Елисеевой. - 2-к изд., перераб. и доп.. - М.: Финансы и статистика, 2005. - 576 с.:ил.
Елисеева И.И. ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ г. Москва 'Финансы и статистика' 2003.-192 с.;
Эконометрика: Учебник / Под ред. И.И.Елисеевой. - М.:Финансы и статистика, 2001. - 344 с.
Доугерти, К. Введение в эконометрику / К.Доугерти - М.:ИНФРА-М, 1997 г.