/
Задание
1. Построить график
2. Провести предварительный анализ:
· проверить на анормальности методом Ирвина,
· проверить на наличие тренда методом Фостера-Стьюарта,
· сгладить уровни ряда методом простой скользящей средней.
3. Найти параметры линейной регрессии y = a+bt (пятью способами). Проверить на адекватность по 4 свойствам (критерии пиков, R/S-критерий, t-критерий, критерий Дарбина-Уотсона) и точность (среднюю относительную ошибку аппроксимации А, среднее квадратическое отклонение S, коэффициент и индекс корреляции r/p, коэффициент детерминации R2). Построить график линейной регрессии.
4. Найти параметры нелинейных регрессий (полинома 2 порядка, гиперболу y = a+b/x, показательную, степенную). Проверить их на адекватность и точность. Построить графики нелинейных регрессий.
5. Построить адаптивную модель Брауна. Проверить на адекватность и точность. Все исследования оформить в аналитической записке и выбрать наилучшую модель. Составить прогноз на 10 и 11 моменты времени.
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
y(t) |
11 |
16 |
18 |
22 |
28 |
30 |
36 |
38 |
43 |
Решение:
1. Построим график:
2. Проведем предварительный анализ:
Используем критерий Ирвина. Рассчитываем:
где уy - среднеквадратическое отклонение:
Среднее значение:
Находим среднеквадратическое отклонение
Таблица 2
Расчетная таблица
№ наблюдения |
Y(t) |
|||
1 |
11 |
252,46 |
||
2 |
16 |
118,57 |
0,459 |
|
3 |
18 |
79,01 |
0,183 |
|
4 |
22 |
23,90 |
0,367 |
|
5 |
28 |
1,23 |
0,550 |
|
6 |
30 |
9,68 |
0,183 |
|
7 |
36 |
83,01 |
0,550 |
|
8 |
38 |
123,46 |
0,183 |
|
9 |
43 |
259,57 |
0,459 |
|
Сумма |
242 |
950,89 |
Из таблицы 2 видно, что ни одно из значений лt не превышает критического значения 1,5, что свидетельствует об отсутствии аномальных наблюдений.
· проверим на наличие тренда методом Фостера-Стьюарта
Статистики критерия имеют вид
,
Где
если , то , в противном случае
если , то , в противном случае
Статистика используется для проверки тренда в дисперсиях, статистика -- для обнаружения тренда в средних.
При отсутствии тренда величины
и ,
где ,
имеют распределение Стьюдента с степенями свободы. Формулы для и применимы при , их значения при приведены в таблице.
Если , то с доверительной вероятностью нулевая гипотеза существования тренда принимается, в противном случае гипотеза отвергается. ( - -квантиль распределения Стьюдента).
Таблица 1
Вспомогательная таблица
t |
yt |
mt |
lt |
d |
S |
|
1 |
11 |
|||||
2 |
16 |
1 |
0 |
1 |
1 |
|
3 |
18 |
1 |
0 |
1 |
1 |
|
4 |
22 |
1 |
0 |
1 |
1 |
|
5 |
28 |
1 |
0 |
1 |
1 |
|
6 |
30 |
1 |
0 |
1 |
1 |
|
7 |
36 |
1 |
0 |
1 |
1 |
|
8 |
38 |
1 |
0 |
1 |
1 |
|
9 |
43 |
1 |
0 |
1 |
1 |
S = 8; D = 8
Так как , то, следовательно, гипотеза H0 принимается, тренд есть.
· сгладить уровни ряда методом простой скользящей средней
Трехточечная скользящая средняя:
Недостаток метода заключается в том, что уровни в начале и конце ряда определяются условно.
Для 3-х точек:
;
3. Найдем параметры линейной регрессии y = a+bt (пятью способами)
· С использованием мастера диаграмм:
· С использованием поиска решений:
Отведем под переменные а1 и а0 ячейки А16 и В16 соответственно, а в ячейку Е11 введем минимизируемую функцию:
= СУММ(E2:E10),
которая вычисляет сумму квадратов разностей для элементов указанных массивов.
Выберем команду Сервис, Поиск решения и заполним диалоговое окно Поиск решения. Отметим, что на переменные а1 и а0 ограничения не налагаются.
Рис. 1. Организация исходных данных в книге Excel для применения функции Поиск решений
В результате вычислений получены значения переменных:
а0 = 7,0556, а1 = 3,9666.
Линейную модель
· С использованием системы нормальных уравнений:
,
Таблица 2
Вспомогательная таблица
t |
y |
t2 |
ty |
|
1 |
11 |
1 |
11 |
|
2 |
16 |
4 |
32 |
|
3 |
18 |
9 |
54 |
|
4 |
22 |
16 |
88 |
|
5 |
28 |
25 |
140 |
|
6 |
30 |
36 |
180 |
|
7 |
36 |
49 |
252 |
|
8 |
38 |
64 |
304 |
|
9 |
43 |
81 |
387 |
|
45 |
242 |
285 |
1448 |
откуда находим a0 и a1:
a0 = 7,056
a1 = 3,967
Таким образом,
· С использованием матричных функций;
Матрица X:
1 |
1 |
|
1 |
2 |
|
1 |
3 |
|
1 |
4 |
|
1 |
5 |
|
1 |
6 |
|
1 |
7 |
|
1 |
8 |
|
1 |
9 |
= |
9 |
45 |
|
45 |
285 |
= |
0,527778 |
-0,08333 |
|
-0,08333 |
0,016667 |
= |
242 |
|
1448 |
7,056 |
||
3,967 |
Уравнение регрессии:
· С использованием функции ЛИНЕЙН:
· С использованием анализа данных - Регрессия:
Проверим на адекватность по 4 свойствам:
Критерии пиков
Случайность остаточной компоненты проверим по критерию поворотных точек.
Рис. 4 - График остатков
В нашем случае общее число поворотных точек в ряду остатков составляет p = 6. Критическое число поворотных точек для = 0,05 и n = 9 определяется по формуле
Так как p>q, остатки признаются случайными.
R/S-критерий
Оценка адекватности построенной модели по соответствию нормальному закону распределения осуществляется по RS-критерию:
emах = 1,178, emin = -0,956
Тогда
Расчетное значение RS-критерия не попадает в интервал между критическими границами, следовательно, не выполняется свойство нормальности распределения. Модель по этому критерию неадекватна.
t-критерий
Критическое значение
.
Поскольку < , то по t-критерию ошибки имеют нормальное распределение.
Критерий Дарбина-Уотсона
Оценка адекватности построенной модели по свойству независимости остаточной компоненты определяется по d-критерию Дарбина-Уотсона (проверяется наличие/отсутствие автокорреляции).
Таблица 3
Расчетная таблица
Y(t) |
||||||||
1 |
11 |
11,022 |
-0,022 |
0,000 |
||||
2 |
16 |
14,989 |
1,011 |
-0,022 |
1,033 |
1,068 |
1,022 |
|
3 |
18 |
18,956 |
-0,956 |
1,011 |
-1,967 |
3,868 |
0,913 |
|
4 |
22 |
22,922 |
-0,922 |
-0,956 |
0,033 |
0,001 |
0,850 |
|
5 |
28 |
26,889 |
1,111 |
-0,922 |
2,033 |
4,134 |
1,235 |
|
6 |
30 |
30,856 |
-0,856 |
1,111 |
-1,967 |
3,868 |
0,732 |
|
7 |
36 |
34,822 |
1,178 |
-0,856 |
2,033 |
4,134 |
1,387 |
|
8 |
38 |
38,789 |
-0,789 |
1,178 |
-1,967 |
3,868 |
0,622 |
|
9 |
43 |
42,756 |
0,244 |
-0,789 |
1,033 |
1,068 |
0,060 |
|
Сумма |
242 |
242,000 |
0,000 |
-0,244 |
0,267 |
22,009 |
6,822 |
Расчетное значение критерия сравнивается с нижним и верхним критическими значениями статистики Дарбина-Уотсона. При n = 9 и уровне значимости 5%, , , , .
Поскольку , то имеют отрицательную автокорреляцию.
Оценка точности модели
Определим среднюю ошибку аппроксимации по формуле:
Результаты расчета представлены в таблице.
Таблица 4
Расчетная таблица
Наблюдение |
|||||
1 |
11 |
-0,022 |
0,022 |
0,002 |
|
2 |
16 |
1,011 |
1,011 |
0,063 |
|
3 |
18 |
-0,956 |
0,956 |
0,053 |
|
4 |
22 |
-0,922 |
0,922 |
0,042 |
|
5 |
28 |
1,111 |
1,111 |
0,040 |
|
6 |
30 |
-0,856 |
0,856 |
0,029 |
|
7 |
36 |
1,178 |
1,178 |
0,033 |
|
8 |
38 |
-0,789 |
0,789 |
0,021 |
|
9 |
43 |
0,244 |
0,244 |
0,006 |
|
Сумма |
0,288 |
Средняя относительная ошибка построенной модели равна 3,195%, следовательно, модель имеет хороший уровень точности.
Среднее квадратическое отклонение S
Коэффициент и индекс корреляции r/p:
Коэффициент детерминации R2:
Построим график линейной регрессии.
4. Найдем параметры нелинейных регрессий
Полином 2 степени:
Критерии пиков
Случайность остаточной компоненты проверим по критерию поворотных точек.
Рис. 4 - График остатков
В нашем случае общее число поворотных точек в ряду остатков составляет p = 6.
Так как p>q, остатки признаются случайными.
R/S-критерий
0,919 |
||
emах = |
1,218 |
|
emin = |
-0,915 |
|
2,322 |
Расчетное значение RS-критерия не попадает в интервал между критическими границами, следовательно, не выполняется свойство нормальности распределения. Модель по этому критерию неадекватна.
t-критерий
Поскольку < , то по t-критерию ошибки имеют нормальное распределение.
Критерий Дарбина-Уотсона
Поскольку , то имеют отрицательную автокорреляцию.
Оценка точности модели
Средняя относительная ошибка построенной модели равна 3,24%, следовательно, модель имеет хороший уровень точности.
Среднее квадратическое отклонение S
Коэффициент и индекс корреляции r/p:
Коэффициент детерминации R2:
Построим график полинома второй степени.
Гипербола y = a+b/x
Критерии пиков
Случайность остаточной компоненты проверим по критерию поворотных точек.
В нашем случае общее число поворотных точек в ряду остатков составляет p = 1.
Так как p<q, остатки признаются неслучайными.
R/S-критерий
6,301 |
||
emах = |
9,771 |
|
emin = |
-8,296 |
|
2,867 |
Расчетное значение RS-критерия попадает в интервал между критическими границами, следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
t-критерий
Поскольку < , то по t-критерию ошибки имеют нормальное распределение.
Критерий Дарбина-Уотсона,
Поскольку , то имеем положительную автокорреляцию.
Оценка точности модели
Средняя относительная ошибка построенной модели равна 24,44%, следовательно, модель имеет плохой уровень точности.
Среднее квадратическое отклонение S
Коэффициент и индекс корреляции r/p:
Коэффициент детерминации R2:
Построим график гиперболы
ряд регрессия тренд среднеквадратичный
Показательная регрессия:
Критерии пиков
Случайность остаточной компоненты проверим по критерию поворотных точек.
В нашем случае общее число поворотных точек в ряду остатков составляет p = 5.
Так как p>q, остатки признаются случайными.
R/S-критерий
2,343 |
||
emах = |
3,282 |
|
emin = |
-4,331 |
|
3,250 |
Расчетное значение RS-критерия попадает в интервал между критическими границами, следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
t-критерий
Поскольку < , то по t-критерию ошибки имеют нормальное распределение.
Критерий Дарбина-Уотсона
Поскольку , то имеем положительную автокорреляцию.
Оценка точности модели
Средняя относительная ошибка построенной модели равна 7,05%, следовательно, модель имеет хороший уровень точности.
Среднее квадратическое отклонение S
Коэффициент и индекс корреляции r/p:
Коэффициент детерминации R2
Построим график показательного тренда
Степенная регрессия
Критерии пиков
Случайность остаточной компоненты проверим по критерию поворотных точек.
В нашем случае общее число поворотных точек в ряду остатков составляет p = 5.
Так как p>q, остатки признаются случайными.
R/S-критерий
1,729 |
||
emах = |
2,943 |
|
emin = |
-2,201 |
|
2,975 |
Расчетное значение RS-критерия попадает в интервал между критическими границами, следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
t-критерий
Поскольку < , то по t-критерию ошибки имеют нормальное распределение.
Критерий Дарбина-Уотсона
Поскольку попадает в зоне неопределенности, то нельзя сделать выводов об автокорреляции.
Оценка точности модели
Средняя относительная ошибка построенной модели равна 5,52%, следовательно, модель имеет хороший уровень точности.
Среднее квадратическое отклонение S
Коэффициент и индекс корреляции r/p:
Коэффициент детерминации R2
Построим график степенного тренда
5. Построим адаптивную модель Брауна
Модель Брауна строится в несколько этапов.
1) По первым пяти точкам временного ряда методом наименьших квадратов оцениваем параметры а0 и а1 линейной модели
Получаем начальные значения параметров модели Брауна
a0(0) = a0 = 7; a1(0) = a1 = 4
которые соответствуют моменту времени t = 0 (определены с помощью функций EXCEL «ОТРЕЗОК» и «НАКЛОН» соответственно.
2) Находим прогноз на первый шаг (t = 1):
3) Определяем величину отклонения расчетного значения от фактического:
4) Скорректируем параметры модели для параметра сглаживания б = 0,4 (в = 1-0,4 = 0,6). Получим:
5) По модели со скорректированными параметрами a0(t) и a1(t) находим прогноз на следующий момент времени:
Для t = 2:
6) Возвращаемся к пункту 3 и повторяем вычисления до конца временного ряда.
Таблица 7
Расчет по модели Брауна при б = 0,4 в = 0,6
t |
a0 |
a1 |
|||||
1 |
11 |
7,0 |
4,0 |
11,0 |
0,0 |
0,0 |
|
2 |
16 |
11,0 |
4,0 |
15,0 |
1,0 |
0,1 |
|
3 |
18 |
15,6 |
4,6 |
20,3 |
-2,3 |
0,1 |
|
4 |
22 |
18,8 |
3,2 |
22,0 |
0,0 |
0,0 |
|
5 |
28 |
22,0 |
3,2 |
25,2 |
2,8 |
0,1 |
|
6 |
30 |
27,0 |
5,0 |
32,0 |
-2,0 |
0,1 |
|
7 |
36 |
30,7 |
3,7 |
34,4 |
1,6 |
0,0 |
|
8 |
38 |
35,4 |
4,7 |
40,2 |
-2,2 |
0,1 |
|
9 |
43 |
38,8 |
3,3 |
42,1 |
0,9 |
0,0 |
|
Сумма |
0,5 |
7) Вычислим среднюю относительную ошибку для данного параметра сглаживания:
Оценка адекватность модели
Проверка равенства математического ожидания остаточной последовательности нулю. Вычислим среднее значение ряда остатков.
Так как , то модель содержит постоянной систематической ошибки и не адекватна по критерию нулевого среднего.
Случайность остаточной компоненты проверим по критерию поворотных точек.
Рис. 5 - График остатков
В нашем случае общее число поворотных точек в ряду остатков составляет p = 6
Критическое число поворотных точек для = 0,05 и n = 9 определяется по формуле
Так как p>q, остатки признаются случайными.
Оценка адекватности построенной модели по свойству независимости остаточной компоненты определяется по d-критерию Дарбина-Уотсона (проверяется наличие/отсутствие автокорреляции).
Таблица 7
Расчетная таблица
Y(t) |
||||||||
1 |
11 |
11,0 |
0,0 |
0,0 |
||||
2 |
16 |
15,0 |
1,0 |
0,0 |
1,0 |
1,0 |
1,0 |
|
3 |
18 |
20,3 |
-2,3 |
1,0 |
-3,3 |
10,8 |
5,2 |
|
4 |
22 |
22,0 |
0,0 |
-2,3 |
2,3 |
5,2 |
0,0 |
|
5 |
28 |
25,2 |
2,8 |
0,0 |
2,8 |
8,0 |
8,0 |
|
6 |
30 |
32,0 |
-2,0 |
2,8 |
-4,8 |
22,9 |
3,9 |
|
7 |
36 |
34,4 |
1,6 |
-2,0 |
3,5 |
12,5 |
2,5 |
|
8 |
38 |
40,2 |
-2,2 |
1,6 |
-3,7 |
13,9 |
4,7 |
|
9 |
43 |
42,1 |
0,9 |
-2,2 |
3,0 |
9,3 |
0,8 |
|
Сумма |
242 |
242,1 |
-0,1 |
-1,0 |
0,9 |
83,5 |
25,9 |
Расчетное значение критерия сравнивается с нижним и верхним критическими значениями статистики Дарбина-Уотсона. При n = 9 и уровне значимости 5%, , , , .
Поскольку , то не принимается нулевая гипотеза о равенстве нулю серийных корреляций и делается вывод о присутствии в остатках отрицательной автокорреляции.
Оценка адекватности построенной модели по соответствию нормальному закону распределения осуществляется по RS-критерию:
emах = 2,8, emin = -2,3.
Тогда
Расчетное значение RS-критерия попадает в интервал между критическими границами, следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
5. Лучшей по всем параметрам является линейная регрессия, поскольку она обладает наименьшей средней ошибкой аппроксимации, средним квадратическим отклонением ошибки, а также имеет наибольшее значение индекса корреляции и коэффициента детерминации.
В течение первой недели (k = 1, t = 10) спрос будет равен
Y(10) = = 46,72.
В течение второй недели (k = 2, t = 11) спрос будет равен
Y(11) = = 50,69.