Контрольная работа 1
Вариант 10
Часть 1.
Задание:
1. Какую линейную регрессионную модель называют адекватной? Сформулируйте правило проверки адекватности модели
Ответ:
При большом числе факторов иногда структуру линейной регрессионной модели выбирают исходя из сущности изучаемого явления. Однако часто модель не удаётся построить исходя из сущности явления, в этом случае используют полином, степень которого определяется в ходе проверки: хорошо ли предсказанные моделью значения отклика совпадают с результатами наблюдений за моделируемым объектом. Проверка выполнения этого условия называется проверкой адекватности модели. А линейная регрессионная модель, прошедшая такую проверку называется адекватной.
Для проверки адекватности модели часто используют критерий, который называется F-критерием Фишера и определяется следующей формулой:
,
где - остаточная дисперсия, - независимая оценка, которую можно получить следующим образом: в факторном пространстве выбрать одну точку и провести в ней несколько независимых опытов, результаты которых не использовать при оценивании регрессионных коэффициентов, а применять только при вычислении .
Удобство использования критерия Фишера состоит в том, что проверку гипотезы можно свести к сравнению с табличным значением. Если рассчитанное значение F-критерия не превышает табличного, то, с соответствующей доверительной вероятностью, модель можно считать адекватной. При превышении табличного значения эту приятную гипотезу приходится отвергать.
Задание:
2. Проведены равноточные измерения некоторой величины У через равные интервалы аргумента Х. Считая, что зависимость между Х и У имеет вид , выполните следующее: Проверьте значимость коэффициентов ?1 ?2 на уровне значимости ?=0,01
Решение:
Для начала найдём коэффициенты регрессионной модели. Для этого сформируем матрицу регрессоров F и столбец откликов
, .
Найдем информационную матрицу G по формуле: . Для этого определим матрицу :
.
Теперь найдём матрицу G:
.
Определим матрицу Z, вычисляемую по формуле:
.
.
Матрица С, равная: . Это матрица обратная матрице G, найдем C:
.
Определим МНК оценки коэффициентов регрессионной модели по следующей формуле: .
.
Таким образом, имеем регрессионную модель вида:
.
Теперь вычисляем оценку дисперсии случайной ошибки по формуле:
.
Количество степеней свободы .
Проверим гипотезу о значимости коэффициента , для этого определим величину t по следующей формуле:
.
Теперь сравниваем с табличным значением при уровне значимости , и количестве степеней свободы :
, .
Коэффициент значим.
Проверим гипотезу о значимости коэффициента , для этого определим величину t по следующей формуле:
.
Теперь сравниваем с табличным значением при уровне значимости , и количестве степеней свободы :
, .
Коэффициент незначим.
Ответ:
Коэффициент значим, коэффициент незначим.
Задание:
1. Какими свойствами обладает множественный коэффициент корреляции?
Ответ:
Множественный коэффициент корреляции - это мера линейной зависимости между одной случайной величиной и некоторой совокупностью случайных величин.
1) Множественный коэффициент корреляции определяется по формуле
,
где - определитель корреляционной матрицы; - алгебраическое дополнение ii-го элемента.
2) Он изменяется в пределах от 0 до 1: .
3) Если - корреляция отсутствует (данные факторы между собой нейтральны);
4) Если - между случайными величинами наблюдается функциональная зависимость.
Задание:
2. По результатам десяти наблюдений, заданным таблицей найдите:
Значения оценки коэффициента детерминации.
Решение:
Коэффициент детерминации определяется по формуле:
.
Для начала определим математический ожидания и дисперсии для случайных величин
;
;
;
;
;
.
Теперь найдём ковариации случайных величин
,
,
.
По полученным характеристикам случайных величин определим коэффициенты корреляции
;
;
Ответ:
Коэффициент детерминации .
Задание:
В табл. представлены результаты наблюдений над откликом X на пяти уровнях фактора А и трех уровнях фактора В. На уровне значимости ? = 0,05 проверьте гипотезу: -- фактор А не оказывает влияния на отклик.
Решение:
Сформулируем гипотезы для фактора A:
: фактор A не оказывает влияния на отклик;
: фактор A оказывает влияние на отклик.
Сделаем предварительные расчёты сумм по факторам и общей суммы.
Уровни фактора B(j) |
Уровни фактора A(i) |
Суммы по фактору B |
|||||
1 |
2 |
3 |
4 |
5 |
|||
1 2 3 |
3 8 6 |
3 3 6 |
6 7 8 |
6 6 7 |
8 3 8 |
26 27 35 |
|
Суммы по фактору A |
17 |
12 |
21 |
19 |
19 |
88 |
Посчитаем - вариативность признака, обусловленную действием фактора A по формуле
,
где Ti - сумма индивидуальных значений по каждому уровню фактора A; - квадрат общей суммы индивидуальных значений.
Аналогично посчитаем вариативность признака, обусловленную действием фактора B
регрессионный корреляция детерминация
.
Подсчитаем - общую вариативность признака по формуле:
.
Подсчитаем случайную (остаточную) величину , обусловленную неучтенными факторами по формуле:
.
Число степеней свободы равно:
.
«Средний квадрат» или математическое ожидание суммы квадратов, усредненная величина суммы квадратов фактора A равна:
Значение статистики критерия Fэмп рассчитаем по формуле:
.
Определим Fкрит по статистическим таблицам для kA=4 и kсл =8 и = 0,05 Fкрит=3,84.
Fэмп < Fкрит (1,11<3,84), следовательно принимается нулевая гипотеза .
Ответ:
Гипотеза верна.