46
МОДЕЛИРОВАНИЕ ЭКОСИСТЕМ
ВВЕДЕНИЕ
Эффективность ведения современного лесного хозяйства определяется полнотой научных сведений, как о естественном формировании лесных фитоценозов, так и под воздействием хозяйственных мероприятий. Достоверность этих сведений оценивается путем статистической обработки цифрового материала, полученного в результате целенаправленно спланированного эксперимента и последующей производственной проверки.
Каждый из существующих статистических методов имеет свои возможности и ограниченную область применения, продиктованную спецификой эксперимента. При этом все они служат экспериментатору средством выявления закономерностей, позволяющих сделать выводы и заключения в условиях неопределенности. Достоверно полученные результаты наблюдений, представление выявленных закономерностей в виде статистических моделей следует рассматривать в практическом приложении в качестве основы применения количественных методов моделирования и оптимизации экономических, технологических и других процессов, и явлений.
Постановка задачи
Результаты наблюдения над лесохозяйственными объектами обычно фиксируются в журналах, бланках, анкетах и других документах учета или заносятся непосредственно в соответствующие файлы портативных компьютеров. Зафиксированные сведения об изучаемом объекте представляют первичный фактический материал, который нуждается в соответствующей обработке с целью исследования генеральной совокупности. На практике инженер лесного хозяйства имеет дело только с выборочной совокупностью (выборкой), т.е. частью генеральной совокупности, поэтому возникает потребность по результатам сравнительно небольшой выборки сделать предположение о поведении всей генеральной совокупности. В других случаях необходимо какой-либо совокупности величин поставить в соответствие другую совокупность и выяснить, имеется ли между ними различие, какая-нибудь взаимосвязь или нет.
Для того чтобы сделать статистическое заключение о рассматриваемом объекте, следует выполнить ряд взаимосвязанных операций:
1. Грамотно обеспечить отбор единиц выборочной совокупности;
2. Систематизировать и сгруппировать результаты наблюдений;
3. Графически представить эмпирические совокупности;
4. Получить статистические показатели для эмпирических совокупностей;
5. Получить статистические параметры для генеральной совокупности.
Единицы выборочной совокупности (варианты) должны быть отобраны так, чтобы по ним с достаточной точностью можно было судить о свойствах генеральной совокупности. Зачастую в исследованиях проводится отбор так называемых «типичных» представителей генеральной совокупности. Такой подход субъективен и не может служить основой получения качественной информации. Заданная точность в характеристике генеральной совокупности обеспечивается случайным отбором необходимого количества вариант.
Классификация и группировка вариант
Статистическая обработка первичных данных начинается с расположения вариант в определенной последовательности, зависящей от характера варьирования изучаемого признака:
1. Количественное:
· непрерывное;
· дискретное.
2. Качественное:
· атрибутивное.
При непрерывном варьировании отдельные значения признака могут иметь любое значение меры (протяженности, объема, веса и т. д.) в определенных пределах. Например, толщина деревьев в древостое принимает различные значения меры протяженности до самого толстого.
При дискретном варьировании отдельные значения признака выражаются отвлеченными числами (чаще всего целыми). Например, число деревьев на пробной площади, диаметр деревьев в ступенях (классах) толщины и т. д.
При атрибутивном варьировании значения признака классифицируют по градациям этого признака. Например, цвет, повреждаемость, класс бонитета и т. д.
При качественном варьировании первоначальное упорядочивание совокупности проводят в порядке возрастания или убывания. При малом числе вариант (до 30) строится непосредственный ряд значений.
При большом объеме выборки (n > 30) ранжированный ряд не обладает свойством наглядности. Поэтому значение признака размещают с указанием числа их повторяемости в виде двойного ряда. В первой строке (столбце) заносят значение признака, а во второй строке (столбце) указывают число повторяющихся значений.
Размещение значений признака в порядке их возрастания (убывания) с указанием числа их повторяемости называют вариационным рядом. В вариационном ряду значения признака, разнесенные по классам, называют распределением частот. Очевидно, что сумма частот равна объему выборки n. Величина классового промежутка, на которую разбивается ряд варьирующих значений признака, определяется по формуле:
C = X max - X min / i ,
где X max и X min - максимальное и минимальное значение признака; i - число классовых промежутков.
Число классовых промежутков зависит от объема выборки и ориентировочно равно корню квадратному из числа наблюдений, т. е. i = v n .
Задание 1. Расчет статистических показателей для малой выборочной совокупности
Изучаемый признак - объем деревьев (м3).
Данные замеров объема приведены в таблице 1
Таблица 1
Данные для статистической обработки малой выборочной совокупности
0,64 |
1,20 |
1,28 |
0,88 |
1,08 |
|
1,06 |
0,79 |
1,82 |
0,65 |
0,34 |
|
0,86 |
1,26 |
1,05 |
2,06 |
0,70 |
|
0,89 |
0,83 |
0,99 |
0,64 |
0,26 (Xmin) |
|
1,02 |
0,41 |
0,96 |
0,89 |
0,74 |
|
0,59 |
1,23 |
1,41 |
0,56 |
0,39 |
1. Находим среднюю величину распределения по формуле:
Xср = ? Чi / n,
где n - объем выборочной совокупности равный 30. Подставляя данные из таблицы в формулу, получим:
Xср = 27,48 / 30 = 0,916 м 3.
2. Определим сумму квадратов отклонений (СКО) каждой варианты от средней величины по формуле:
СКО = ?(Xi - Xср)2.
Предварительно определив все квадраты отклонения, находим их сумму:
СКО = 0,430336 + 0,331776 + 0,276676 + 0,256036 + 0,126736 + 0,106276 + 0,076176 + 0,076176 + 0,070756 + 0,046656 + 0,030976 + 0,015876 + 0,007396 + 0,003136 + 0,001296 + 0,000676 + 0,000676 + 0,001936 + 0,005476 + 0,010816 + 0,017956 + 0,020736 + 0,026896 + 0,080656 + 0,098596 + 0,118336 + 0,132496 + 0,244036 + 0,817216 + 1,308736 = 4,74152 м 6.
3. Находим дисперсию, характеризующую степень разнообразия объекта, используя формулу: д 2 = СКО / n.
Отсюда д 2 = 4,74152 / 30 = 0,1581 м 6 .
4. Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения: д = v д 2 .
Тогда д = v 0,1581 = 0,3976 = 0,4 м 3.
5. Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как Cv = д • 100%/ Xср.
Имеем Cv = 0,4 / 0,916 • 100 = 43,67 %.
По шкале Мамаева для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий (таблица 2).
6. Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как Vд = д • 100 % / (Xср - Xmin),
где Xmin = 0,26 м3.
Тогда Vд = 0,4 • 100 / (0,916 - 0,26) = 40 / 0,656 = 60,98 %.
Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень большая.
Таблица 2
Шкала Мамаева для установления уровня изменчивости признака
Величина коэффициента вариации, % |
Уровень изменчивости |
|
до 7 |
очень низкий |
|
7 - 15 |
Низкий |
|
16 - 25 |
Средний |
|
26 - 35 |
Повышенный |
|
36 - 50 |
Высокий |
|
более 50 |
очень высокий |
Таблица 3
Классификация степени дифференциации признака
Величина коэффициента дифференциации, % |
Степень дифференциации |
|
до 13 |
Слабая |
|
13 - 27 |
Умеренная |
|
28 - 38 |
Средняя |
|
39 - 53 |
Значительная |
|
54 - 70 |
Большая |
|
более 70 |
очень большая |
7. Расчет ошибок репрезентативности.
Ошибка средней величины вычисляется по формуле:
m x = + д / vn .
В нашем случае: mx = + 0,4 / v30 =+ 0,073 м 3.
Ошибка стандартного отклонения: m д = + д / v2n .
Значит m д = + 0,4 / v2 • 30 = + 0,052 м 3.
Ошибка коэффициента вариации:
m c = + Cv / vn • v0,5 + (Cv/100)2.
Тогда mc=+43,67/5,48 • v0,5 + (43,67/100) 2=+ 7,97 • 0,831 =+ 6,623 %.
Ошибка точности: m p = + m c / vn .
Отсюда m p = + 6,623 / 5,48 = + 1,21 %.
8. Находим точность определения средней величины
p = + (m x / Xср) • 100 %.
Отсюда p = + (0,073 / 0,916) • 100 = + 7,97 %.
Данный показатель позволяет сделать заключение о достоверности эмпирических данных для получения достоверных результатов.
9. Достоверность статистических показателей (надежность)
Достоверность - отношение величины статистического показателя к его ошибке репрезентативности. Это отношение должно быть ? 3, определяется по t - критерию.
Достоверность средней величины: tx = Xср / mx .
Значит tx = 0,916 / 0,073 = 12,55.
Достоверность стандартного отклонения: tд = д / mд .
Тогда tд = 0,4 / 0, 052 = 7,69.
Достоверность коэффициента вариации: tc = Cv / mc .
Имеем tc = 43,67 / 6,623 = 6,59.
Достоверность точности: tp = p / mp .
Получаем tp = 7,97 / 1,21 = 6,587.
Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях
10. Доверительный интервал для генеральной средней
ДИГС - интервал нахождения средней величины для всей генеральной совокупности.
ДИГС = Xср + mx • t0,5 ,
где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение).
Число степеней свободы - число свободно варьирующих вариант (v)
v = n - 1 = 30 - 1 =29 t0,5 = 2,045
Находим ДИГС = 0,916 + 0,073 • 2,045; ДИГС 0,767 ? 1,065 м 3.
Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры.
11. Необходимое число наблюдений для будущих исследований
n = ((Cv • K)/p)2,
где Cv - расчетный коэффициент вариации;
p - заданная точность (3 %);
К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) .
n1 = (43,67 • 1 / 3)2 = 212 шт.
n2 = (43,67 • 1,98 / 3)2 = 831 шт.
n3 = (43,67 • 2,63 / 3)2 = 1466 шт.
Статистическое заключение
В результате анализа малой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности:
- средняя величина 0,916 + 0,073 м 3;
- стандартное отклонение 0,4 + 0,052 м 3;
- коэффициент вариации 43,67 + 6,623 %, которому по шкале Мамаева соответствует высокий уровень изменчивости;
- коэффициент дифференциации 60,98 %, которому по классификации соответствует большая степень дифференциации.
Точность определения средней величины 7,97 + 1,21 %.
Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях.
Доверительный интервал генеральной средней 0,767 - 1,065 м 3.
Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 43,67 % и трех пороговых уровнях доверительной вероятности следующее:
- для первого порогового уровня 212 штук;
- для второго порогового уровня 831 штука;
- для третьего порогового уровня 1466 штук.
Задание 2. Расчет статистических показателей для большой выборочной совокупности
Изучаемый признак - диаметр деревьев, см.
Данные для статистической обработки большой выборочной совокупности приведены в таблице 4.
Таблица 4.
Данные для статистической обработки большой выборочной совокупности
Ступени толщины, см |
||||||||||
4 |
8 |
12 |
16 |
20 |
24 |
28 |
32 |
36 |
40 |
Для построения вариационного ряда выполняем следующие расчеты:
1. Выбираем Xmin и Xmax Xmin = 4 см; Xmax = 40 см.
Устанавливаем размах варьирования:
Xmax - Xmin = 40 - 4 = 36 см.
2. Определяем классовый интервал:
С = (Xmax - Xmin) / i,
где Xmin - минимальное значение варианты; Xmax - максимальное значение варианты; i
- количество классов, i = v n , где n - объем выборочной совокупности.
Применяя формулу Стерджеса,
C = Xmax - Xmin / 1 + 3,32 ln n =( Xmax - Xmin)/ i,
где i = v n , при n = 100 i = v100 = 10.
Тогда C = 40 - 4 / 10 = 3,6 см. Принимаем С = 4.
3. Устанавливаем границы классов
Нижняя граница
Xmin - С/2 = 4 - 4 / 2 = 2 см.
Верхняя граница
Xmin + C/2 = 4 + 4/2 = 6 см.
Вычисленные границы классов представлены в таблице 5.
Таблица 5.
Границы классов
Классы |
Границы классов |
|
I |
2,0 - 6,0 |
|
II |
6,1 - 10,0 |
|
III |
10,1 - 14,0 |
|
IV |
14,1 - 18,0 |
|
V |
18,1 - 22,0 |
|
VI |
22,1 - 26,0 |
|
VII |
26,1 - 30,0 |
|
VIII |
30,1 - 34,0 |
|
IX |
34,1 - 38,0 |
|
X |
38,1 - 42,0 |
После установления границ классов можно приступить к схематическому изображению вариационного ряда.
Схематическое изображение вариационного ряда
Классы I II III IV V VI VII VIII IX X
Границы 2 - 6 - 10 - 14 - 18 - 22 - 26 - 30 - 34 - 38 - 42 Классов
46
Частота, шт. 8 19 32 47 50 61 46 19 15 7
Накопленная 8 27 59 106 156 217 263 282 297 304
частота, шт.
Группировка данных, расчет средней величины и суммы квадратов отклонений
Границы классов, |
Частота F, |
Группов. варианта |
По исходным данным |
По преобразованным Данным |
||||||
см. |
шт. |
X I, см |
F • X i |
X2i |
F • X2i |
X1=(Xi- A)/C |
F • X1 |
X12 |
F • X21 |
|
|
|
|
|
A =24 |
|
|
|
|||
2,0 - 6,0 |
8 |
4 |
32 |
16 |
128 |
-5 |
-40 |
25 |
200 |
|
6,1 -10,0 |
19 |
8 |
152 |
64 |
1216 |
-4 |
-76 |
16 |
304 |
|
10,1 14,0 |
32 |
12 |
384 |
144 |
4608 |
-3 |
-96 |
9 |
288 |
|
14,1 - 18,0 |
47 |
16 |
752 |
256 |
12032 |
-2 |
-94 |
4 |
188 |
|
18,1 - 22,0 |
50 |
20 |
1000 |
400 |
20000 |
-1 |
-50 |
1 |
50 |
|
22,1 - 26,0 |
61 |
24 |
1464 |
576 |
35136 |
0 |
0 |
0 |
0 |
|
26,1 - 30,0 |
46 |
28 |
1288 |
784 |
36064 |
1 |
46 |
1 |
46 |
|
30,1 - 34,0 |
19 |
32 |
608 |
1024 |
19456 |
2 |
38 |
4 |
76 |
|
34,1 - 38,0 |
15 |
36 |
540 |
1296 |
19440 |
3 |
45 |
9 |
135 |
|
38,1 - 42,0 |
7 |
40 |
280 |
1600 |
11200 |
4 |
28 |
16 |
112 |
|
|
?F = n |
?X i |
?(F •Xi) |
|
?(F * X2й ) |
|
?(F •X1) |
|
?(F •X12) |
|
|
304 |
220 |
6500 |
|
159280 |
|
-199 |
|
1399 |
I 1) Средняя величина
Xср = ? F • X I / n,
где Xi - групповая варианта.
Значит Xср = 6500 / 304 = 21,38 см.
2) Сумма квадратов отклонений
СКО = ?(F • Xi2) - (?(F • X i))2 / n.
Тогда СКО = 159280 - 42250000 / 304 = 159280 - 138980 = 20300 см 2.
II 1) Средняя величина
Xср = A + (?(F * Xй) / n) • C.
Отсюда Xср = 24 + (- 199 / 304) • 4 = 24 + (- 0,6546) • 4 = 24 - 2,6184 = 21,38 см.
Xср1 = Xср2 = 21,38 см. X1 = Xi - A / C.
2) Сумма квадратов отклонений
СКО = ( ?(F • X12) - (?(F • Xй ) 2 / n ) • C2 .
Отсюда получаем СКО = (1399 - (39601 / 304 )) • 16 = (1399 - 130,2664) • 16 = 20299,74 = 20300 см 2.
3) Дисперсия
д 2 = СКО / n - 1.
Находим д 2 = 20300 / 303 = 66,78 см 2.
4) Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения:
д = v д 2 .
Тогда д = v 66,78 = 8,172 см.
5) Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как
Cv = д • 100%/ Xср.
Имеем Cv = 8,172 / 21,38 • 100 = 38,22 %.
По шкале Мамаева (см. таблица 2) для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий.
6) Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как
Vд = д • 100 % / (Xср - X0) + C/2,
где X0 - значение первого класса ряда распределения. В нашем случае X0 = 2 см.
Тогда Vд = 8,172 • 100 / (21,38 - 2) + 2 = 44, 17 %.
Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень значительная, т.к. ее коэффициент находится в интервале 39 - 53 %.
7) Расчет ошибок репрезентативности.
Ошибка средней величины вычисляется по формуле:
m x = + д / vn .
В нашем случае: mx = + 8,172 / v304 =+ 8,172 / 17,44 =+ 0,47 см.
Ошибка стандартного отклонения:
m д = + д / v2n .
Значит m д = + 8,172 / v2 • 304 = + 8,172 / 24,66 =+ 0,331 см.
Ошибка коэффициента вариации:
m c = + Cv / vn • v0,5 + (Cv/100)2.
Тогда m c = + 38,22 / 17,44 • v0,5 + (38,22/100) 2 = + 2,192 • 0,804 =+ 1,762 %.
Ошибка точности:
m p = + m c / vn .
Отсюда m p = + 1,762 / 17,44 = + 0,101 %.
8) Находим точность определения средней величины
p = + (m x / Xср) • 100 %.
Отсюда p = + (0,47 / 21,38) • 100 = + 2,2 %.
Данный показатель позволяет сделать заключение о достоверности эмпирических данных для получения достоверных результатов.
9) Достоверность статистических показателей (надежность)
Достоверность - отношение величины статистического показателя к его ошибке репрезентативности. Это отношение должно быть ? 3, определяется по t - критерию.
Достоверность средней величины: tx = Xср / mx .
Значит tx = 21,38 / 0,47 = 45,49.
Достоверность стандартного отклонения: tд = д / mд .
Тогда tд = 8,172 / 0,331 = 24,69.
Достоверность коэффициента вариации: tc = Cv / mc .
Имеем tc = 38,22 / 1,762 = 21,69.
Достоверность точности: tp = p / mp .
Получаем tp = 2,2 / 0,101 = 21,78.
Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях
10) Доверительный интервал для генеральной средней
ДИГС - интервал нахождения средней величины для всей генеральной совокупности.
ДИГС = Xср + mx • t0,5 ,
где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение).
Число степеней свободы - число свободно варьирующих вариант (v)
v = n - 1 = 304 - 1 =303 t0,5 = 1,96
Находим ДИГС = 21,38 + 0,47 • 1,96 = 21,38 + 0,92; ДИГС 20,46 ? 22,3 см.
Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры. В нашем случае интервал несколько завышен.
11) Необходимое число наблюдений для будущих исследований
n = ((Cv • K)/p)2,
где Cv - расчетный коэффициент вариации;
p - заданная точность (3 %);
К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) .
n1 = (38,22 • 1 / 3)2 = 162 штуки.
n2 = (38,22 • 1,98 / 3)2 = 636 штук.
n3 = (38,22 • 2,63 / 3)2 = 1123 штуки.
Статистическое заключение
В результате анализа большой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности:
- средняя величина 21,38 + 0,47 см;
- стандартное отклонение 8,172 + 0,331 см;
- коэффициент вариации 38,22 + 1,762 %, которому по шкале Мамаева соответствует повышенный уровень изменчивости;
- коэффициент дифференциации 44,17 %, которому по классификации соответствует значительная степень дифференциации.
Точность определения средней величины 2,2 + 0,101 %.
Доверительный интервал генеральной средней 20,46 - 22,3 см.
Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 38,22 % и трех пороговых уровнях доверительной вероятности следующее:
- для первого порогового уровня 162 штуки;
- для второго порогового уровня 636 штук;
- для третьего порогового уровня 1123 штук.
Графическое представление вариационного ряда
После того как произведена группировка совокупности по классам, характер распределения более или менее проясняется. Однако более наглядное представление этого распределения дает графическое изображение.
Графическое представление вариационного ряда с использованием Microsoft Excel
Задание 3. Расчет среднеквадратических ошибок
При проведении полевого и других опытов проявляются три вида ошибок. Ошибка - это расхождение между различными значениями выборочной совокупности или отдельных наблюдений от истинных значений измеряемых величин.
Основные свойства ошибок и причины их возникновения
Случайные (среднеквадратические ошибки) - это ошибки, возникающие под воздействием факторов, действие которых не значительно и их нельзя выделить и учесть отдельно. Случайные ошибки в полевом опыте неизбежны. Математическая статистика дает методы их определения.
Систематические - искажают измеряемую величину в сторону преувеличения или преуменьшения в результате действия вполне определенной постоянной причины. Исключить действие этой причины можно путем применения правильной методики.
Случайные ошибки имеют знак +. Они взаимопогашаются, а систематические нет.
Грубые (промахи) - возникают в результате нарушения основных требований полевого опыта. Грубые ошибки не погашаются, а результат бракуется.
Для математической обработки подходят лишь результаты наблюдений без систематических и грубых ошибок.
Таблица 6.
Расчет среднеквадратических ошибок.
Запас, м3 / га |
Откло- нение |
Откло- нение с поправкой |
Квадрат отклонений с поправкой |
Расчет ошибок |
||
Факти- ческий |
Глазомерный такс. № 1 |
|||||
230 |
180 |
- 19,41 |
- 19,36 |
374,81 |
Систематическая ошибка: Д = + Уоткл / n = = - 9,16 / 13 = 0,71 % Поправка: Д' = + Д / n = = 0,71 / 13 = 0,05 % Случайная ошибка: у = + (vСКО / n - 1) / vn = = + 13,68 / 3,61 = + 3,79 % Ошибка для всех случаев: m у = + у / v n = = + 3,79 / 3,61 = + 1,05 % |
|
210 |
240 |
14,27 |
14,22 |
202,21 |
||
220 |
200 |
- 9,52 |
- 9,47 |
89,68 |
||
240 |
270 |
13,21 |
13,16 |
173,19 |
||
260 |
220 |
- 10,33 |
- 10,28 |
105,68 |
||
310 |
340 |
12,64 |
12,59 |
158,51 |
||
300 |
270 |
- 11,08 |
- 11,03 |
121,66 |
||
320 |
350 |
13,19 |
13,14 |
172,66 |
||
350 |
320 |
- 13,78 |
- 13,73 |
188,51 |
||
360 |
400 |
15,26 |
15,21 |
231,34 |
||
370 |
350 |
- 8,01 |
- 7,96 |
63,36 |
||
380 |
410 |
10,43 |
10,38 |
107,74 |
||
440 |
400 |
- 16,03 |
- 15,98 |
255,36 |
||
N = 13 |
?откл -9,16 |
СКО 2244,71 |
Таблица 7
Запас, м3 / га |
Откло- нение |
Откло- нение с поправкой |
Квадрат отклонений с поправкой |
Расчет ошибок |
||
Факти- ческий |
Глазомерный такс. № 2 |
|||||
230 |
220 |
- 4,76 |
- 4,713 |
22,212 |
Систематическая ошибка: Д = + Уоткл / n = = 8,02 / 13 = 0,617 % Поправка: Д' = + Д / n = = 0,617 / 13 = 0,047 % Случайная ошибка: у = + (vСКО / n - 1) / vn = = + 7,73 / 3,61 = + 2,141 % Ошибка для всех случаев: m у = + у / v n = = + 2,141 / 3,61 = + 0,593 % |
|
210 |
220 |
4,68 |
4,633 |
21,465 |
||
220 |
210 |
- 3,96 |
- 3,913 |
15,312 |
||
240 |
250 |
4,13 |
4,083 |
16,671 |
||
260 |
240 |
- 8,87 |
- 8,823 |
77,845 |
||
310 |
360 |
15,19 |
15,143 |
229,310 |
||
300 |
290 |
- 4,62 |
- 4,573 |
20,912 |
||
320 |
360 |
10,53 |
10,483 |
109,893 |
||
350 |
330 |
- 8,08 |
- 8,033 |
64,529 |
||
360 |
390 |
9,39 |
9,343 |
87,292 |
||
380 |
370 |
- 5,00 |
- 4,953 |
24,532 |
||
370 |
380 |
3,45 |
3,403 |
11,580 |
||
400 |
390 |
- 4,06 |
- 4,013 |
16,104 |
||
N = 13 |
?откл 8,02 |
СКО 717,657 |
Статистическое заключение
Второй таксатор определил запас древесины глазомерным способом точнее, так как его ошибка для всех случаев меньше чем у первого таксатора.
Задание 4. Расчет теоретических частот для кривой нормального распределения
Расчет теоретических частот эмпирического ряда производим следующим образом:
1. Находим значение функции плотности вероятности нормального распределения через величину нормированного отклонения по приложению учебника.
2. Вычисляем теоретические частоты ряда распределения n` по соответствующим данным объема выборки при величине классового промежутка по формуле:
n` = (nC / д) • f(x),
где n - объем выборки; C - классовый интервал; д - стандартное отклонение; f(x) - плотность вероятности.
Таблица 8
Вычисление выравнивающих частот по уравнению Лапласа - Гаусса
Классы X, см |
Эмпирические частоты, шт. |
Отклонение ¦X i - X ср¦= = Д X Xср = 21,38 |
Нормирован. отклонение t = ДX / д д = 8,172 см |
Плотность вероятнос. нормальн. распредел. |
Теоретическая частота n`, шт. |
||
фактич. |
округл. |
||||||
4 |
8 |
17,38 |
2,126774 |
0,0413 |
6,145 |
6 |
|
8 |
19 |
13,38 |
1,637298 |
0,1040 |
15,475 |
15 |
|
12 |
32 |
9,38 |
1,147822 |
0,2059 |
30,638 |
31 |
|
16 |
47 |
5,38 |
0,658346 |
0,3209 |
47,750 |
48 |
|
20 |
50 |
1,38 |
0,168869 |
0,3932 |
58,508 |
59 |
|
24 |
61 |
2,62 |
0,320607 |
0,3790 |
56,395 |
56 |
|
28 |
46 |
6,62 |
0,810083 |
0,2874 |
42,765 |
43 |
|
32 |
19 |
10,62 |
1,299559 |
0,1714 |
25,504 |
26 |
|
36 |
15 |
14,62 |
1,789036 |
0,0804 |
11,964 |
12 |
|
40 |
7 |
18,62 |
2,278512 |
0,0297 |
4,419 |
4 |
|
220 |
n = 304 |
n`= 300 |
- в первый столбец вписаны групповые варианты - Xi , см;
- во втором столбце - эмпирическая частота n, шт.;
- в четвертом столбце - нормированное отклонение, показывающее, насколько «д» отдельные члены данной совокупности отклоняются от среднего уровня учитываемого признака. Нормированное отклонение рассчитываем по формуле: t = ¦(Xi - X ср) / д¦.
Например, для первого значения варианты Xi = 4 получим:
t = ¦(4 - 21,38) / 8,172 ¦= 2,126774.
В пятом столбце находятся значения функции для нормированного отклонения - f(x), взятые из таблицы в соответствии с полученными значениями t .
В шестой столбец сведены значения теоретически рассчитанной частоты - n`, штук.
Например: n` = (304 • 4 / 8,172) • 0,0413 = 6,145.
По результатам вычислений построим графики распределения эмпирических и теоретических частот.
Задание 5. Статистическое сравнение эмпирического распределения с теоретическим по критерию ч - квадрат Пирсона
Критерий ч- квадрат (ч 2) впервые был предложен К. Пирсоном в 1901 году. Пользуясь этим критерием можно произвести оценку различий между эмпирическим и теоретическим распределением частот. Он рассчитывается по формуле: ч 2 = ? (ni - n`)2 / n`,
где ni - эмпирическая частота; n` - теоретическая частота.
Оценка значимости критерия ч 2 производится по специальной таблице (приложение 3 учебника Герасимов, Хлюстов), в которой приведены стандартные значения этого критерия (ч 2st) для трех пороговых уровней доверительной вероятности и для разных чисел степеней свободы.
Число степеней свободы равно числу классов без трех k = n - 3.
Если ч 2ф < ч 2st , то расхождение между эмпирическим и теоретическим распределением подчиняется тому закону, по которому рассчитаны теоретические частоты.
Таблица 9
Оценка различий между эмпирическим и теоретическим распределением деревьев сосны по диаметру на уровне груди.
Классы, xi (диаметр), см. |
Частоты |
n I - n` |
(n i - n`)2 |
(n i - n`)2 / n` |
||
Эмпирические (n i), штук |
Теоретические (n`), штук |
|||||
4 |
8 |
6,145 |
1,855 |
3,441 |
0,560 |
|
8 |
19 |
15,475 |
3,525 |
12,426 |
0,803 |
|
12 |
32 |
30,638 |
1,362 |
1,855 |
0,061 |
|
16 |
47 |
47,750 |
- 0,75 |
0,563 |
0,012 |
|
20 |
50 |
58,508 |
- 8,508 |
72,386 |
1,237 |
|
24 |
61 |
56,395 |
4,605 |
21,206 |
0,376 |
|
28 |
46 |
42,765 |
3,235 |
10,465 |
0,245 |
|
32 |
19 |
25,504 |
- 6,504 |
42,302 |
1,659 |
|
36 |
15 |
11,964 |
3,036 |
9,217 |
0,770 |
|
40 |
7 |
4,419 |
2,581 |
6,662 |
1,508 |
|
220 |
n = 304 |
7,231 |
Теоретические частоты берутся неокругленными.
ч 2ф = 7,231. ч 205/01 = 14,10 / 18,50, при k = 10 - 3 = 7. ч 2ф < ч 205/01 .
Следовательно, нулевая гипотеза H0 не отвергается, т.к. различия между эмпирическим и теоретическим распределением частот не существенны.
Статистическое заключение
Так как ч 2ф < ч 205/01, то можно сделать вывод о том, что опытное распределение деревьев по диаметру на уровне груди подчиняется закону предполагаемого теоретического распределения.
Задание 6. Статистическое сравнение частот взвешенных рядов эмпирических распределений по критерию Колмогорова
Если два эмпирических распределения имеют различное количество классов и объем совокупности, то согласие между ними устанавливается по критерию л , рассчитанному по формуле:
л = ¦(?n 1 /N1) - (?n 2/N2)¦max • v N1N2 / N1 + N2 , где
¦(?n 1 /N1) - (?n 2/N2)¦max = d max , тогда
л = d max • v N1N2 / N1 + N2 ,
где n 1 и n 2 - частоты первого и второго сравниваемых рядов; N1 и N2 - объемы первого и второго рядов.
Сравнение частот взвешенных рядов по критерию Колмогорова приведено в таблице 10.
Для оценки статистической гипотезы расчетное значение л ф сравнивается с табличным на 1% или 5%-ном уровне значимости: л 05/01 = 1,36 / 1,63. л Ф < л05/01 , следовательно, H0 - гипотеза не отвергается, различия между сравниваемыми рядами распределения не существенны.
Таблица 10
Сравнение частот взвешенных рядов по критерию Колмогорова
Диаметр деревьев см |
Эмпирическая Частота |
? n 1 |
? n 2 |
?n1/ N1 |
?n2/ N2 |
d |
||
n 1, шт. |
n 2, шт. |
|||||||
4 |
8 |
7 |
8 |
7 |
0,026 |
0,032 |
0,006 |
|
8 |
19 |
12 |
27 |
19 |
0,089 |
0,087 |
0,002 |
|
12 |
32 |
20 |
59 |
39 |
0,194 |
0,178 |
0,016 |
|
16 |
47 |
28 |
106 |
67 |
0,349 |
0,306 |
0,043 |
|
20 |
50 |
41 |
156 |
108 |
0,513 |
0,493 |
0,020 |
|
24 |
61 |
50 |
217 |
158 |
0,714 |
0,721 |
0,007 |
|
28 |
46 |
31 |
263 |
189 |
0,865 |
0,863 |
0,002 |
|
32 |
19 |
18 |
282 |
207 |
0,928 |
0,945 |
0,017 |
|
36 |
15 |
8 |
297 |
215 |
0,977 |
0,982 |
0,005 |
|
40 |
7 |
4 |
304 |
219 |
1,000 |
1,000 |
Из таблицы видно, что d max = 0,043. Тогда
л ф = 0,043 • v (304 • 219) / 304 + 219 = 0,043 • 11,283 = 0,4852.
Статистическое заключение
В результате сравнения двух эмпирических рядов распределения деревьев сосны по диаметру можно сделать заключение о том, что получены не существенные различия между ними, так как фактическое значение л ф критерия меньше л критерия на 5% уровне значимости.
Статистическое сравнение эмпирического распределения с теоретическим по критерию Колмогорова - Смирнова
При помощи критерия л - Колмогорова-Смирнова сопоставляют эмпирические и теоретические частоты рядов распределения, а также дают оценку различий двух эмпирических распределений.
Для сопоставления эмпирического и теоретического распределения частот л - критерий рассчитывается по формуле: л = ¦(?n i /N) - (?n`/N)¦max • vN , где N - объем эмпирического ряда распределения ¦(?n i /N) - (?n`/N)¦= d , тогда л = dmax • vN.
Таблица 11
Статистическая оценка эмпирических и теоретических рядов распределения по критерию л - Колмогорова-Смирнова.
Классы, xi (диаметр деревьев), см. |
Эмпирические частоты (n i), штук |
Теоретические частоты (n`), штук |
? n i |
? n` |
?n i/ N |
?n`/ N |
D |
|
4 |
8 |
6 |
8 |
6 |
0,026 |
0,020 |
0,006 |
|
8 |
19 |
15 |
27 |
21 |
0,089 |
0,070 |
0,019 |
|
12 |
32 |
31 |
59 |
52 |
0,194 |
0,173 |
0,021 |
|
16 |
47 |
48 |
106 |
100 |
0,349 |
0,333 |
0,016 |
|
20 |
50 |
59 |
156 |
159 |
0,513 |
0,530 |
0,017 |
|
24 |
61 |
56 |
217 |
215 |
0,714 |
0,717 |
0,003 |
|
28 |
46 |
43 |
263 |
258 |
0,865 |
0,860 |
0,005 |
|
32 |
19 |
26 |
282 |
284 |
0,928 |
0,947 |
0,019 |
|
36 |
15 |
12 |
297 |
296 |
0,977 |
0,987 |
0,010 |
|
40 |
7 |
4 |
304 |
300 |
1,000 |
1,000 |
0 |
л ф = 0,021 • v304 = 0,021 • 17,44 = 0,366.
Для оценки статистической гипотезы расчетное значение л - Колмогорова-Смирнова сравнивается с табличным на 1% или 5%-ном уровне значимости: л 05/01 = 1,36 / 1,63
Так как л ф < л 05/01, то H0 - гипотеза не отвергается, различия между эмпирическим и теоретическим распределениями частот не существенны.
Статистическое заключение
В результате сравнения эмпирического и теоретического рядов распределения можно сделать заключение о том, что существенных различий между ними нет, так как фактическое значение л - критерия меньше л на 5%-ном уровне значимости.
Задание 7. Статистическое сравнение двух выборочных средних по t - критерию Стьюдента при неравнозначных выборках
Если объемы выборочных совокупностей неравны (выборки неравнозначные), то t - критерий Стьюдента определяется по формуле:
t ф = d / S d , где d = ¦X1 ср - X2 ср¦, т.е. разность между сравниваемыми средними; S d - ошибка разности выборочных средних.
S d = v ((n1 - 1) • д12 + (n2 - 1) • д22 / n1 + n2 - 2 ) • (n1 + n2 / n1 n2),
где n1 и n2 - объемы сравниваемых выборочных совокупностей; д1 и д2 - значение стандартного отклонения.
Пример расчета вспомогательных величин для вычисления t - критерия фактического приведен в таблице 12.
Таблица 12
Статистическое сравнение двух выборочных средних по t - критерию Стьюдента
Фамилия |
Объем выборки n, шт. |
Средняя величина x, см. |
Ошибка средней д x, см. |
t фак |
t05/01 |
|
Цветков |
304 |
21,38 |
8,172 |
0,203 0,852 0,648 |
1,96 / 2,58 |
|
Гусев |
316 |
21,51 |
8,386 |
|||
Смирнов |
335 |
21,94 |
8,744 |
d1 = ¦21,38 - 21,51¦ = 0,13, d2 = ¦21,38 - 21,94¦ = 0,56,
d3 = ¦21,51 - 21,94¦ = 0,43.
S d1 = v ((304 - 1) • 8,172 2 + (316 - 1) • 8,386 2 / 304 + 316 - 2 ) • (304 + 316 / 304 • 316) = v (20234,82 + 22152,37 / 618) • (620 / 96064) = v68,588 • 0,006 = 0,642.
S d2 = v ((304 - 1) • 8,172 2 + (335 - 1) • 8,744 2 / 304 + 335 - 2 ) • (304 + 335 / 304 • 335) = v (20234,82 + 25536,82 / 637) • (639 / 101840) = v71,855 • 0,006 = 0,657.
S d3 = v ((316 - 1) • 8,386 2 + (335 - 1) • 8,744 2 / 316 + 335 - 2 ) • (316 + 335 / 316 • 335) = v (22152,37 + 25536,82 / 649) • (651 / 105860) = v73,481 • 0,006 = 0,664.
t факт 1 = 0,13 / 0,642 = 0,203, t факт 2 = 0,56 / 0,657 = 0,852, t факт 3 = 0,43 / 0,664 = 0,648.
Фактическое значение t -критерия (t факт) сравниваем с t s на 1% и 5%-ном уровне значимости.
t05/01 определяем по приложению 1 учебника (Герасимов, Хлюстов), исходя из числа степеней свободы.
Формула для вычисления числа степеней свободы имеет вид:
k = n1 + n2 - 2.
В нашем случае k1 = 304 + 316 - 2 = 618, k2 = 637 и k3 = 649, следовательно, t05/01 = 1,96 / 2,58.
Так как t факт 1, t факт 2 и t факт 3 меньше t05/01 , то H0 - гипотеза не отвергается, следовательно, различия несущественные.
Статистическое заключение
В результате сравнения выборочной средней Цветкова со средней Гусева и Смирнова, а также сравнения последних двух между собой, делаем заключение о несущественных различиях между ними, т. к. во всех случаях t факт < t05/01 .
Статистическое сравнение двух выборочных средних по t - критерию Стьюдента при равнозначных выборках
Критерий t - Стьюдента используется для сравнения средних значений совокупностей. Фактическое значение критерия определяют по формуле:
t = ¦X1 ср - X2 ср¦ / v (m2X1ср + m2X2ср),
где X1 ср и X2 ср. - значения сравниваемых средних выборочных совокупностей;
m2X1ср и m2X2ср - значения квадратов ошибок средних выборочных совокупностей.
Данная формула применяется для сравнения средних выборочных совокупностей с равнозначным объемом; т. е. n1 = n2, где n1 и n2 - объем сравниваемых выборочных совокупностей.
Таблица 12.1
Статистическое сравнение двух выборочных средних по t - критерию Стьюдент
Фамилия |
Объем выборки n, шт. |
Средняя величина x, мм. |
Ошибка средней m x, мм. |
t фак |
t05/01 |
|
Цветков |
30 |
0,916 |
0,073 |
0,767 |
2,05 / 2,76 |
|
Смирнов |
30 |
0,827 |
0,090 |
t факт = ¦0,916 - 0,827¦/ v0,073 2 + 0,09 2 = 0,089 / 0,116 = 0,767.
Фактическое значение t - критерия (t ф) сравнивается с t05 на 1% и 5%-ном уровне значимости, которые определяются с использованием приложения учебника (Герасимов, Хлюстов). Причем число степеней свободы устанавливается по формуле: k = n - 1.
В данном случае k = 30 - 1 =29, следовательно, t05/01 = 2,05 / 2,76.
Так как t ф < t05/01, то H0 - гипотеза не отвергается, различия несущественные.
Статистическое заключение
В результате сравнения выборочной средней Цветкова со средней Смирнова делаем заключение о несущественном различии между ними, т.к. t ф < t05/01.
Задание 8. Установить зависимость различий в формовом разнообразии облепихи крушиновидной на выровненном экофоне (однофакторный дисперсионный анализ)
Структура опыта:
1. Объект - облепиха крушиновидная.
2. Варианты опыта - различные формы облепихи.
3. Изучаемый признак - средний вес плода, гр.
4. Комплекс однофакторный, т.к. 1 изучаемый признак.
5. Комплекс равномерный, т.к. количество повторностей по всем вариантам одинаковое.
Схема расчета средних по вариантам приведена в таблице 13
Таблица 13
Схема расчета по дисперсионному анализу
Вариант опыта (форма) |
Повторности |
Число Наблю дений, n |
Сумма по варианту |
Средн. по варианту |
||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|||||
I Дар Катуни |
10 |
12 |
13 |
11 |
10 |
9 |
9 |
11 |
13 |
- |
9 |
98 |
10,89 |
|
II Витаминная |
8 |
10 |
9 |
7 |
8 |
7 |
9 |
8 |
10 |
- |
9 |
76 |
8,44 |
|
III Алтайская |
18 |
20 |
16 |
15 |
19 |
17 |
16 |
18 |
20 |
- |
9 |
159 |
17,67 |
|
IV Алма-атинская |
15 |
13 |
14 |
13 |
13 |
12 |
14 |
13 |
12 |
- |
9 |
109 |
12,11 |
|
V Нижегородская |
22 |
19 |
20 |
18 |
20 |
20 |
21 |
19 |
18 |
- |
9 |
177 |
19,67 |
|
n 45 |
xi 619 |
xср13,756 |
Xср = (10,89 + 8,44 + 17,67 + 12,11 + 19,67) / 5 = 13,756 гр.
Расчет преобразованных значений и сумм по вариантам проведен в таблице 14.
Таблица 14
Таблица преобразованных значений
Варианты |
X1 = Xi - A |
Сумма |
||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|||
I |
- 4 |
- 2 |
- 1 |
- 3 |
- 4 |
- 5 |
- 5 |
- 3 |
- 1 |
- |
- 28 |
|
II |
- 6 |
- 4 |
- 5 |
- 7 |
- 6 |
- 7 |
- 5 |
- 6 |
- 4 |
- |
- 50 |
|
III |
4 |
6 |
2 |
1 |
5 |
3 |
2 |
4 |
6 |
- |
33 |
|
IV |
1 |
- 1 |
0 |
- 1 |
- 1 |
- 2 |
0 |
- 1 |
- 2 |
- |
- 7 |
|
V |
8 |
5 |
6 |
4 |
6 |
6 |
7 |
5 |
4 |
- |
51 |
|
? X1 -1 |
А - значение варианты (Xi), которое имеет близкое значение к среднему.
В нашем случае X ср = 13,756 гр, следовательно, А = 14 гр. Тогда X1 = 10 - 14 = - 4 и т. д.
Вычисление суммы квадратов отклонений
Общее число наблюдений: n = N = 45.
1. Корректирующий фактор
C = (? x1)2/ N
C = (- 1)2 /45 = 0,02.
2. Общая дисперсия
Cy = ? (x)2 - C
Cy = 106 + 288 + 147 + 13 + 303 - 0,02 = 856,98.
3. Дисперсия вариантов
C v = (? y2/ n) - C
C v = (784 + 2500 + 1089 + 49 + 2601) / 9 - 0,02 = 780,31.
4. Дисперсия остатка
C z = C y - C v
C z = 856,98 - 780,31 = 76,67.
Результаты вычислений представлены в таблице 15.
Таблица 15
Результаты вычислений
Дисперсия |
Сумма квадратов |
Число степеней свободы |
Средний Квадрат |
F p |
F05/01 |
|
Общая Cy |
856,98 |
45 - 1 = 44 |
101,76 |
2,61 / 3,83 |
||
Вариант C v |
780,31 |
I - 1 = 4 = k1 |
916,68 |
|||
Остатка C z |
76,67 |
44 - 4 = 40 = k2 |
9,264 |
д2v = 780,31 / 4 = 195,08.
д2z = 76,67 / 40 = 1,917.
Оценка значимости воздействия изучаемых факторов осуществляется по F - критерию Фишера:
Fp = д2v / д2z .
Значит F p = 195,08 / 1,917 = 101,76.
F01 и F05 определяем по числу степеней свободы меньшей дисперсии (остатка) и по числу степеней свободы большей дисперсии (вариантов), по приложению учебника (стр. 247). Откуда находим, что F01 = 3,83 и F05 = 2,61.
F p >> F01, следовательно, различия между сравниваемыми вариантами можно считать существенными, а если так, то необходимо произвести оценку по наименьшей существенной разности (НСР05).
Чтобы определить НСР необходимо по данным дисперсионного анализа вычислить обобщенную ошибку средней величины по опыту и ошибку разности средних.
1. Ошибка опыта: S x = + v д2z / n.
S x = + v 1,917 / 9 = + 0,4615.
2. Ошибка разности средних: S d = + v2 д2z / n.
S d =+ v 3,834 / 9 = + 0,6527.
НСР05 = S d • t 05 , v = 40, t 05 = 2,023.
Тогда НСР05 = 0,6527 • 2,023 = 1,32 гр.
НСР05 = ((S d • t 05)/ X ср) • 100 %.
НСР05 = ((0,6527 • 2,023) / 13,756) • 100 % = 9,6 %.
Определение места в ряду распределения приведено в таблице 16.
Таблица 16
Итог результатов опыта
Варианты |
Средний вес плода гр |
Разность со стандартом |
Место в ряду |
||
гр |
% |
||||
I |
10,89 |
- 1,22 |
- 10,07 |
||
II |
8,44 |
- 3,67 |
- 30,31 |
||
III |
17,67 |
5,56 |
45,91 |
II |
|
IV |
12,11 = St |
0 |
0 |
||
V |
19,67 |
7,56 |
62,43 |
I |
Статистическое заключение
По результатам дисперсионного анализа можно сделать заключение о том, что различия между сравниваемыми вариантами существенные, т.к. F p >> F01 (101,76 >> 3,83).
Для производства рекомендуется вариант № V (сорт Нижегородская) т.к. его фактическая разность со стандартом превышает значение НСР05 (62,43 > 9,6).
Задание 9. Корреляционный анализ малой выборочной совокупности
Расчет вспомогательных величин для вычисления коэффициента корреляции приведен в таблице 17.
Таблица 17
Расчет вспомогательных величин для коэффициента корреляции
Значение признака |
Xi2 |
Yi2 |
Xi • Yi |
||
Диаметр ствола Xi |
Высота дерева Yi |
||||
24,0 см |
22,2 м |
576 |
492,84 |
532,8 |
|
24,5 |
22,5 |
600,25 |
506,25 |
551,25 |
|
25,3 |
23,0 |
640,09 |
529 |
581,9 |
|
26,4 |
23,5 |
696,96 |
552,25 |
620,4 |
|
27,0 |
23,7 |
729 |
561,69 |
639,9 |
|
28,5 |
24,0 |
812,25 |
576 |
684 |
|
29,0 |
24,6 |
841 |
605,16 |
713,4 |
|
30,4 |
25,0 |
924,16 |
625 |
760 |
|
31,5 |
25,5 |
992,25 |
650,25 |
803,25 |
|
32,0 |
25,0 |
1024 |
625 |
800 |
|
32,8 |
25,8 |
1075,84 |
665,64 |
846,24 |
|
33,5 |
26,0 |
1122,25 |
676 |
871 |
|
35,0 |
26,5 |
1225 |
702,25 |
927,5 |
|
36,6 |
26,4 |
1339,56 |
696,96 |
966,24 |
|
37,5 |
27,0 |
1406,25 |
729 |
1012,5 |
|
38,0 |
27,5 |
1444 |
756,25 |
1045 |
|
39,5 |
27,8 |
1560,25 |
772,84 |
1098,1 |
|
40,2 |
26,9 |
1616,04 |
723,61 |
1081,38 |
|
42,0 |
27,3 |
1764 |
745,29 |
1146,6 |
|
43,5 |
28,0 |
1892,25 |
784 |
1218 |
|
44,0 |
27,0 |
1936 |
729 |
1188 |
|
44,7 |
27,7 |
1998,09 |
767,29 |
1238,19 |
|
45,3 |
28,1 |
2052,09 |
789,61 |
1272,93 |
|
46,0 |
28,5 |
2116 |
812,25 |
1311 |
|
48,5 |
28,0 |
2352,25 |
784 |
1358 |
|
49,0 |
28,5 |
2401 |
812,25 |
1396,5 |
|
50,6 |
28,3 |
2560,36 |
800,89 |
1431,98 |
|
51,5 |
29,0 |
2652,25 |
841 |
1493,5 |
|
52,0 |
27,0 |
2704 |
729 |
1404 |
|
53,2 |
28,4 |
2830,24 |
806,56 |
1510,88 |
|
54,0 |
28,6 |
2916 |
817,96 |
1544,4 |
|
56,0 |
29,0 |
3136 |
841 |
1624 |
|
У Xi |
У Yi |
УXi2 |
У Yi2 |
У (Xi • Yi) |
|
1252 |
846,3 |
51935,68 |
22506,09 |
33672,84 |
Вычисляем вспомогательные величины:
Xср = У X i / n = 1252 / 32 = 39,125 см;
Yср = У Yi / n = 846,3 / 32 = 26,447 м.
У (Xi - Xср)2 = УXi2 - ((УXi)2 / n) = 51935,68 - (1567504 / 32) = 51935,68 - 48984,5 = 2951,18;
У (Yi - Yср)2 = УYi2 - ((УYi)2 / n) = 22506,09 - (716223,69 / 32) = 22506,09 - 22381,99 = 124,1;
У (Xi - Xср) • (Yi - Yср) = УXi • Yi - ((УXi ?УYi ) / n) = 33672,84 - (1059567,6 / 32) = 33672,84 - 33111,49 = 561,35, где n = 32.
Теперь вычислим коэффициент корреляции по формуле:
r = + У (Xi - Xср) • (Yi - Yср) / v У (Xi - Xср)2 • У (Yi - Yср)2 .
Отсюда
r = + 561,35 / v2951,18 • 124,1 = + 561,35 / 605,18 = + 0,928.
Далее вычислим ошибку коэффициента корреляции:
m r = + v1 - r2 /(n - 2).
Значит m r = + v1 - 0,9282 /(32 - 2) = + 0,068.
Значимость корреляции:
t = r / m r.
t = 0,928 / 0,068 = 13,65.
Число степеней свободы в данном случае: v = n - 2 = 32 - 2 = 30. Находим t05 по таблице для определения критерия Стьюдента.
Откуда следует, что t05 = 2,045. t r = 13,65 > t05, значит, корреляция значима.
Расчет вспомогательных величин для вычисления корреляционного отношения приведен в таблице 18.
Согласно результатам вычислений определим корреляционное отношение по формуле:
з = ?( Уб2 - УДy2) / Уб2.
Тогда
з = ?(124,1 - 8,2028) / 124,1 = 0,966.
Находим ошибку корреляционного отношения:
Таблица 18
Расчет вспомогательных величин для вычисления корреляционного отношения
Ступени толщины |
Диаметр Xi |
Высота Yi |
Yуслов. |
Отклонения |
||||
б = yi - yср yср=26,45 |
б 2 |
Дy = yi -yу |
Дy2 |
|||||
24 |
24,0 см |
22,2 м |
22,57 24,16 25,76 26,97 27,33 27,86 28,45 28,00 29,00 |
- 4,25 |
18,063 |
- 0,37 |
0,1369 |
|
24,5 |
22,5 |
- 3,95 |
15,603 |
- 0,07 |
0,0049 |
|||
25,3 |
23,0 |
- 3,45 |
11,903 |
0,43 |
0,1849 |
|||
28 |
26,4 |
23,5 |
- 2,95 |
8,7025 |
- 0,66 |
0,4356 |
||
27,0 |
23,7 |
- 2,75 |
7,5625 |
- 0,46 |
0,2116 |
|||
28,5 |
24,0 |
- 2,45 |
6,0025 |
- 0,16 |
0,0256 |
|||
29,0 |
24,6 |
- 1,85 |
3,4225 |
0,44 |
0,1936 |
|||
30,4 |
25,0 |
- 1,45 |
2,1025 |
0,84 |
0,7056 |
|||
32 |
31,5 |
25,5 |
- 0,95 |
0,9025 |
- 0,26 |
0,0676 |
||
32,0 |
25,0 |
- 1,45 |
2,1025 |
- 0,76 |
0,5776 |
|||
32,8 |
25,8 |
- 0,65 |
0,4225 |
0,04 |
0,0016 |
|||
33,5 |
26,0 |
- 0,45 |
0,2025 |
0,24 |
0,0576 |
|||
35,0 |
26,5 |
0,05 |
0,0025 |
0,74 |
0,5476 |
|||
36 |
36,6 |
26,4 |
- 0,05 |
0,0025 |
- 0,57 |
0,3249 |
||
37,5 |
27,0 |
0,55 |
0,3025 |
0,03 |
0,0009 |
|||
38,0 |
27,5 |
1,05 |
1,1025 |
0,53 |
0,2809 |
|||
40 |
39,5 |
27,8 |
1,35 |
1,8225 |
0,47 |
0,2209 |
||
40,2 |
26,9 |
0,45 |
0,2025 |
- 0,96 |
0,9216 |
|||
42,0 |
27,3 |
0,85 |
0,7225 |
- 0,03 |
0,0009 |
|||
44 |
43,5 |
28,0 |
1,55 |
2,4025 |
0,14 |
0,0196 |
||
44,0 |
27,0 |
0,55 |
0,3025 |
- 0,86 |
0,7396 |
|||
44,7 |
27,7 |
1,25 |
1,5625 |
- 0,16 |
0,0256 |
|||
45,3 |
28,1 |
1,65 |
2,7225 |
0,24 |
0,0576 |
|||
46,0 |
28,5 |
2,05 |
4,2025 |
0,64 |
0,4096 |
|||
48 |
48,5 |
28,0 |
1,55 |
2,4025 |
- 0,45 |
0,2025 |
||
49,0 |
28,5 |
2,05 |
4,2025 |
0,05 |
0,0025 |
|||
50,6 |
28,3 |
1,85 |
3,4225 |
- 0,15 |
0,0225 |
|||
51,5 |
29,0 |
2,55 |
6,5025 |
0,55 |
0,3025 |
|||
52 |
52,0 |
27,0 |
0,55 |
0,3025 |
- 1,00 |
1 |
||
53,2 |
28,4 |
1,95 |
3,8025 |
0,40 |
0,16 |
|||
54,0 |
28,6 |
2,15 |
4,6225 |
0,60 |
0,36 |
|||
56 |
56,0 |
29,0 |
2,55 |
6,5025 |
0,00 |
0 |
||
Уб 2 124,1 |
УДy2 8,2028 |
m з = 1- з2/ v n.
Значит
m з = 1 - (0,966)2 / v32 = 0,0668 / 5,66 = 0,012.
Значимость корреляционного отношения: t = з / mз.
Тогда t = 0,966 / 0,012 = 80,5.
Определим меру линейности корреляции: е = з2 - r2.
е = 0,933 - 0,861 = 0,072.
Находим основную ошибку:
mе = vе / n = v0,072 / 32 = 0,047.
По отношению меры линейности к основной ошибке дадим характеристику линейности связи. е/ mе = 0,072 / 0,047 = 1,532 < 2.
Связь приблизительно можно считать линейной.
Степень тесноты связи между признаками по величине коэффициента корреляции определяется с помощью таблицы 19.
Таблица 19
Таблица для определения тесноты связи
Степень тесноты связи |
Величина коэффициента корреляции |
|
слабая |
0 - 0,3 |
|
умеренная |
0,31 - 0,5 |
|
значительная |
0,51 - 0,7 |
|
высокая |
0,71 - 0,9 |
|
очень высокая |
0,91 и выше |
Статистическое заключение
По результатам корреляционного анализа можно сделать вывод о том, что взаимосвязь между диаметром и высотой ствола по направлению - прямая, по тесноте - очень высокая, по форме - линейная (см. график).
Задание 10. Регрессионный анализ
Математические выражения, отражающие причинно-следственные взаимосвязи и взаимодействия в системах (или модели связи) являются основными типами моделей, применяемых в области лесного хозяйства. В качестве математической формы эмпирических моделей связи, в основном, используют регрессионные уравнения и реже - интерполяционные многочлены. В первом случае применяют различные модификации метода наименьших квадратов, позволяющие просто и достаточно надежно оценить статистическим путем разрабатываемую модель. Второй метод сводится к механической процедуре аналитического выражения числовых массивов.
Для вычисления коэффициентов регрессионных уравнений основным методом является метод наименьших квадратов, предложенный в начале 19 в. Лежандром и Гауссом. Требование метода наименьших квадратов заключается в том, что теоретические точки линии регрессии y должны быть получены таким образом, чтобы сумма квадратов отклонений от этих точек эмпирических значений была минимальной, т.е.
У(Yi - Yx)2 -- min.
Линейное уравнение с логарифмированием факторного признака
Для вычисления коэффициентов a и b для уравнения прямой с логарифмированием факторного признака
y = a + b ln x
необходимо решить следующую систему уравнений:
a n + b У ln xi = У yi ;
a У ln xi + b У( ln xi)2 = У yi ln x.
Решение системы относительно неизвестных a и b дает численные значения искомых коэффициентов:
a = (У yi У( ln xi)2 - У yi ln xi У ln xi )/( n У( ln xi)2 - (У ln xi)2 ),
b = (n У yi ln xi - У ln xi У yi) / (n У( ln xi)2 - ( У ln xi)2.
Задание: Найти уравнение регрессии, описывающее фактические значения высот по диаметрам в основном древостое, используя линейную модель с логарифмированием факторного признака.
Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 20.
Таблица 20
Расчет вспомогательных величин для нахождения коэффициентов a и b
Диаметр Xi , см |
Высота Yi , м |
ln xi |
(ln xi)2 |
yi ln x |
Y x |
yi-yx |
(yi-yx)2 |
yi2 |
|
24,0 |
22,2 |
3,178054 |
10,10003 |
70,5528 |
23,05707 |
-0,85707 |
0,734568 |
492,84 |
|
24,5 |
22,5 |
3,198673 |
10,23151 |
71,97015 |
23,20996 |
-0,70996 |
0,504045 |
506,25 |
|
25,3 |
23,0 |
3,230804 |
10,4381 |
74,3085 |
23,44821 |
-0,44821 |
0,200896 |
529 |
|
26,4 |
23,5 |
3,273364 |
10,71491 |
76,92405 |
23,76379 |
-0,26379 |
0,069587 |
552,25 |
|
27,0 |
23,7 |
3,295837 |
10,86254 |
78,11133 |
23,93043 |
-0,23043 |
0,053098 |
561,69 |
|
28,5 |
24,0 |
3,349904 |
11,22186 |
80,3977 |
24,33134 |
-0,33134 |
0,109785 |
576 |
|
29,0 |
24,6 |
3,367296 |
11,33868 |
82,83548 |
24,4603 |
0,139701 |
0,019516 |
605,16 |
|
30,4 |
25,0 |
3,414443 |
11,65842 |
85,36107 |
24,80989 |
0,190108 |
0,036141 |
625 |
|
31,5 |
25,5 |
3,449988 |
11,90241 |
87,97468 |
25,07346 |
0,426542 |
0,181938 |
650,25 |
|
32,0 |
25,0 |
3,465736 |
12,01133 |
86,6434 |
25,19023 |
-0,19023 |
0,036188 |
625 |
|
32,8 |
25,8 |
3,490429 |
12,18309 |
90,05306 |
25,37333 |
0,426673 |
0,182049 |
665,64 |
|
33,5 |
26,0 |
3,511545 |
12,33095 |
91,30018 |
25,52991 |
0,470091 |
0,220985 |
676 |
|
35,0 |
26,5 |
3,555348 |
12,6405 |
94,21672 |
25,85471 |
0,645294 |
0,416405 |
702,25 |
|
36,6 |
26,4 |
3,600048 |
12,96035 |
95,04127 |
26,18616 |
0,213842 |
0,045729 |
696,96 |
|
37,5 |
27,0 |
3,624341 |
13,13585 |
97,85721 |
26,36629 |
0,633712 |
0,401591 |
729 |
|
38,0 |
27,5 |
3,637586 |
13,23203 |
100,0336 |
26,4645 |
1,035499 |
1,072257 |
756,25 |
|
39,5 |
27,8 |
3,676301 |
13,51519 |
102,2012 |
26,75157 |
1,048431 |
1,099207 |
772,84 |
|
40,2 |
26,9 |
3,693867 |
13,64465 |
99,36502 |
26,88182 |
0,018176 |
0,00033 |
723,61 |
|
42,0 |
27,3 |
3,73767 |
13,97017 |
102,0384 |
27,20662 |
0,09338 |
0,00872 |
745,29 |
|
43,5 |
28,0 |
3,772761 |
14,23373 |
105,6373 |
27,46682 |
0,533178 |
0,284278 |
784 |
|
44,0 |
27,0 |
3,78419 |
14,32009 |
102,1731 |
27,55157 |
-0,55157 |
0,304225 |
729 |
|
44,7 |
27,7 |
3,799974 |
14,4398 |
105,2593 |
27,6686 |
0,031396 |
0,000986 |
767,29 |
|
45,3 |
28,1 |
3,813307 |
14,54131 |
107,1539 |
27,76747 |
0,332528 |
0,110575 |
789,61 |
|
46,0 |
28,5 |
3,828641 |
14,65849 |
109,1163 |
27,88118 |
0,618824 |
0,382943 |
812,25 |
|
48,5 |
28,0 |
3,881564 |
15,06654 |
108,6838 |
28,2736 |
-0,2736 |
0,074855 |
784 |
|
49,0 |
28,5 |
3,89182 |
15,14627 |
110,9169 |
28,34965 |
0,150352 |
0,022606 |
812,25 |
|
50,6 |
28,3 |
3,923952 |
15,3974 |
111,0478 |
28,5879 |
-0,2879 |
0,082887 |
800,89 |
|
51,5 |
29,0 |
3,941582 |
15,53607 |
114,3059 |
28,71863 |
0,281371 |
0,07917 |
841 |
|
52,0 |
27,0 |
3,951244 |
15,61233 |
106,6836 |
28,79027 |
-1,79027 |
3,205074 |
729 |
|
53,2 |
28,4 |
3,974058 |
15,79314 |
112,8633 |
28,95944 |
-0,55944 |
0,312976 |
806,56 |
|
54,0 |
28,6 |
3,988984 |
15,91199 |
114,0849 |
29,07012 |
-0,47012 |
0,22101 |
817,96 |
|
56,0 |
29,0 |
4,025352 |
16,20346 |
116,7352 |
29,33978 |
-0,33978 |
0,115452 |
841 |
|
У xi 1252 |
У yi 846,3 |
У ln xi 116,329 |
У(ln xi)2 424,9532 |
Уyi ln xi 3091,847 |
Уyx 846,3146 |
У - 0,0146 |
У 10,59007 |
Уyi2 22506,09 |
Находим коэффициенты a и b по следующим формулам:
a = (У yi У( ln xi)2 - У yi ln xi У ln xi )/( n У( ln xi)2 - (У ln xi)2 ),
b = (n У yi ln xi - У ln xi У yi) / (n У( ln xi)2 - ( У ln xi)2).
Отсюда получим
a = (846,3 • 424,9532 - 3091,847 • 116,329) / (32 • 424,9532 - 13532,4362) = (359637,8932 - 359671,4697) / (13598,5024 - 13532,4362) = - 33,5765 / 66,0662 = - 0,5082.
b = (32 • 3091,847 - 116,329 • 846,3) / (32 • 424,9532 - 13532,4362) = (98939,104 - 98449,2327) / 66,0662 = 489,8713 / 66,0662 = 7,415.
Полученное уравнение регрессии имеет вид
y = - 0,5082 + 7,415 ln x.
Произведем проверку значимости уравнения регрессии по F - критерию Фишера. При этом сравним общую дисперсию Sy2 c остаточной S2ост.
F ф = S y2 / S 2ост .
Здесь S 2ост = У(yi - yx)2/ (n - 2) = 10,59007 / 30 = 0,353,
S y2 = ( Уyi2 - (( Уyi)2 / n )) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.
Тогда
F ф = 4,00 / 0,353 = 11,33.
При уровне значимости б = 0,05 F ф > F p = 1,84. Следовательно, линейное уравнение регрессии адекватно описывает фактическое изменение высот от диаметров деревьев. При этом значение F ф = 11,33 указывает на то, что уравнение линии в 11 раз лучше описывает рассматриваемую взаимосвязь, чем среднее значение зависимой переменной.
Статистическое заключение
По результатам регрессионного анализа можно сделать заключение о том, что линейное уравнение с логарифмированием факторного признака, представленное результатами опыта y = - 0,5082 + 7,415 ln x (красный график) в 11,33 раза лучше описывает изменение зависимой переменной, чем среднее значение аргумента
Уравнение гиперболы
Для вычисления коэффициентов a и b гиперболической зависимости:
y = a + b / x ,
необходимо решить следующую систему уравнений:
an + b У(1/xi ) = У yi
a У(1/xi ) + b У(1/xi2) = У(yi / xi ) .
Результатом решения системы нормальных уравнений являются следующие выражения:
a = (У yi У(1/xi ) 2 - У(yi / xi ) У(1/xi )) / n У(1/xi ) 2- (У(1/xi ) )2, (1)
b = n У(yi / xi ) - У(1/xi ) У yi / n У(1/xi ) 2- (У(1/xi ) )2. (2)
Проверка значимости уравнения регрессии производится, как и в первом случае по F - критерию Фишера. При этом общая дисперсия Sy2 сравнивается с остаточной S 2ост ;
F ф = S y2 / S 2ост .
Для принятого уровня значимости F ф сравнивается с табличным значением F st и делается вывод об адекватности описания уравнением рассматриваемой взаимосвязи.
Задание: Получить уравнение регрессии, описывающее фактическое изменение высот от диаметров в основном древостое, используя линейную модель. Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 21.
Таблица 21
Расчет вспомогательных величин для нахождения коэффициентов a и b
Диаметр Xi , см |
Высота Yi , м |
1/ xi |
(1/ xi)2 |
yi / xi |
Y x |
yi - yx |
(yi- yx)2 |
yi2 |
|
24,0 |
22,2 |
0,041667 |
0,001736 |
0,925 |
22,54271 |
-0,34271 |
0,117449 |
492,84 |
|
24,5 |
22,5 |
0,040816 |
0,001666 |
0,918367 |
22,77314 |
-0,27314 |
0,074607 |
506,25 |
|
25,3 |
23,0 |
0,039526 |
0,001562 |
0,909091 |
23,12289 |
-0,12289 |
0,015103 |
529 |
|
26,4 |
23,5 |
0,037879 |
0,001435 |
0,890152 |
23,56919 |
-0,06919 |
0,004787 |
552,25 |
|
27,0 |
23,7 |
0,037037 |
0,001372 |
0,877778 |
23,7973 |
-0,0973 |
0,009467 |
561,69 |
|
28,5 |
24,0 |
0,035088 |
0,001231 |
0,842105 |
24,32554 |
-0,32554 |
0,105979 |
576 |
|
29,0 |
24,6 |
0,034483 |
0,001189 |
0,848276 |
24,48948 |
0,110517 |
0,012214 |
605,16 |
|
30,4 |
25,0 |
0,032895 |
0,001082 |
0,822368 |
24,91982 |
0,080178 |
0,006428 |
625 |
|
31,5 |
25,5 |
0,031746 |
0,001008 |
0,809524 |
25,23111 |
0,268889 |
0,072301 |
650,25 |
|
32,0 |
25,0 |
0,03125 |
0,000977 |
0,78125 |
25,36553 |
-0,36553 |
0,133613 |
625 |
|
32,8 |
25,8 |
0,030488 |
0,00093 |
0,786585 |
25,57208 |
0,227921 |
0,051948 |
665,64 |
|
33,5 |
26,0 |
0,029851 |
0,000891 |
0,776119 |
25,74472 |
0,255284 |
0,06517 |
676 |
|
35,0 |
26,5 |
0,028571 |
0,000816 |
0,757143 |
26,0914 |
0,4086 |
0,166954 |
702,25 |
|
36,6 |
26,4 |
0,027322 |
0,000747 |
0,721311 |
26,42987 |
-0,02987 |
0,000892 |
696,96 |
|
37,5 |
27,0 |
0,026667 |
0,000711 |
0,72 |
26,60757 |
0,392427 |
0,153999 |
729 |
|
38,0 |
27,5 |
0,026316 |
0,000693 |
0,723684 |
26,70266 |
0,797342 |
0,635754 |
756,25 |
|
39,5 |
27,8 |
0,025316 |
0,000641 |
0,703797 |
26,97347 |
0,826532 |
0,683155 |
772,84 |
|
40,2 |
26,9 |
0,024876 |
0,000619 |
0,669154 |
27,09293 |
-0,19293 |
0,037222 |
723,61 |
|
42,0 |
27,3 |
0,02381 |
0,000567 |
0,65 |
27,38183 |
-0,08183 |
0,006697 |
745,29 |
|
43,5 |
28,0 |
0,022989 |
0,000528 |
0,643678 |
27,60432 |
0,395678 |
0,156561 |
784 |
|
44,0 |
27,0 |
0,022727 |
0,000517 |
0,613636 |
27,67511 |
-0,67511 |
0,455778 |
729 |
|
44,7 |
27,7 |
0,022371 |
0,0005 |
0,619687 |
27,77156 |
-0,07156 |
0,005121 |
767,29 |
|
45,3 |
28,1 |
0,022075 |
0,000487 |
0,620309 |
27,85186 |
0,248141 |
0,061574 |
789,61 |
|
46,0 |
28,5 |
0,021739 |
0,000473 |
0,619565 |
27,94289 |
0,557109 |
0,31037 |
812,25 |
|
48,5 |
28,0 |
0,020619 |
0,000425 |
0,57732 |
28,24656 |
-0,24656 |
0,06079 |
784 |
|
49,0 |
28,5 |
0,020408 |
0,000416 |
0,581633 |
28,30357 |
0,196429 |
0,038584 |
812,25 |
|
50,6 |
28,3 |
0,019763 |
0,000391 |
0,559289 |
28,47845 |
-0,17845 |
0,031843 |
800,89 |
|
51,5 |
29,0 |
0,019417 |
0,000377 |
0,563107 |
28,57204 |
0,427961 |
0,183151 |
841 |
|
52,0 |
27,0 |
0,019231 |
0,00037 |
0,519231 |
28,62263 |
-1,62263 |
2,632943 |
729 |
|
53,2 |
28,4 |
0,018797 |
0,000353 |
0,533835 |
28,74018 |
-0,34018 |
0,115725 |
806,56 |
|
54,0 |
28,6 |
0,018519 |
0,000343 |
0,52963 |
28,81565 |
-0,21565 |
0,046504 |
817,96 |
|
56,0 |
29,0 |
0,017857 |
0,000319 |
0,517857 |
28,99488 |
0,005125 |
2,63E-05 |
841 |
|
У Xi 1252 |
У Yi 846,3 |
У 1/ xi 0,87211 |
У (1/ xi)2 0,02537 |
У yi / xi 22,6305 |
У yx 846,353 |
У - 0,053 |
У 6,4527 |
Уyi2 22506,09 |
Находим коэффициенты a и b по формулам (1) и (2):
a = (846,3 • 0,02537 - 22,6305 • 0,87211) / (32 • 0,02537 - 0,76058) = (21,47063 - 19,73629) / (0,81184 - 0,76058) = 1,73434 / 0,05126 = 33,834;
b = (32 • 22,6305 - 0,87211 • 846,3) / 0,05126 = (724,176 - 738,067) / 0,05126 = - 13,891 / 0,05126 = - 270,991.
Полученное уравнение регрессии имеет вид
y = 33,834 - 270,991 / x.
Произведем проверку значимости уравнения регрессии по F - критерию Фишера. При этом сравним общую дисперсию Sy2 c остаточной S 2ост .
F ф = S y2 / S 2ост .
Здесь S 2ост = У(yi - yx)2/ (n - 2) = 6,4527 / 30 = 0,2151,
S y2 = ( Уyi2 - (( Уyi)2 / n )) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.
Тогда
F ф = 4,00 / 0,2151 = 18,596.
При уровне значимости б = 0,05 F ф > F st = 1,84. Следовательно, гиперболическое уравнение регрессии адекватно описывает фактическое изменение высот от диаметров деревьев. При этом значение F ф = 18,596 указывает на то, что уравнение гиперболы уже в 18 раз лучше описывает рассматриваемую взаимосвязь, чем среднее значение аргумента.
Статистическое заключение
По результатам регрессионного анализа можно сделать заключение о том, что линейное уравнение гиперболы, представленное результатами опыта y = 30,77 - 224,46 / x (красный график) в 18,596 раза лучше описывает изменение зависимой переменной, чем среднее значение аргумента.
Уравнение показательной кривой.
Для вычисления коэффициентов a и b уравнения
y = a b x
необходимо решить следующую систему нормальных уравнений:
n ln a + ln b У xi = У yi ,
ln a У xi + ln b У xi2 = У xi ln yi .
Решение системы относительно неизвестных a и b дает численные значения искомых коэффициентов:
ln a = (У yi У xi2 - У xi ln yi У xi) / (n У xi2 - (У xi)2), (3)
ln b = (n У xi ln yi - У xi У ln yi) / (n У xi2 - (У xi)2). (4)
Задание: Найти уравнение регрессии, описывающее фактические значения высот по диаметрам в основном древостое, используя уравнение показательной кривой.
Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 22.
Находим коэффициенты a и b по формулам (3) и (4):
ln a = (104,712 • 51935,68 - 4118,55 • 1252) / (32 • 51935,68 - (1252)2) = (5438756,345 -5156424,60) / (1661941,76 - 1567504) = 282331,745 / 94437,76 = 2,9896.
Отсюда при том, что основание натурального логарифма e = 2,7182 получим a = 19,88.
Ln b = (32 • 4118,55 - 1252 • 104,712) / 94437,76 = (131793,6 - 131099,424) / 94437,76 =
= 694,176 / 94437,76 = 0,00735.
Значит b = 1,007.
Таблица 22
Расчет вспомогательных величин для нахождения коэффициентов a и b
Диаметр Xi , см |
Высота Yi , м |
lnyi,м |
xi2 |
xi ln yi |
Y x |
yi- yx |
(yi- yx)2 |
yi2 |
|
24,0 |
22,2 |
3,100092 |
576 |
74,40221 |
23,50302 |
-1,30302 |
1,697862 |
492,84 |
|
24,5 |
22,5 |
3,113515 |
600,25 |
76,28113 |
23,58514 |
-1,08514 |
1,177523 |
506,25 |
|
25,3 |
23,0 |
3,135494 |
640,09 |
79,328 |
23,71712 |
-0,71712 |
0,514264 |
529 |
|
26,4 |
23,5 |
3,157 |
696,96 |
83,34481 |
23,89981 |
-0,39981 |
0,159846 |
552,25 |
|
27,0 |
23,7 |
3,165475 |
729 |
85,46783 |
24,00005 |
-0,30005 |
0,090028 |
561,69 |
|
28,5 |
24,0 |
3,178054 |
812,25 |
90,57453 |
24,25249 |
-0,25249 |
0,06375 |
576 |
|
29,0 |
24,6 |
3,202746 |
841 |
92,87965 |
24,33722 |
0,262777 |
0,069052 |
605,16 |
|
30,4 |
25,0 |
3,218876 |
924,16 |
97,85383 |
24,57606 |
0,423939 |
0,179724 |
625 |
|
31,5 |
25,5 |
3,238678 |
992,25 |
102,0184 |
24,76536 |
0,734637 |
0,539691 |
650,25 |
|
32,0 |
25,0 |
3,218876 |
1024 |
103,004 |
24,85189 |
0,148109 |
0,021936 |
625 |
|
32,8 |
25,8 |
3,250374 |
1075,84 |
106,6123 |
24,99096 |
0,809036 |
0,654539 |
665,64 |
|
33,5 |
26,0 |
3,258097 |
1122,25 |
109,1462 |
25,11329 |
0,886708 |
0,786251 |
676 |
|
35,0 |
26,5 |
3,277145 |
1225 |
114,7001 |
25,37744 |
1,122558 |
1,260136 |
702,25 |
|
36,6 |
26,4 |
3,273364 |
1339,56 |
119,8051 |
25,66227 |
0,737734 |
0,544251 |
696,96 |
|
37,5 |
27,0 |
3,295837 |
1406,25 |
123,5939 |
25,82388 |
1,176118 |
1,383254 |
729 |
|
38,0 |
27,5 |
3,314186 |
1444 |
125,9391 |
25,91411 |
1,585892 |
2,515054 |
756,25 |
|
39,5 |
27,8 |
3,325036 |
1560,25 |
131,3389 |
26,18668 |
1,613318 |
2,602796 |
772,84 |
|
40,2 |
26,9 |
3,292126 |
1616,04 |
132,3435 |
26,31486 |
0,585138 |
0,342387 |
723,61 |
|
42,0 |
27,3 |
3,306887 |
1764 |
138,8892 |
26,64736 |
0,652643 |
0,425943 |
745,29 |
|
43,5 |
28,0 |
3,332205 |
1892,25 |
144,9509 |
26,92764 |
1,072356 |
1,149948 |
784 |
|
44,0 |
27,0 |
3,295837 |
1936 |
145,0168 |
27,02173 |
-0,02173 |
0,000472 |
729 |
|
44,7 |
27,7 |
3,321432 |
1998,09 |
148,468 |
27,15399 |
0,546006 |
0,298123 |
767,29 |
|
45,3 |
28,1 |
3,33577 |
2052,09 |
151,1104 |
27,26788 |
0,832119 |
0,692421 |
789,61 |
|
46,0 |
28,5 |
3,349904 |
2116 |
154,0956 |
27,40135 |
1,098646 |
1,207023 |
812,25 |
|
48,5 |
28,0 |
3,332205 |
2352,25 |
161,6119 |
27,8834 |
0,116602 |
0,013596 |
784 |
|
49,0 |
28,5 |
3,349904 |
2401 |
164,1453 |
27,98082 |
0,51918 |
0,269548 |
812,25 |
|
50,6 |
28,3 |
3,342862 |
2560,36 |
169,1488 |
28,29486 |
0,005137 |
2,64E-05 |
800,89 |
|
51,5 |
29,0 |
3,367296 |
2652,25 |
173,4157 |
28,47306 |
0,526942 |
0,277668 |
841 |
|
52,0 |
27,0 |
3,295837 |
2704 |
171,3835 |
28,57254 |
-1,57254 |
2,472882 |
729 |
|
53,2 |
28,4 |
3,346389 |
2830,24 |
178,0279 |
28,81272 |
-0,41272 |
0,170335 |
806,56 |
|
54,0 |
28,6 |
3,353407 |
2916 |
181,084 |
28,97396 |
-0,37396 |
0,139843 |
817,96 |
|
56,0 |
29,0 |
3,367296 |
3136 |
188,5686 |
29,38101 |
-0,38101 |
0,145169 |
841 |
|
Уxi 1252 |
Уyi 846,3 |
Уln yi 104,712 |
У xi2 51935,68 |
Уxi ln yi 4118,55 |
У yx 837,664 |
У 8,636 |
У 21,865 |
Уyi2 22506,09 |
Полученное уравнение регрессии имеет вид
y = 19,88 • 1,007 x.
Произведем проверку значимости уравнения регрессии по F - критерию Фишера. При этом сравним общую дисперсию Sy2 c остаточной S 2ост .
F ф = S y2 / S 2ост .
Здесь S 2ост = У(yi - yx)2/ (n - 2) = 21,865 / 30 = 0,729,
S y2 = ( Уyi2 - (( Уyi)2 / n )) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.
Тогда
F ф = 4,00 / 0,729 = 5,487.
При уровне значимости б = 0,05 F ф > F st = 1,84. Следовательно, линейное уравнение показательной кривой адекватно описывает фактическое изменение высот от диаметров деревьев. При этом значение F ф = 5,487 указывает на то, что уравнение показательной кривой всего лишь в 5,487 раза лучше описывает рассматриваемую взаимосвязь, чем среднее значение аргумента.
Статистическое заключение
По результатам регрессионного анализа можно сделать заключение о том, что уравнение показательной кривой, представленное результатами опыта y = 19,88 • 1,007 x (красный график), в 5,487 раза лучше описывает изменение зависимой переменной.
Окончательный выбор типа уравнения регрессии
На практике может сложиться ситуация, когда несколько уравнений адекватно предсказывают значения. В этом случае наиболее подходящим уравнением регрессии является то, которое характеризуется наибольшим фактическим значением F - критерия Фишера.
Взаимное сравнение уравнений регрессии приведено в таблице 23.
Таблица 23
Взаимное сравнение уравнений регрессии
Вид уравнения Регрессии |
Дисперсия |
F - критерий |
|||
Общая |
Остаточная |
F ф |
F st |
||
y = - 0,5082 + 7,415 ln x |
4,00 |
0,353 |
11,33 |
1,84 |
|
y = 33,834 - 270,991 / x |
0,2151 |
18,596 |
|||
y = 19,88 • 1,007 x |
0,729 |
5,487 |
Взаимное сравнение показывает, что наилучшие результаты дает уравнение регрессии, выражаемое уравнением гиперболы (F ф = 18,596).
Расчет погрешностей и ошибок.
Рассчитаем погрешности и ошибки уравнений по следующим формулам:
абсолютная погрешность уравнения: д = +v(1/n) У(yi - yx)2,
Тогда д1 = + v(1/32) • 10,59007 = + 0,5753; д 2 = + v(1/32) • 6,4527 = + 0,4491;
д 3 = + v(1/32) • 21,8653 = + 0,8266.
Относительная погрешность уравнения
Д = + v(1/n)У((yi - yx)/yx)2 100,
Обозначим через Z i1 = (yi - yx)1 / yx1 , Z i2 = (yi - yx)2 / yx2 , Z i3 = (yi - yx)3 / yx3
Таблица 24
(yi - yx)1 |
(yi - yx)2 |
(yi - yx)3 |
yx1 |
yx2 |
yx3 |
Zi1 |
Zi2 |
Zi3 |
|
-0,85707 |
-0,34271 |
-1,30302 |
23,05707 |
22,54271 |
23,50302 |
-0,03717 |
-0,0152 |
-0,05544 |
|
-0,70996 |
-0,27314 |
-1,08514 |
23,20996 |
22,77314 |
23,58514 |
-0,03059 |
-0,01199 |
-0,04601 |
|
-0,44821 |
-0,12289 |
-0,71712 |
23,44821 |
23,12289 |
23,71712 |
-0,01912 |
-0,00531 |
-0,03024 |
|
-0,26379 |
-0,06919 |
-0,39981 |
23,76379 |
23,56919 |
23,89981 |
-0,0111 |
-0,00294 |
-0,01673 |
|
-0,23043 |
-0,0973 |
-0,30005 |
23,93043 |
23,7973 |
24,00005 |
-0,00963 |
-0,00409 |
-0,0125 |
|
-0,33134 |
-0,32554 |
-0,25249 |
24,33134 |
24,32554 |
24,25249 |
-0,01362 |
-0,01338 |
-0,01041 |
|
0,139701 |
0,110517 |
0,262777 |
24,4603 |
24,48948 |
24,33722 |
0,005711 |
0,004513 |
0,010797 |
|
0,190108 |
0,080178 |
0,423939 |
24,80989 |
24,91982 |
24,57606 |
0,007663 |
0,003217 |
0,01725 |
|
0,426542 |
0,268889 |
0,734637 |
25,07346 |
25,23111 |
24,76536 |
0,017012 |
0,010657 |
0,029664 |
|
-0,19023 |
-0,36553 |
0,148109 |
25,19023 |
25,36553 |
24,85189 |
-0,00755 |
-0,01441 |
0,00596 |
|
0,426673 |
0,227921 |
0,809036 |
25,37333 |
25,57208 |
24,99096 |
0,016816 |
0,008913 |
0,032373 |
|
0,470091 |
0,255284 |
0,886708 |
25,52991 |
25,74472 |
25,11329 |
0,018413 |
0,009916 |
0,035308 |
|
0,645294 |
0,4086 |
1,122558 |
25,85471 |
26,0914 |
25,37744 |
0,024958 |
0,01566 |
0,044234 |
|
0,213842 |
-0,02987 |
0,737734 |
26,18616 |
26,42987 |
25,66227 |
0,008166 |
-0,00113 |
0,028748 |
|
0,633712 |
0,392427 |
1,176118 |
26,36629 |
26,60757 |
25,82388 |
0,024035 |
0,014749 |
0,045544 |
|
1,035499 |
0,797342 |
1,585892 |
26,4645 |
26,70266 |
25,91411 |
0,039128 |
0,02986 |
0,061198 |
|
1,048431 |
0,826532 |
1,613318 |
26,75157 |
26,97347 |
26,18668 |
0,039191 |
0,030642 |
0,061608 |
|
0,018176 |
-0,19293 |
0,585138 |
26,88182 |
27,09293 |
26,31486 |
0,000676 |
-0,00712 |
0,022236 |
|
0,09338 |
-0,08183 |
0,652643 |
27,20662 |
27,38183 |
26,64736 |
0,003432 |
-0,00299 |
0,024492 |
|
0,533178 |
0,395678 |
1,072356 |
27,46682 |
27,60432 |
26,92764 |
0,019412 |
0,014334 |
0,039824 |
|
-0,55157 |
-0,67511 |
-0,02173 |
27,55157 |
27,67511 |
27,02173 |
-0,02002 |
-0,02439 |
-0,0008 |
|
0,031396 |
-0,07156 |
0,546006 |
27,6686 |
27,77156 |
27,15399 |
0,001135 |
-0,00258 |
0,020108 |
|
0,332528 |
0,248141 |
0,832119 |
27,76747 |
27,85186 |
27,26788 |
0,011975 |
0,008909 |
0,030516 |
|
0,618824 |
0,557109 |
1,098646 |
27,88118 |
27,94289 |
27,40135 |
0,022195 |
0,019937 |
0,040095 |
|
-0,2736 |
-0,24656 |
0,116602 |
28,2736 |
28,24656 |
27,8834 |
-0,00968 |
-0,00873 |
0,004182 |
|
0,150352 |
0,196429 |
0,51918 |
28,34965 |
28,30357 |
27,98082 |
0,005304 |
0,00694 |
0,018555 |
|
-0,2879 |
-0,17845 |
0,005137 |
28,5879 |
28,47845 |
28,29486 |
-0,01007 |
-0,00627 |
0,000182 |
|
0,281371 |
0,427961 |
0,526942 |
28,71863 |
28,57204 |
28,47306 |
0,009798 |
0,014978 |
0,018507 |
|
-1,79027 |
-1,62263 |
-1,57254 |
28,79027 |
28,62263 |
28,57254 |
-0,06218 |
-0,05669 |
-0,05504 |
|
-0,55944 |
-0,34018 |
-0,41272 |
28,95944 |
28,74018 |
28,81272 |
-0,01932 |
-0,01184 |
-0,01432 |
|
-0,47012 |
-0,21565 |
-0,37396 |
29,07012 |
28,81565 |
28,97396 |
-0,01617 |
-0,00748 |
-0,01291 |
|
-0,33978 |
0,005125 |
-0,38101 |
29,33978 |
28,99488 |
29,38101 |
-0,01158 |
0,000177 |
-0,01297 |
|
Z12 |
Z22 |
Z32 |
У Zi1 -0,00278 |
У Zi2 -0,003138 |
У Zi3 0,324011 |
||||
0,001382 |
0,000231 |
0,003074 |
Теперь находим Д 1 = + v (1/32) • 0,01486 • 100 = + 2,155 %;
Д 2 = + v (1/32) • 0,008574 • 100 = + 1,637 %; Д 3 = + v (1/32) • 0,03257 • 100 = + 3,190 %. Систематическая ошибка
op = (1/n)У((yi - yx)/yx) • 100, op1 = (1/32) • (- 0,00287) • 100 = - 0,0089; op2 = (1/32) • (- 0,003138) • 100 = - 0,0098; op3 = (1/32) • 0,324011 • 100 = 1,0125. |
||||||
0,000936 |
0,000144 |
0,002117 |
|||||||
0,000365 |
2,82E-05 |
0,000914 |
|||||||
0,000123 |
8,62E-06 |
0,00028 |
|||||||
9,27E-05 |
1,67E-05 |
0,000156 |
|||||||
0,000185 |
0,000179 |
0,000108 |
|||||||
3,26E-05 |
2,04E-05 |
0,000117 |
|||||||
5,87E-05 |
1,04E-05 |
0,000298 |
|||||||
0,000289 |
0,000114 |
0,00088 |
|||||||
5,7E-05 |
0,000208 |
3,55E-05 |
|||||||
0,000283 |
7,94E-05 |
0,001048 |
|||||||
0,000339 |
9,83E-05 |
0,001247 |
|||||||
0,000623 |
0,000245 |
0,001957 |
|||||||
6,67E-05 |
1,28E-06 |
0,000826 |
|||||||
0,000578 |
0,000218 |
0,002074 |
|||||||
0,001531 |
0,000892 |
0,003745 |
|||||||
0,001536 |
0,000939 |
0,003796 |
|||||||
4,57E-07 |
5,07E-05 |
0,000494 |
|||||||
1,18E-05 |
8,93E-06 |
0,0006 |
|||||||
0,000377 |
0,000205 |
0,001586 |
|||||||
0,000401 |
0,000595 |
6,46E-07 |
|||||||
1,29E-06 |
6,64E-06 |
0,000404 |
|||||||
0,000143 |
7,94E-05 |
0,000931 |
|||||||
0,000493 |
0,000398 |
0,001608 |
|||||||
9,36E-05 |
7,62E-05 |
1,75E-05 |
|||||||
2,81E-05 |
4,82E-05 |
0,000344 |
|||||||
0,000101 |
3,93E-05 |
3,3E-08 |
|||||||
9,6E-05 |
0,000224 |
0,000342 |
|||||||
0,003867 |
0,003214 |
0,003029 |
|||||||
0,000373 |
0,00014 |
0,000205 |
|||||||
0,000262 |
5,6E-05 |
0,000167 |
|||||||
0,000134 |
3,12E-08 |
0,000168 |
|||||||
У 0,01486 |
У 0,008574 |
У 0,03257 |
Случайная ошибка
oд = + ?(1/n)У{((yi - yx)/yx) • 100 - op }2,
Таблица 25
{((yi - yx)/yx)1 • 100 - op1 }2 |
{((yi - yx)/yx)2 • 100 - op2 }2 |
{((yi - yx)/yx)3 • 100 - op3 }2 |
|
13,75122 |
2,281497 |
42,9884 |
|
9,302281 |
1,415167 |
31,51067 |
|
3,619919 |
0,272149 |
16,29048 |
|
1,21257 |
0,080519 |
7,211095 |
|
0,91015 |
0,159244 |
5,119774 |
|
1,830279 |
1,764859 |
4,217187 |
|
0,336441 |
0,212599 |
0,00452 |
|
0,600872 |
0,10992 |
0,507665 |
|
2,924342 |
1,156708 |
3,817678 |
|
0,556935 |
2,048491 |
0,1735 |
|
2,857719 |
0,811959 |
4,949792 |
|
3,423361 |
1,002794 |
6,341996 |
|
6,273762 |
2,48325 |
11,63456 |
|
0,681489 |
0,010657 |
3,468091 |
|
5,819642 |
2,20424 |
12,54493 |
|
15,3796 |
8,974834 |
26,08454 |
|
15,42947 |
9,449718 |
26,50536 |
|
0,005855 |
0,493234 |
1,46677 |
|
0,123992 |
0,083556 |
2,064061 |
|
3,802772 |
2,082803 |
8,820086 |
|
3,972213 |
5,903078 |
1,194434 |
|
0,014975 |
0,061444 |
0,996557 |
|
1,455513 |
0,811319 |
4,158108 |
|
4,965788 |
4,014174 |
8,981759 |
|
0,919243 |
0,744896 |
0,353221 |
|
0,290791 |
0,495343 |
0,710624 |
|
0,996349 |
0,380445 |
0,988719 |
|
0,97743 |
2,272955 |
0,702527 |
|
38,55694 |
32,02724 |
42,46055 |
|
3,697604 |
1,377932 |
5,977598 |
|
2,586571 |
0,545488 |
5,304551 |
|
1,320651 |
0,000755 |
5,332831 |
|
У 148,596739 |
У 85,733267 |
У 292,882634 |
Таким образом,
oд1 = + v(1/32) • 148,597 = + 2,155; oд2 = + v(1/32) • 85,733 = + 1,637;
oд3 = + v(1/32) • 292,883 = + 3,025.
Чем меньше величина погрешностей и ошибок, тем надежнее уравнение описывает исследуемую взаимосвязь. В нашем случае это уравнение гиперболы.
Таблица 26
Линейное уравнение с логарифмированием факторного признака y = - 0,5082 + 7,415 ln x |
||||
Абсолютная погрешность уравнения д |
Относительная погрешность уравнения Д |
Систематическая ошибка op |
Случайная ошибка oд |
|
+ 0,5753 |
+ 2,155 % |
- 0,0089 |
+ 2,155 |
|
Уравнение гиперболы y = 33,834 - 270,991 / x |
||||
+ 0,4491 |
+ 1,637 % |
- 0,0098 |
+ 1,637 |
|
Уравнение показательной кривой y = 19,88 • 1,007 x |
||||
+ 0,8266 |
+ 3,190 % |
1,0125 |
+ 3,025 |
Список литературы
1. Герасимов Ю. Ю., Хлюстов В. К. Математические методы и модели в расчетах на ЭВМ. Применение в лесоуправлении и экологии: Учебник для лесных вузов. - М.: МГУЛ, 2001. - 260 с.
2. Гусева Л. М., Кузнецова Е. С., Моделирование экосистем: Методические указания к лабораторным работам для студентов специальности 260400 - Лесное хозяйство. Часть 1. / Нижегородская государственная сельскохозяйственная академия. - Нижний Новгород, 2005. - 45 с.