Рефераты - Афоризмы - Словари
Русские, белорусские и английские сочинения
Русские и белорусские изложения
 

Статистическая обработка и статистический анализ данных

Работа из раздела: «Статистика»

Министерство образования Российской Федерации

                 Южно-Уральский государственный университет

                        Кафедра Экономики и финансов


           Статистическая обработка и статистический анализ данных
              по материалам реального статистического наблюдения


                  Пояснительная записка к курсовому проекту
                             по курсу статистики


                                Руководитель
                                                                 Лазарева
                             Галина Владимировна

                                        «      »                     200- г.


                                Автор проекта



                                        «      »                     200- г.


                                                            Проект защищен с
                                     оценкой                               о
                                                                         . .

                                        «      »                     200- г.



                                  Челябинск
                                    200-
                                 Содержание

      Введение…………………………………………………………………………………….3

   1. Сводка и группировка данных статистического наблюдения……………...…………...4
   2. Вариационный анализ……………………………………………………………………...8
   3. Моделирование ряда распределения………………………………………………….….10
   4. Корреляционный анализ…………………………………………………………………..11
   5. Выборочное наблюдение…………………………………………………………………..14
   6. Анализ динамики…………………………………………………………………………..16

    Заключение……………………………………………………………………………………18
    Литература……………………………………………………………………………….……19
Приложения…………………………………………………………………………………………20



    Введение

    В данной работе представлена статистическая обработка и  статистический
анализ  данных  по  материалам  реального  статистического  наблюдения   над
численностью населения в возрасте моложе трудоспособного на 1.01.2002, чел.

    Актуальность  проводимого  исследования  ярко   проявляется   в   свете
современной  социально-экономической  и  демографической  ситуации  в  нашей
стране, когда вот уже на протяжении  нескольких  последних  лет  наблюдается
отрицательный естественный прирост (естественная убыль) населения.  Проблема
снижения рождаемости и старения населения  является  характерной  не  только
для России, но и для многих других развитых стран запада.

    Владение методами статистики дает  возможность  превращать  безликую  и
разрозненную массу числовых данных в стройную  систему  знаний,  основываясь
на которых можно принимать эффективные управленческие решения.

    Цель курсового проекта – освоить инструменты статистики для дальнейшего
применения в решении управленческих задач.

    Можно выделить следующие задачи данного курсового проекта:
-  приобрести   навыки   работы  с  большими  массивами  данных  и   навыки
  представления данных  статистического  наблюдения  в  виде,  удобном  для
  восприятия, анализа и принятия решений;
- освоить методы выполнения оценок параметров больших  множеств  по  данным
  выборочного наблюдения;
-  развить  аналитические  навыки  в  ходе   применения   вариационного   и
  корреляционного методов и интерпретации полученных результатов.

    Таким образом, проводимый статистический анализ позволит сделать выводы
о характеристиках исследуемого показателях и тенденциях его развития.



    1. Сводка и группировка данных статистического наблюдения

    Результаты  статистического  наблюдения  регионов  РФ   по   показателю
'Численность населения в возрасте моложе трудоспособного  на  1.01.2002  г.,
чел.' представим в виде простой сводки, т.е. в единый документ  без  какого-
либо ранжирования или разделения на группы. (Таблица 1.1)

Таблица 1.1- Численность населения в возрасте моложе трудоспособного на
1.01.2002 г., чел.

|Регион                        |Численность населения в возрасте моложе      |
|                              |трудоспособного на 1.01.2002 г., чел.        |
|Белгородская область          |272081                                       |
|Брянская область              |258812                                       |
|Владимирская область          |260718                                       |
|Воронежская область           |408451                                       |
|Ивановская область            |190699                                       |
|Калужская область             |177752                                       |
|Костромская область           |135393                                       |
|Курская область               |224612                                       |
|Липецкая область              |212032                                       |
|Московская область            |990986                                       |
|Орловская область             |152332                                       |
|Рязанская область             |204469                                       |
|Смоленская область            |184672                                       |
|Тамбовская область            |212447                                       |
|Тверская область              |256525                                       |
|Тульская область              |261924                                       |
|Ярославская область           |221876                                       |
|г. Москва                     |1348893                                      |
|Республика Карелия            |137425                                       |
|Республика Коми               |214022                                       |
|Архангельская область         |265673                                       |
|Вологодская область           |239365                                       |
|Калининградская область       |165465                                       |
|Ленинградская область         |268037                                       |
|Мурманская область            |164789                                       |
|Новгородская область          |121690                                       |
|Псковская область             |131185                                       |
|г. Санкт-Петербург            |681209                                       |
|Республика Адыгея             | 86616                                       |
|Республика Дагестан           |685577                                       |
|Республика Ингушетия          |138822                                       |
|Кабардино-Балкарская          |193530                                       |
|Республика                    |                                             |
|Республика Калмыкия           | 77289                                       |
|Карачаево-Черкесская          |  97987                                      |
|Республика                    |                                             |
|Республика Северная           |142074                                       |
|Осетия-Алания                 |                                             |
|Чеченская Республика          |199841                                       |
|Краснодарский край            |947077                                       |
|Ставропольский край           |524337                                       |
|Астраханская область          |203780                                       |
|Волгоградская область         |475016                                       |
|Ростовская область            |760726                                       |
|Республика Башкортостан       |888812                                       |
|Республика Марий Эл           |152830                                       |
|Республика Мордовия           |164596                                       |
|Республика Татарстан          |769340                                       |
|Удмуртская Республика         |326297                                       |
|Чувашская Республика          |275529                                       |
|Кировская область             |272759                                       |
|Нижегородская область         |600910                                       |
|Оренбургская область          |450187                                       |
|Пензенская область            |257616                                       |
|Пермская область              |563021                                       |
|Самарская область             |564441                                       |
|Саратовская область           |478167                                       |
|Ульяновская область           |265331                                       |
|Курганская область            |209522                                       |
|Свердловская область          |808090                                       |
|Тюменская область             |693732                                       |
|Челябинская область           |674104                                       |
|Республика Алтай              |  53706                                      |
|Республика Бурятия            |235795                                       |
|Республика Тыва               |  97443                                      |
|Республика Хакасия            |116575                                       |
|Алтайский край                |479633                                       |
|Красноярский край             |592171                                       |
|Иркутская область             |572401                                       |
|Кемеровская область           |540088                                       |
|Новосибирская область         |480946                                       |
|Омская область                |415839                                       |
|Томская область               |194853                                       |
|Читинская область             |279006                                       |
|Республика Саха (Якутия)      |253905                                       |
|Приморский край               |388798                                       |
|Хабаровский край              |279700                                       |
|Амурская область              |198256                                       |
|Камчатская область            |  69028                                      |
|Магаданская область           |  40710                                      |
|Сахалинская область           |109353                                       |
|Еврейская авт. область        |  41034                                      |
|Чукотский авт. округ          |  14577                                      |

    Построим две  простые  группировки  регионов  Российской  Федерации  по
данному показателю.
    В первой группировке выделим группы регионов  со  значением  показателя
ниже и выше среднего по  Российской  Федерации.  Для  этого  найдем  среднее
значение  данного  показателя  по  РФ.  Так  как   показатель   'Численность
населения в возрасте моложе трудоспособного на 1.01.2002 г., чел.'  является
абсолютным,  его  среднее  значение  будем   искать   по   формуле   средней
арифметической простой. Получим среднее значение:
           ? Х i

             n
    Результаты простой группировки представлены в Таблице 1.2
    Таблица 1.2 -  Простая  группировка  с  выделением  групп  регионов  со
               значением показателя ниже и выше среднего по РФ
|                           |Количество регионов   |Среднее значение         |
|                           |                      |показателя в группе, чел.|
|Регионы со значением       |54                    |184858                   |
|показателя ниже среднего по|                      |                         |
|РФ                         |                      |                         |
|Регионы со значением       |26                    |645498                   |
|показателя выше среднего по|                      |                         |
|РФ                         |                      |                         |

    Для наглядности представим данную группировку в виде диаграммы.
    Диаграмма 1.1 - Простая группировка  с  выделением  групп  регионов  со
                    значением показателя ниже и выше среднего по РФ
    Т.к. данный показатель является абсолютным, то мы не  можем  сравнивать
значения показателей по  регионам,  вследствие  их  зависимости  от  размера
территории и общего количества населения. Для возможности  такого  сравнения
построим вторую простую группировку, в которой выделим  группы  регионов  со
значением показателя 'Доля населения в возрасте  моложе  трудоспособного  на
1.01.2002 г., %' ниже  и  выше  среднего  по  Российской  Федерации.  Расчет
значений этого показателя по регионам  и  среднего  значения  представлен  в
Приложении А (Российский статистический ежегодник  2002  (стр.  90,  таблица
5.9))
    Результаты простой группировки представлены в Таблице 1.3
    Таблица 1.3 -  Простая  группировка  с  выделением  групп  регионов  со
               значением  показателя  'Доля  населения  в  возрасте  моложе
               трудоспособного на 1.01.2002 г., %' ниже и выше среднего  по
               РФ
|                           |Количество регионов   |Среднее значение         |
|                           |                      |показателя в группе, %   |
|Регионы со значением       |44                    |17,3                     |
|показателя ниже среднего по|                      |                         |
|РФ                         |                      |                         |
|Регионы со значением       |36                    |22,1                     |
|показателя выше среднего по|                      |                         |
|РФ                         |                      |                         |

    Для наглядности сопроводим группировки графиками:

     Диаграмма 1.2 - Простая группировка с  выделением  групп  регионов  со
                    значением показателя 'Доля населения в  возрасте  моложе
                    трудоспособного на 1.01.2002 г., %' ниже и выше среднего
                    по РФ
    Таким  образом,  если  сопоставить   абсолютные   значения   показателя
'Численность населения в возрасте моложе трудоспособного  на  1.01.2002  г.,
чел.' по регионам  со  средним  значением  по  РФ,  то  значительно  большее
количество регионов характеризуется значением показателя  ниже  среднего  по
РФ (54 региона против 26). Но  если  использовать  относительный  показатель
'Доля населения в возрасте  моложе  трудоспособного  на  1.01.2002  г.,  %',
дающий возможность сравнения,  то  можно  увидеть,  что  число  регионов  со
значением показателя ниже среднего по РФ приближается к  числу  регионов  со
значением показателя выше среднего по РФ (44 и 36 регионов соответственно).
    2. Вариационный анализ

    Первый этап вариационного анализа - построение вариационного  ряда.  На
этом  этапе  важно  правильно  определить,  ряд  какого  вида  целесообразно
построить. Т.к. изучаемый признак – чмсленность населения в возрасте  моложе
трудоспособного – относится к  непрерывному  виду,  то  строим  интервальный
вариационный ряд. Для построения  вариационного  ряда  определим  количество
интервалов в ряду и длину интервала. Воспользуемся формулой Стержесса:
    Количество интервалов  k = 1 + 3,32 * lg80 = 7,3.
    В качестве длины  интервала  l  выберем  целочисленное  и  удобное  для
восприятия значение в интервале от l2 до l1:
    l1 = (1348893-14577)/7 = 190617
    l2 = (1348893-14577)/8 = 166790
    Получим вариационный ряд, состоящий  из  7  интервалов  длиной  180000.
(Таблица 2.1).
    Таблица 2.1 - Вариационный ряд

|Численность        |Менее  |180-360|360-540|540-720|720-90|900-108|Более  |
|населения в        |180    |       |       |       |0     |0      |1080   |
|возрасте моложе    |       |       |       |       |      |       |       |
|трудоспособного на |       |       |       |       |      |       |       |
|1.01.2002 г., тыс. |       |       |       |       |      |       |       |
|чел.               |       |       |       |       |      |       |       |
|Число регионов     |23     |31     |9      |10     |4     |2      |1      |


    Графически интервальный вариационный ряд изображается гистограммой:

    Диаграмма 2.1 - Вариационный ряд

    Второй  этап  вариационного  анализа  -  расчет  показателей   вариации
(Приложение Б). Оформим его в виде таблицы:
    Таблица 2.2 - Показатели вариации
|Показатель   |Значение   |Качественная оценка                               |
|Среднее      |339750     |На 1.01.2002 средняя численность населения в      |
|значение     |           |возрасте моложе трудоспособного по регионам РФ    |
|             |           |составляла 339750 чел.                            |
|Показатели структуры вариации                                                 |
|Мода         |228000     |Наиболее часто встречающееся значение численности |
|             |           |населения в возрасте моложе трудоспособного       |
|             |           |составляет около 228000 чел.                      |
|Медиана      |278710     |40 регионов РФ характеризуется численностью       |
|             |           |населения в возрасте моложе трудоспособного ниже  |
|             |           |278710 чел. и 40 регионов выше                    |
|Показатели силы и интенсивности вариации                                      |
|Размах       |976409     |Даже исключив из совокупности регион с аномальным |
|вариации     |           |значением показателя (г. Москва - 1348893 чел.),  |
|             |           |найдем, что абсолютный разброс значений признака  |
|             |           |чрезвычайно высок.                                |
|Среднее      |197663     |Значения численности населения в возрасте моложе  |
|линейное     |           |трудоспособного по регионам на 1.01.2002          |
|отклонение   |           |отличались в среднем на 197663 чел. от среднего   |
|             |           |значения 339750 чел.                              |
|Дисперсия    |61959937500|Квадрат отклонений значений признака по регионам  |
|             |           |от среднего значения по всей стране равен         |
|             |           |61959937500 чел.2                                 |
|Среднее      |248918     |СКО является мерой надежности средней величины:   |
|квадратическо|           |чем оно меньше, тем точнее средняя арифметическая |
|е отклонение |           |отражает собой всю изучаемую совокупность         |
|Относительный|287%       |Разница между максимальным и минимальным          |
|размах       |           |значениями превышает среднее значение почти в 3   |
|вариации     |           |раза, т.е. относительный разброс значений признака|
|             |           |также чрезвычайно высок                           |
|Относительное|58%        |Доля усредненного значения абсолютных отклонений  |
|линейное     |           |от средней величины равна 58%                     |
|отклонение   |           |                                                  |
|Коэффициент  |73%        |По численности населения в возрасте моложе        |
|вариации     |           |трудоспособного совокупность является неоднородной|
|Показатели характера вариации                                                 |
|Коэффициент  |0,45       |Распределение умеренно асимметрично, асимметрия   |
|асимметрии   |           |правосторонняя (смещение в область более низких   |
|             |           |значений показателя)                              |
|Показатель   |0,88       |Распределение островершинное                      |
|эксцесса     |           |                                                  |



   3. Моделирование ряда распределения

    Нормальное  распределение  -  распределение,  полностью  определяющееся
двумя параметрами - средним значением и СКО.
    Причина частого обращения именно  к  закону  нормального  распределения
заключается в том, что в этом типе распределения отражается  закономерность,
возникающая при взаимодействии множества  случайных  факторов,  ни  один  из
которых не является преобладающим.
    Проверим  гипотезу  о  нормальном  законе  распределения.   Для   этого
воспользуемся  критерием  согласия  Пирсона   (хи-квадрат).   Идея   Пирсона
заключается в расчете и последующей оценке  размера  отклонений  фактических
значений частоты  появления  признака  по  интервалам  от  их  теоретических
значений, т.е.  значений,  которые  бы  имели  место  в  случае  нормального
распределения. Чем больше  размер  этих  отклонений,  тем  меньше  оснований
считать распределение близким к нормальному.
    Результаты проверки гипотезы представлены в Приложении В.
    Т.к. значение Хи-квадрат расчетное (28,09) больше  значения  Хи-квадрат
табличное  (9,488),  то  гипотеза  о  нормальном   характере   распределения
отклоняется.  Этот  результат  не  явился  неожиданным,  т.к.  в  социально-
экономической статистике  нормальное  распределение  практически  вообще  не
встречается;  однако  сравнение  с  нормальным  распределением   важно   для
выяснения   степени   и   характера   отклонений   от   него    фактического
распределения.
    Проанализируем  характер  отклонений  в  параметрах  распределения   от
нормального. Построим график распределения.
Диаграмма 3.1 - График распределения


    Анализируя график и  используя  данные  вариационного  анализа,  делаем
вывод  о  том,  что  распределение  островершинное,  имеет  место  умеренная
правосторонняя асимметрия.
    4. Корреляционный анализ

    Следующим  пунктом  статистического  исследования  является  проведение
корреляционного анализа, задачей  которого  является  оценка  тесноты  связи
между признаками.

    Прежде всего, выделим признаки,  наличие  связи  с  которыми  мы  будем
проверять:
 >  Численность   учащихся   государственных   дневных   общеобразовательных
   учреждений (на начало учебного года 2001/02), тысяч человек;
 > Строительство жилых домов в 1 полугодии 2002г., тыс. кв. м общей площади.

 (Значения этих показателей по регионам представлены в Приложении Г).

Корреляционный анализ будем проводить в 4 этапа:
1)  Построим  корреляционную  решетку  (аналитическую   группировку   единиц
   совокупности по двум признакам, между которыми оценивается связь).
2)  Построим  поле   корреляции   (Графическое   изображение   связи   между
   переменными, множество точек, координатами которых являются пары значений
   признаков по всем единицам совокупности)
3)   Рассчитаем   показатели   корреляции:   коэффициент   Фехнера    (очень
   приближенный показатель (не учитывает величину отклонений  индивидуальных
   значений признака от его средней величины),  но  по  его  значению  можно
   сделать первые выводы о наличии  или  отсутствии  связи)  и  эмпирическое
   корреляционное отношение (оценивает тесноту связи с высокой  точностью  и
   подходит для любых зависимостей).
4) Произведем анализ и оценку наличия, направления и тесноты  корреляционной
   связи.

    Численность населения в возрасте моложе трудоспособного на 1.01.2002 г.,
    чел.   (X)    и    численность    учащихся    государственных    дневных
    общеобразовательных учреждений (на начало учебного года  2001/02),  тыс.
    чел. (Y).

1) Исключим из  совокупности  г.  Москву  и  Московскую  обл.  как  регионы,
характеризующиеся аномальными значениями признака Y.
|               |Менее  |100-200|200-300|300-400|400-500 |500-600 |600-   |
|Y              |100    |       |       |       |        |        |700    |
|               |       |       |       |       |        |        |       |
|X              |       |       |       |       |        |        |       |
|Менее 180000   |15     |8      |-      |-      |-       |-       |-      |
|180000-360000  |-      |26     |5      |-      |-       |-       |-      |
|360000-540000  |-      |       |1      |8      |-       |-       |-      |
|540000-720000  |-      |-      |-      |2      |7       |1       |-      |
|720000-900000  |-      |-      |-      |-      |-       |3       |1      |
|900000-1080000 |-      |-      |-      |-      |-       |-       |1      |


2)

3) Коэффициент Фехнера = 1,0 (Расчеты представлены в Приложении Д).
    Эмпирическое корреляционное отношение =  0,97  (Расчеты  представлены  в
Приложении Е).
4) По расположению и концентрации  единиц  на  поле  корреляционной  решетки
можно с уверенностью предположить наличие прямой тесной  связи  между  двумя
данными признаками.
     Анализируя график,  оцениваем,  что  характер  распределения  точек  на
координатном поле подтверждает предположения о наличии прямой  тесной  связи
между данными признаками.
     Т.к. полученные значения коэффициентов корреляции  превышают  пороговые
значения (0,5 для коэффициента Фехнера и 0,7  для  ЭКО),  то  можно  сделать
окончательный вывод о  том,  что  данные  показатели  связаны  тесно  (связь
линейная).
       Следовательно,  можно   построить   уравнение   регрессии   и   иметь
возможность прогнозировать значения признака-результата.

    Численность населения в возрасте моложе трудоспособного на 1.01.2002 г.,
    чел. (X) и строительство жилых домов в 1 полугодии 2002г.,  тыс.  кв.  м
    общей площади (Y).

1) Исключим из  совокупности  г.  Москву  и  Московскую  обл.  как  регионы,
характеризующиеся аномальными значениями признака Y.
|             |Менее  |60-120 |120-180 |180-240 |240-300 |300-360 |Более  |
|Y            |60     |       |        |        |        |        |360    |
|             |       |       |        |        |        |        |       |
|X            |       |       |        |        |        |        |       |
|Менее 180000 |21     |1      |-       |-       |-       |-       |-      |
|180000-360000|17     |9      |2       |2       |-       |-       |-      |
|360000-540000|-      |4      |2       |1       |2       |-       |-      |
|540000-720000|1      |3      |3       |1       |1       |1       |-      |
|720000-900000|-      |-      |1       |1       |-       |1       |1      |
|900000-108000|-      |-      |-       |-       |-       |-       |1      |
|0            |       |       |        |        |        |        |       |

2)

3) Коэффициент Фехнера = 0,71 (Расчеты представлены в Приложении Ж).
    Эмпирическое корреляционное отношение =  0,63  (Расчеты  представлены  в
Приложении З).
4) По расположению и концентрации  единиц  на  поле  корреляционной  решетки
сделать   предположение  о  наличии  слабой  связи   между   двумя   данными
признаками.
     Это предположение подтверждает и анализ графика.
     Полученное значение коэффициента Фехнера говорит о наличии связи  между
данными показателями, но более точный показатель корреляции  -  эмпирическое
корреляционное отношение - свидетельствует о том, что связь имеется,  но  не
является тесной (значение ЭКО немного меньше порогового).



   5. Выборочное наблюдение

    Сформируем 2 выборочных совокупности, отобрав  соответственно 19 (малая
выборка) и 39 региона из 80. По методу отбора выберем  бесповторную  выборку
(попавший в выборку регион  не  возвращается  в  исходную  совокупность,  из
которой  осуществляется  дальнейший  отбор).  По  способу   отбора   выберем
собственно случайную выборку как  наиболее  простую  (заключается  в  отборе
единиц из генеральной  совокупности  наугад  или  на  удачу  без  каких-либо
элементов системности; технически проводится методом жеребьевки).
    Сформированные выборки представлены в Приложениях И и К.
    Данные о генеральной средней уже имеются Xср = 334566 чел.
    Рассчитаем  предельную  ошибку  выборки,  учитывая,   что   отбор   был
произведен  бесповторным  способом.  Ошибка  возникает  в  силу  того,   что
выборочная   совокупность    не    полностью    воспроизводит    генеральную
совокупность.
    Так  первая  выборка  является  малой,  то  предельные   ошибки   будут
рассчитывать по разным формулам.
    Первая (малая) выборка:
    Предельная ошибка выборки:
                            ?2    N - n
                           n-1    N - 1  ,

    где tст – коэффициент  Стьюдента,  который  находится  по  таблицам  по
входным параметрам: df=n-1=19-1=18, ?=1-F(t), ?2 – выборочная дисперсия  (?2
= 37444958842).
    F(t)=0,612, ?=0,388, tст=1,067, ?Х=42765 чел., 318996 чел. ? ? ? 404525
чел.
    F(t)=0,812, ?=0,188, tст=1,734, ?Х=69499 чел., 292262 чел. ? ? ? 431260
чел.
    F(t)=0,912, ?=0,088, tст=2,101, ?Х=84208 чел., 277553 чел. ? ? ? 445969
чел.
    F(t)=0,960, ?=0,040, tст=2,552, ?Х=102284  чел.,  259477  чел.  ?  ?  ?
464045 чел.
    Вторая выборка:
    Предельная ошибка выборки:
                             ?2   N - n
                              n    N - 1  ,

    где t – коэффициент доверия, который находится  по  таблицам  интеграла
вероятности таблицам по входному параметру F(t), ?2 – генеральная  дисперсия
(?2 = 61959937500).
    F(t)=0,612, t=0,87, ?Х=24982 чел., 323955 чел. ? ? ? 373919 чел.
    F(t)=0,812, t=1,32, ?Х=37904 чел., 311033 чел. ? ? ? 386841 чел.
    F(t)=0,912, t=1,71, ?Х=49103 чел., 299834 чел. ? ? ? 398040 чел.
    F(t)=0,960, t=2,06, ?Х=59153 чел., 289784 чел. ? ? ? 408090 чел.
    Вывод: при любой из заданных вероятностей значение генеральной средней,
полученное  путем  расчетов  по   генеральной   совокупности,   попадает   в
доверительный интервал для генеральной средней, рассчитанный как  по  малой,
так  и  по   большой   выборкам.   Это   объясняется,   во-первых,   высокой
репрезентативностью   сформированных   выборок,   а   во-вторых,    большими
значениями предельных ошибок вследствие большого значения  дисперсий.  Кроме
того, чем выше вероятность, тем шире доверительный интервал для  генеральной
средней особенно для малой выборки.



   6. Анализ динамики

    Проанализируем динамику показателя 'Доля русского населения  в  РФ'  за
1926-1989 годы.
    Построим ряд динамики  (Таблица  6.1),  используя  данные  'Российского
статистического  ежегодника.  2002'  о  национальном  составе  населения  по
данным переписей (стр.91).
Таблица 6.1 – Доля русского населения в РФ

|Год               |1926   |1939   |1959   |1970   |1979   |1989   |
|Доля русского     |73,6   |82,9   |83,3   |82,8   |82,6   |81,5   |
|населения в РФ, % |       |       |       |       |       |       |

    Рассчитаем показатели динамики и тенденции динамики (Приложение Л).
    Анализ полученных числовых данных позволяет сделать следующие выводы:
     . абсолютная скорость роста ряда не является постоянной: наблюдается то
       приращение ряда (?y>0), то сокращение (?y<0);
     . приращение и  сокращение  ряда  также  не  являются  постоянными:  то
       замедляются (??<0), то ускоряются (??>0);
     . показатель интенсивности изменения уровня ряда  говорит  о  том,  что
       наблюдается то рост (Тр>1), то снижение (Тр<1);
     . относительная скорость изменения уровней ряда в единицу времени (год)
       также постоянно меняется (Тпр>0 и Тпр<0);
     . среднегодовая доля русского населения в РФ за период с 1926  по  1989
       годы составляла 81%;
     . за период с 1926 по 1989 год доля русского населения в РФ  возрастала
       в среднем на 0,1 процентных пунктов каждый год;
     . каждый год с 1926 по 1989 доля русского населения в РФ  увеличивалась
       в среднем в 1,021 раз.
    Для выбора вида уравнения динамики (тренда) и расчета параметров тренда
используем графический метод:
    1) нанесем  на  поле  координат  (время  -  значение  признака)  точки,
       соответствующие значениям признака в каждый период времени;
    2) на основе визуальной оценки расположения  точек  на  поле  координат
       проведем  прямую  линию,   наиболее   точно   отражающую   тенденцию
       распределения точек;
    3) выберем на проведенной прямой две произвольные точки и, используя их
       координаты, запишем  и  решим  систему  уравнений,  определив  таким
       образом, параметры уравнения;
    4)  запишем уравнение динамики.

    а + b * 1948 = 80
         а + b * 1965 = 82
    y = -153,8 + 0,12*t
Рассчитаем показатели колеблемости (Приложение М).
    Так как полученные значения показателей колеблемости низкие,  то  можно
говорить об  устойчивости   тенденции  динамики  и  использовать  полученное
уравнение тренда y = -153,8 + 0,12*t для прогнозирования.



    Заключение

    После проведения многостороннего исследования  показателя  'Численность
населения в возрасте моложе трудоспособного' могут  быть  сделаны  следующие
выводы:
1. если сопоставить абсолютные значения показателя 'Численность населения  в
   возрасте моложе трудоспособного на 1.01.2002 г.,  чел.'  по  регионам  со
   средним значением по  РФ,  то  значительно  большее  количество  регионов
   характеризуется значением показателя ниже  среднего  по  РФ  (54  региона
   против 26). Но если использовать относительный показатель 'Доля населения
   в возрасте моложе трудоспособного на 1.01.2002 г., %', дающий возможность
   сравнения, то можно увидеть, что число регионов со  значением  показателя
   ниже среднего по РФ приближается к числу регионов со значением показателя
   выше среднего по РФ (44 и 36 регионов соответственно);
2.  на  1.01.2002  средняя   численность   населения   в   возрасте   моложе
   трудоспособного по регионам РФ составляла 339750 чел, однако абсолютный и
   относительный разброс значений признака также чрезвычайно высок;
3. т.к. значение Хи-квадрат расчетное  (28,09)  больше  значения  Хи-квадрат
   табличное (9,488),  то  гипотеза  о  нормальном  характере  распределения
   отклоняется. Этот результат не  явился  неожиданным,  т.к.  в  социально-
   экономической статистике нормальное распределение практически  вообще  не
   встречается; однако  сравнение  с  нормальным  распределением  важно  для
   выяснения  степени  и   характера   отклонений   от   него   фактического
   распределения;
4. установлено наличие прямой тесной связи данного показателя с  показателем
   'Численность   учащихся   государственных   дневных   общеобразовательных
   учреждений (на начало учебного года 2001/02),  тысяч  человек'  и  связи,
   близкой к тесной, с показателем 'Строительство жилых домов в 1  полугодии
   2002г., тыс. кв. м общей площади';
5.  при  любой  из  заданных  вероятностей  значение  генеральной   средней,
   полученное  путем  расчетов  по  генеральной  совокупности,  попадает   в
   доверительный интервал  для  генеральной  средней,  рассчитанный  как  по
   малой, так и по большой выборкам.  Это  объясняется,  во-первых,  высокой
   репрезентативностью  сформированных  выборок,   а   во-вторых,   большими
   значениями предельных ошибок вследствие большого значения дисперсий;
6. среднегодовая доля русского населения в РФ за период с 1926 по 1989  годы
   составляла 81%; так  как  полученные  значения  показателей  колеблемости
   низкие,  то  можно  говорить  об  устойчивости   тенденции   динамики   и
   использовать  полученное  уравнение  тренда  y  =  -153,8  +  0,12*t  для
   прогнозирования.

    Литература

   1. Конспект лекций Таланкиной Е. А.

   2. Лазарева Г. В., Богданчикова М.  Ю.  Статистика/  Учебное  пособие  по
      выполнению курсового проекта. -Челябинск, 2003.

   3.  Российский  статистический  ежегодник:  Официальное   издание.   –М.:
      Госкомстат, 2002.


-----------------------
?Х = t*


[pic]

[pic]

[pic]

[pic]

Численность населения в возрасте моложе трудоспособного, тыс. чел.

_
Х =


= 334566 чел.



[pic]

?Х = tст*


?


[pic]

?


[pic]

а= -153,8; b=0,12



ref.by 2006—2022
contextus@mail.ru