Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Лабораторная работа, 05 Февраля 2014, автор: пользователь скрыл имя
Краткое описание
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные о среднегодовой стоимости основных производственных фондов и выпуске продукции за год по 32-м предприятиям, выпускающим однотипную продукцию (выборка 10%-ная, механическая).
В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации.
Прикрепленные файлы: 1 файл
Отчет.doc
— 507.00 Кб (Скачать документ)2. Для дальнейшего анализа формы распределения используются описательные параметры выборки – показатели центра распределения ( , Mo, Me), вариации ( ), асимметрии в центральной части распределения (AsП). Совокупность этих показателей позволяет дать качественную оценку близости эмпирических данных к нормальной форме распределения.
Нормальное распределение является симметричным, и для него выполняются соотношения:
Нарушение этих соотношений свидетельствует о наличии асимметрии распределения. Распределения с небольшой или умеренной асимметрией в большинстве случаев относятся к нормальному типу.
3. Для анализа длины «хвостов» распределения используется правило «трех сигм». Согласно этому правилу в нормальном и близким к нему распределениях крайние значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем лежащие в диапазоне ( ). Следовательно, по проценту выхода значений признака за пределы диапазона ( ) можно судить о соответствии длины «хвостов» распределения нормальному закону.
Вывод:
1. Гистограмма распределения предприятий по признаку Среднегодовая стоимость основных производственных фондов является одновершинной (многовершинной).
2. Распределение
предприятий по признаку Средне
3. “Хвосты” распределения не очень длинны (являются длинными), т.к. согласно графе 5 табл.9…..……% вариантов лежат за пределами интервала ( )=(………………;…………….) млн. руб.
Следовательно, на основании п.п. 1,2,3, можно (нельзя) сделать заключение о близости изучаемого распределения предприятий по признаку Среднегодовая стоимость основных производственных фондов к нормальному.
II. Статистический анализ генеральной совокупности
Задача 1. Рассчитанные в табл.3 рабочего файла EXCEL генеральные показатели представлены в табл.10
Таблица 10 - Описательные статистики генеральной совокупности
Обобщающие статистические показатели совокупности по изучаемым признакам |
Признаки | |
Среднегодовая стоимость основных производственных фондов |
Выпуск продукции | |
Стандартное отклонение , млн. руб. |
||
Дисперсия |
||
|
Асимметричность As |
||
Эксцесс Ek |
||
Для нормального распределения справедливо равенство:
RN=6∙sN.
В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.
Вывод:
Ожидаемый размах вариации признаков RN:
- для признака Среднегодовая стоимость основных производственных фондов RN = 6∙………………=...............,
- для признака Выпуск продукции RN = 6∙………………=...............,
Соотношение между генеральной (табл. 10) и выборочной (табл. 8) дисперсиями:
- для признака Среднегодовая стоимость основных производственных фондов ……, т.е. расхождение между дисперсиями незначительное (значительное);
-для признака Выпуск продукции ……, т.е. расхождение между дисперсиями незначительное (значительное).
Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.
Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность
определяет ошибку репрезентативности для средней величины признака.
Так как ошибки выборки всегда случайны, вычисляют среднюю и предельную ошибки выборки.
1. Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой) выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней .
Для изучаемых признаков средние ошибки выборки даны в табл.3 рабочего файла EXCEL:
- для признака Среднегодовая стоимость основных производственных фондов
=……………….,
- для признака Выпуск продукции
=………………..
2. Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.
Для уровней надежности P=0,954; P=0,683 оценки предельных ошибок выборки даны в табл. 3 и табл. 4 рабочего файла EXCEL.
Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
,
Предельные ошибки выборки
и ожидаемые границы для
Таблица 11 - Предельные ошибки выборки и ожидаемые границы для генеральных средних
Доверительная вероятность Р |
Коэффициент доверия (по табл. Стьюдента) t |
Предельные ошибки выборки, D, млн. руб. |
Ожидаемые границы для средних | ||
Среднегодовая стоимость ОПФ |
Выпуск продукции |
Среднегодовая стоимость ОПФ |
Выпуск продукции | ||
А |
1 |
2 |
3 |
4 |
5 |
0,683 |
1,02 |
||||
|
0,954 |
2,08 |
||||
Вывод:
Увеличение уровня надежности (доверительной вероятности) ведет к расширению (сужению) ожидаемых границ для генеральных средних.
Задача 3. Рассчитанные в табл.3 рабочего файла EXCEL значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.
1.Показатель асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.
Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более низких значений признака, чем среднее (среднее значение больше центрального Me и модального Mo).
Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более высокие значения признака, чем среднее (среднее значение меньше центрального Me и модального Mo).
Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:
|As| 0,25 - асимметрия незначительная;
0,25<|As| 0,5 - асимметрия заметная (умеренная);
|As|>0,5 - асимметрия существенная.
Вывод:
Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная (заметная, существенная) левосторонняя (правосторонняя) асимметрия. Следовательно, в распределении преобладают значения, более……………………………, чем среднее.
Для признака Выпуск продукции наблюдается незначительная (заметная, существенная) левосторонняя (правосторонняя) асимметрия. Следовательно, в распределении преобладают значения, более…………………………., чем среднее.
2.Показатель эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.
Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.
Если Ek>0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.
Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону от xmax до xmin.
Для нормального распределения Ek=
При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения.
Вывод:
1. Так как для признака Среднегодовая стоимость основных производственных фондов Ek>0 (Ek<0), то кривая распределения является более островершинной (пологовершинной) по сравнению с нормальной кривой. При этом Ek незначительно (значительно) отличается от нуля (Ek=|…........|) Следовательно, по данному признаку форма кривой эмпирического распределения значительно (незначительно) отличается от формы нормального распределения.
2.Так как для признака Выпуск продукции Ek>0 (Ek<0), то кривая распределения является более островершинной (пологовершинной) по сравнению с нормальной кривой. При этом Ek незначительно (значительно) отличается от нуля (Ek=|….........|) .Следовательно, по данному признаку форма кривой эмпирического распределения значительно (незначительно) отличается от формы нормального распределения.
III. Экономическая интерпретация результатов статистического исследования предприятий2
- Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?
Предприятия с резко выделяющимися значениями показателей приведены в табл.2 рабочего файла EXCEL. После их исключения из выборки оставшиеся 30 предприятий являются типичными (нетипичными) по значениям изучаемых экономических показателей.
- Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции?
Ответ на вопрос следует из анализа данных табл.9, где приведен диапазон значений признака ( ), содержащий наиболее характерные для предприятий значения показателей.
Для среднегодовой стоимости основных производственных фондов наиболее характерные значения данного показателя находятся в пределах от ...............………млн. руб. до ................…….млн. руб. и составляют ..........% от численности совокупности.
Для выпуска продукции наиболее характерные значения данного показа-теля находятся в пределах от ...............……. млн. руб. до …..................млн. руб. и составляют ...........% от численности совокупности.
- Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?
Ответы на вопросы следуют из значения коэффициента вариации (табл.8), характеризующего степень однородности совокупности (см. вывод к задаче 3б). Максимальное расхождение в значениях показателей определяется размахом вариации Rn. (табл.8).
Для среднегодовой стоимости
основных производственных фондов различия в значениях показателя значительны (незначительны).
Максимальное расхождение в значениях
данного показателя....................
Для выпуска продукции различия в значениях показателя значительны (незначительны).
Максимальное расхождение в значениях
данного показателя....................
- Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных производственных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показателя? Какие именно это предприятия?