16.10.2019

Ряды распределения в статистике. Интервальный вариационный ряд


Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЗАДАЧА 1

Имеются следующие данные о заработной плате работников на предприятии:

Таблица 1.1

Размер заработной платы в усл. ден. ед.

Требуется построить интервальный ряд распределения, по которому найти;

1) среднюю заработную плату;

2) среднее линейное отклонение;

4) среднее квадратическое отклонение;

5) размах вариации;

6) коэффициент осцилляции;

7) линейный коэффициент вариации;

8) простой коэффициент вариации;

10) медиану;

11) коэффициент асимметрии;

12) показатель асимметрии Пирсона;

13) коэффициент эксцесса.

Решение

Как известно, варианты (значения признано) расположены в порядке возрастания образуют дискретный вариационный ряд. При большом числе вариант (больше 10) даже в случае дискретной вариации строятся интервальные ряды.

Если составляется интервальный ряд с ровными интервалами, то размах вариации делится на указанное число интервалов. При этом, если полученное значение целое и однозначное (что бывает редко), то длина интервала принимается равной этому числу. В остальных случаях производится округление обязательно в сторону увеличения, так чтобы последняя оставляемая цифра была чётной. Очевидно, с увеличением длины интервала расширяется размах вариации на величину, равной произведению числа интервалов: на разность расчетной и первоначальной длины интервала

а) Если величина расширения размаха вариации незначительна, то ее либо прибавляют к наибольшему либо вычитают из наименьшего значения признака;

б) Если величина расширения размаха вариации ощутима, то, чтобы не произошло смешения центра размаха, ее примерно делят пополам одновременно прибавляя к наибольшему и вычитая из наименьшего значений признака.

Если составляется интервальный ряд с неравными интервалами, то процесс упрощается, но по-прежнему длина интервалов должна выражаться числом с последней чётной цифрой, что значительно упрощает последующие расчёты числовых характеристик.

30 - объем выборки.

Составим интервальный ряд распределения, используя формулу Стерджеса:

K = 1 + 3.32*lg n,

K - число групп;

K = 1 + 3.32*lg 30 = 5,91=6

Находим размах признака - заработная плата работников на предприятии - (х) по формуле

R= xmaх - xmin и делим на 6; R= 195-112=83

Тогда длина интервала будет l пер=83:6=13.83

Началом первого интервала будет 112. Прибавляя к 112 l рас=13,83, получим его конечное значение 125,83, которое одновременно является началом второго интервала и т.д. конец пятого интервала - 195.

При нахождении частот следует руководствоваться правилом: «если значение признака совпадает с границей внутреннего интервала, то его следует относить к предыдущему интервалу».

Получим интервальный ряд частот и накопительных частот.

Таблица 1.2

Следовательно, 3 работника имеют зар. плату от 112 до 125,83 усл.ден.ед. Наибольшая зар. плата от 181,15 до 195 усл.ден.ед. только у 6-ті работников.

Для расчёта числовых характеристик интервальный ряд преобразуем в дискретный, взяв в качестве вариант середины интервалов:

Таблица 1.3

14131,83

По формуле взвешенного среднего арифметического

усл.ден.ед.

Среднее линейное отклонение:

где xi - значение изучаемого признака у i-той единицы совокупности,

Средняя величина изучаемого признака.

Размещено на http://www.allbest.ru/

LРазмещено на http://www.allbest.ru/

Усл.ден.ед.

Среднее квадратическое отклонение:

Дисперсия:

Относительный размах вариации (коэффициент осцилляции): с= R:,

Относительное линейное отклонение: q = L:

Коэффициент вариации: V = у:

Коэффициент осцилляции показывает относительную колеблемость крайних значений признака около среднего арифметического, а коэффициент вариации характеризует степень и однородности совокупности.

с= R: = 83 / 159,485*100% = 52,043%

Таким образом, разница между крайними значениями на 5,16% (=94,84%-100%) меньше среднего значения заработной платы работников на предприятии.

q = L: = 17,765/ 159,485*100% =11,139 %

V = у: = 21,704/ 159,485*100% = 13,609%

Коэффициент вариации меньше 33%, что говорит о слабой вариации заработной платы работников на предприятии, т.е. о том, что средняя величина является типической характеристикой заработной плате работников (совокупность однородная).

В интервальных рядах распределения мода определяется по формуле -

Частота модального интервала, т. е. интервала, содержащего наибольшее число вариант;

Частота интервала, предшествующего модальному;

Частота интервала, следующего за модальным;

Длина модального интервала;

Нижняя граница модального интервала.

Для определения медианы в интервальном ряду воспользуемся формулой

где - кумулятивная (накопленная) частота интервала, предшествующего медианному;

Нижняя граница медианного интервала;

Частота медианного интервала;

Длина медианного интервала.

Медианный интервал - интервал, накопленная частота которого (=3+3+5+7) превышает половину суммы частот - (153,49; 167,32).

Рассчитаем асимметрию и эксцесс для чего составим новую рабочую таблицу:

Таблица 1.4

Фактические данные

Расчетные данные

Рассчитаем момент третьего порядка

Следовательно, асимметрия равна

Так как 0,3553 0,25, то асимметрия признается значительной.

Рассчитаем момент четвертого порядка

Следовательно, эксцесс равен

Так как < 0, то эксцесс является плосковершинным.

Степень асимметрии может быть определена с помощью коэффициента асимметрии Пирсона (Аs): осцилляция выборка стоимость товарооборот

где -- средняя арифметическая ряда распределения; -- мода; -- среднее квадратическое отклонение.

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.

Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Распределение не является симметричным, а имеет левостороннюю асимметрию.

ЗАДАЧА 2

Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,04, если на основе предыдущих обследований известно, что дисперсия равна 0,24?

Решение

Объем выборки при бесповторном отборе рассчитывается по формуле:

t - коэффициент доверия (при вероятности 0,954 он равен 2,0; определяется по таблицам интегралов вероятности),

у2=0,24 - среднее квадратическое отклонение;

10000 чел. - численность выборки;

Дх =0,04 - предельная ошибка выборочной средней.

С вероятностью 95,4% можно утверждать, что численность выборки, обеспечивающая относительную погрешность не более 0,04, должна составлять не менее 566 семей.

ЗАДАЧА 3

Имеются следующие данные о доходах от основной деятельности предприятия, млн. руб.

Для анализа ряда динамики определите следующие показатели:

1) цепные и базисные:

Абсолютные приросты;

Темпы роста;

Темпы прироста;

2) средний

Уровень ряда динамики;

Абсолютный прирост;

Темп роста;

Темп прироста;

3) абсолютное значение 1% прироста.

Решение

1. Абсолютный прирост (Д у) - это разность между последующим уровнем ряда и предыдущим (или базисным):

цепной: Ду = уi - yi-1,

базисный: Ду = уi - y0,

уi - уровень ряда,

i - номер уровня ряда,

y0 - уровень базисного года.

2. Темп роста (Ту) - это отношение последующего уровня ряда и предыдущего (или базисного 2001 г.):

цепной: Ту = ;

базисный: Ту =

3. Темп прироста (Т Д ) - это отношение абсолютного прироста к предыдущему уровню, выраженное в %.

цепной: Ту = ;

базисный: Ту =

4. Абсолютное значение 1% прироста (А) - это отношение цепного абсолютного прироста к темпу прироста, выраженному в %.

А =

Средний уровень ряда рассчитывается по формуле средней арифметической.

Средний уровень доходов от основной деятельности за 4 года:

Средний абсолютный прирост рассчитывается по формуле:

где n - число уровней ряда.

В среднем за год доходы от основной деятельности выросли на 3,333 млн. руб.

Среднегодовой темп роста рассчитывается по формуле средней геометрической:

уn - конечный уровень ряда,

у0 - начальный уровень ряда.

Ту = 100% = 102,174 %

Среднегодовой темп прироста рассчитывается по формуле:

Т? = Ту - 100% = 102,74% - 100% = 2,74%.

Таким образом, в среднем за год доходы от основной деятельности предприятия увеличивались на 2,74%.

ЗАДАЧ А 4

Вычислить:

1. Индивидуальные индексы цен;

2. Общий индекс товарооборота;

3. Агрегатный индекс цен;

4. Агрегатный индекс физического объема продажи товаров;

5. Абсолютный прирост стоимости товарооборота и разложите по факторам (за счет изменения цен и количества проданных товаров);

6. Сделать краткие выводы по всем полученным показателям.

Решение

1. По условию, индивидуальные индексы цен по изделиям А, Б, В составили -

iрA=1.20; iрБ=1,15; iрВ=1.00.

2. Общий индекс товарооборота рассчитаем по формуле:

I w = = 1470/1045*100% = 140,67 %

Товарооборот вырос на 40,67 % (140,67%-100%).

В среднем цены на товары выросли на 10,24%.

Сумма дополнительных расходов покупателей от роста цен:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478= 136,522 млн. руб.

В результате роста цен покупателям пришлось дополнительно израсходовать 136,522 млн. руб.

4. Общий индекс физического объема товарооборота:

Физический объем товарооборота вырос на 27,61 %.

5. Определим общее изменение товарооборота во втором периоде по сравнению с первым периодом:

w = 1470- 1045 = 425 млн.руб.

за счет изменения цен:

W(р) = 1470 - 1333,478 = 136,522 млн. руб.

за счет изменения физического объема:

w(q) = 1333,478 - 1045= 288,478 млн. руб.

Товарооборот товаров увеличился на 40,67%. Цены в среднем по 3-м товарам выросли на 10,24%. Физический объем товарооборота увеличился на 27,61%.

В целом объем реализации увеличился на 425 млн.руб., в том числе за счет роста цен он вырос на 136,522 млн. руб., а за счет увеличения объемов продаж - на 288,478 млн. руб.

ЗАДАЧА 5

По 10 заводам одной отрасли имеются следующие данные.

№ завода

Выпуск продукции, тыс. шт. (Х)

На основе приведенных данных:

I) для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (объемом выпуска продукции) и результативным признаком (расходом электроэнергии) нанесите исходные данные на график корреляционного поля и сделайте выводы о форме связи, укажите ее формулу;

2) определите параметры уравнения связи и нанесите полученную при этом теоретическую линию на график корреляционного поля;

3) исчислите линейный коэффициент корреляции,

4) поясните значения показателей, полученных в пунктах 2) и 3);

5) используя полученную модель, сделайте прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.

Решение

Данные признака - объем выпуска продукции (фактор), обозначим через хi; признака - расход электроэнергии (результат) через уi; точки с координатами (х, у) наносим на корреляционное поле ОХУ.

Точки корреляционного поля расположены вдоль некоторой прямой. Следовательно, связь - линейная, будем искать уравнение регрессии в виде прямой Уx=ax+b. Для его нахождения воспользуемся системой нормальных уравнений:

Составим расчетную таблицу.

По найденным средним составляем систему и решаем её относительно параметров а и b:

Итак, получим уравнение регрессии у на х: = 3,57692 х + 3,19231

Строим линию регрессии на корреляционном поле.

Подставляя в уравнение регрессии значения х из столбца 2, получим расчетные (столбец 7) и сравниваем их с данными у, что отражено в столбце 8. Кстати, правильность расчетов подтверждается и совпадением средних значений у и.

Коэффициент линейной корреляции оценивает тесноту зависимости между признаками х и у и рассчитывается по формуле

Угловой коэффициент прямой регрессии а (при х) характеризует направление выявленной зависимости признаков: при а>0 одинаковы, при а<0- противоположны. Его абсолютная величина - мера изменения результативного признака при изменении факторного на единицу измерения.

Свободный член прямой регрессии выявляет направление, а его абсолютное значение - количественную меру влияния на результативный признак всех прочих факторов.

Если < 0, то ресурс факторного признака отдельного объекта используется с меньшей, а при >0 с большей результативностью, чем в среднем по всему множеству объектов.

Проведём послерегрессионный анализ.

Коэффициент при х прямой регрессии равен 3,57692 >0, следовательно, с увеличением (уменьшением) выпуска продукции растёт (падает) расход электроэнергии. Увеличение выпуска продукции на 1 тыс. шт. даёт в среднем рост расход электроэнергии на 3,57692 тыс. кВт.ч.

2. Свободный член прямой регрессии равен 3,19231,следовательно, влияние прочих факторов увеличивает силу воздействия выпуска продукции на расход электроэнергии в абсолютном измерении на 3,19231 тыс. кВт.ч.

3. Коэффициент корреляции 0,8235 выявляет весьма тесную зависимость расхода электроэнергии от выпуска продукции.

По уравнению регрессионной модели легко делать прогнозы. Для этого в уравнение регрессии подставляют значения х - объем выпуска продукции и прогнозируют расход электроэнергии. При этом значения х можно брать не только в пределах заданного размаха, но и вне его.

Сделаем прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.

3,57692*4,5 + 3,19231= 19,288 45 тыс. кВт.ч.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Захаренков С.Н. Социально-экономическая статистика: Учеб.-практ пособие. -Мн.: БГЭУ, 2002.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. - М.: ИНФРА - М., 2000.

3. Елисеева И.И. Статистика. - М.: Проспект, 2002.

4. Общая теория статистики / Под общ. ред. О.Э. Башиной, А.А. Спирина. - М.: Финансы и статистика, 2000.

5. Социально-экономическая статистика: Учеб.-практ. пособие / Захаренков С.Н. и др. - Мн.: ЕГУ, 2004.

6. Социально-экономическая статистика: Учеб. пособие. / Под ред. Нестерович С.Р. - Мн.: БГЭУ, 2003.

7. Теслюк И.Е., Тарловская В.А., Терлиженко Н. Статистика.- Минск, 2000.

8. Харченко Л.П. Статистика. - М.: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Ионин В.Г. Статистика. - М.: ИНФРА - М, 1999.

10. Экономическая статистика / Под ред. Ю.Н. Иванова - М., 2000.

Размещено на Allbest.ru

...

Подобные документы

    Расчет средней арифметической для интервального ряда распределения. Определение общего индекса физического объема товарооборота. Анализ абсолютного изменения общей стоимости продукции за счет изменения физического объема. Расчет коэффициента вариации.

    контрольная работа , добавлен 19.07.2010

    Сущность оптового, розничного и общественного товарооборота. Формулы расчета индивидуальных, агрегатных индексов товарооборота. Расчет характеристик интервального ряда распределения - среднего арифметического, моды и медианы, коэффициента вариации.

    курсовая работа , добавлен 10.05.2013

    Расчет планового и фактического объема продаж, процента выполнения плана, абсолютного изменения товарооборота. Определение абсолютного прироста, средних темпов роста и прироста денежных доходов. Расчет структурных средних: моды, медианы, квартиля.

    контрольная работа , добавлен 24.02.2012

    Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа , добавлен 15.12.2010

    Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа , добавлен 27.02.2011

    Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.

    контрольная работа , добавлен 26.04.2010

    Понятие моды и медианы как типичных характеристик, порядок и критерии их определения. Нахождение моды и медианы в дискретном и интервальном вариационном ряду. Квартили и децили как дополнительные характеристики вариационного статистического ряда.

    контрольная работа , добавлен 11.09.2010

    Построение интервального ряда распределения по группировочному признаку. Характеристика отклонения распределения частот от симметричной формы, расчет показателей эксцесса и ассиметрии. Анализ показателей бухгалтерского баланса или отчёта о прибылях.

    контрольная работа , добавлен 19.10.2014

    Преобразование эмпирического ряда в дискретный и интервальный. Определение средней величины по дискретному ряду с использованием ее свойств. Расчет по дискретному ряду моды, медианы, показателей вариации (дисперсия, отклонение, коэффициент осцилляции).

    контрольная работа , добавлен 17.04.2011

    Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

При построении интервального ряда распределения решаются три вопроса:

  • 1. Сколько надо взять интервалов?
  • 2. Какова длина интервалов?
  • 3. Каков порядок включения единиц совокупности в границы интервалов?
  • 1. Количество интервалов можно определить по формуле Стер- джесса :

2. Длина интервала, или шаг интервала , обычно определяется по формуле

где R - размах вариации.

3. Порядок включения единиц совокупности в границы интервала

может быть разным, но при построении интервального ряда распределения обязательно строго определен.

Например, такой: [), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал , верхняя граница которого включает последнее число ранжированного ряда.

Границы интервалов бывают:

  • закрытые - с двумя крайними значениями признака;
  • открытые - с одним крайним значением признака (до такого-то числа или свыше такого-то числа).

С целью усвоения теоретического материала введем исходную информацию для решения сквозной задачи.

Имеются условные данные по среднесписочной численности менеджеров по продажам, количеству проданного ими однокачественного товара, индивидуальной рыночной цене на этот товар, а также объему продаж 30 фирм в одном из регионов РФ в I квартале отчетного года (табл. 2.1).

Таблица 2.1

Исходная информация для сквозной задачи

Численность

менеджеров,

Цена, тыс. руб.

Объем продаж, млн руб.

Численность

менеджеров,

Количество проданного товара, шт.

Цена, тыс. руб.

Объем продаж, млн руб.

На базе исходной информации, а также дополнительной сделаем постановку отдельных заданий. Затем представим методику их решения и сами решения.

Сквозная задача. Задание 2.1

Используя исходные данные табл. 2.1, требуется построить дискретный ряд распределения фирм по количеству проданного товара (табл. 2.2).

Решение:

Таблица 2.2

Дискретный ряд распределения фирм по количеству проданного товара в одном из регионов РФ в I квартале отчетного года

Сквозная задача. Задание 2.2

требуется построить ранжированный ряд 30 фирм по среднесписочной численности менеджеров.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Сквозная задача. Задание 2.3

Используя исходные данные табл. 2.1, требуется:

  • 1. Построить интервальный ряд распределения фирм по численности менеджеров.
  • 2. Рассчитать частости ряда распределения фирм.
  • 3. Сделать выводы.

Решение:

Рассчитаем по формуле Стерджесса (2.5) количество интервалов :

Таким образом, берем 6 интервалов (групп).

Длину интервала , или шаг интервала , рассчитаем по формуле

Примечание. Порядок включения единиц совокупности в границы интервала такой: I), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал I ], верхняя граница которого включает последнее число ранжированного ряда.

Строим интервальный ряд (табл. 2.3).

Интервальный ряд распределения фирм но среднесписочной численности менеджеров в одном из регионов РФ в I квартале отчетного года

Вывод. Наиболее многочисленной группой фирм является группа со среднесписочной численностью менеджеров 25- 30 человек, которая включает 8 фирм (27%); в самую малочисленную группу со среднесписочной численностью менеджеров 40-45 человек входит всего одна фирма (3%).

Используя исходные данные табл. 2.1, а также интервальный ряд распределения фирм по численности менеджеров (табл. 2.3), требуется построить аналитическую группировку зависимости между численностью менеджеров и объемом продаж фирм и на основании ее сделать вывод о наличии (или отсутствии) связи между указанными признаками.

Решение:

Аналитическая группировка строится по факторному признаку. В нашей задаче факторным признаком (х) является численность менеджеров, а результативным признаком (у) - объем продаж (табл. 2.4).

Построим теперь аналитическую группировку (табл. 2.5).

Вывод. На основании данных построенной аналитической группировки можно сказать, что с увеличением численности менеджеров по продажам средний в группе объем продаж фирмы также увеличивается, что свидетельствует о наличии прямой связи между указанными признаками.

Таблица 2.4

Вспомогательная таблица для построения аналитической группировки

Численность менеджеров, чел.,

Номер фирмы

Объем продаж, млн руб., у

» = 59 f = 9,97

Я-™ 4 - Ю.22

74 ’25 1ПЙ1

У4 = 7 = 10,61

у = ’ =10,31 30

Таблица 2.5

Зависимость объемов продаж от численности менеджеров фирм в одном из регионов РФ в I квартале отчетного года

КОНТРОЛЬНЫЕ ВОПРОСЫ
  • 1. В чем суть статистического наблюдения?
  • 2. Назовите этапы статистического наблюдения.
  • 3. Каковы организационные формы статистического наблюдения?
  • 4. Назовите виды статистического наблюдения.
  • 5. Что такое статистическая сводка?
  • 6. Назовите виды статистических сводок.
  • 7. Что такое статистическая группировка?
  • 8. Назовите виды статистических группировок.
  • 9. Что такое ряд распределения?
  • 10. Назовите конструктивные элементы ряда распределения.
  • 11. Каков порядок построения ряда распределения?
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Количество исходных данных
",0);">

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

Высшего профессионального образования

«РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И

ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ПРЕЗИДЕНТЕ

РОССИЙСКОЙ ФЕДЕРАЦИИ»

(Калужский филиал)

Кафедра естественнонаучных и математических дисциплин

КОНТРОЛЬНАЯ РАБОТА

По дисциплине «Статистика»

Студент___Майборода Галина Юрьевна______

Заочного отделения факультет Государственное и муниципальное управление группа Г-12-В

Преподаватель ____________________ Хамер Г.В.

К.п.н., доцент

Калуга-2013 г.

Задача 1.

Задача 1.1. 4

Задача 1.2. 16

Задача 1.3. 24

Задача 1.4. 33

Задача 2.

Задача 2.1. 43

Задача 2.2. 48

Задача 2.3. 53

Задача 2.4. 58

Задача 3.

Задача 3.1. 63

Задача 3.2. 68

Задача 3.3. 73

Задача 3.4. 79

Задача 4.

Задача 4.1. 85

Задача 4.2. 88

Задача 4.3. 90

Задача 4.4. 93

Список использованных источников. 96

Задача 1.

Задача 1.1.

Имеются следующие данные о выпуске продукции и сумме прибыли предприятиями области (таблица 1).

Таблица 1

Данные о выпуске продукции и сумме прибыли предприятиями

№ предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб. № предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб.
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

По исходным данным:

1. Постройте статистический ряд распределения предприятий по выпуску продукции, образовав пять групп с равными интервалами.

Постройте графики ряда распределения: полигон, гистограмму, кумуляту. Графически определите значение моды и медианы.

2. Рассчитайте характеристики ряда распределения предприятий по выпуску продукции: среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Сделайте вывод.

3. Методом аналитической группировки установите наличие и характер корреляционной связи между стоимостью произведенной продукции и суммой прибыли на одно предприятие.

4. Измерьте тесноту корреляционной связи между стоимостью произведенной продукции и суммой прибыли эмпирическим корреляционным отношением.

Сделайте общие выводы.

Решение:

Построим статистический ряд распределения

Для построения интервального вариационного ряда, характеризующего распределение предприятий по объему выпуска продукции, необходимо вычислить величину и границы интервалов ряда.

При построении ряда с равными интервалами величина интервала h определяется по формуле:

х max и х min – наибольшее и наименьшее значения признака в исследуемой совокупности предприятий;

k - число групп интервального ряда.

Число групп k задано в условии задания. k = 5.

х max = 81 млн. руб., х min = 21 млн. руб.

Расчет величины интервала:

млн. руб.

Путем последовательного прибавления величины интервала h = 12 млн. руб. к нижней границе интервала, получаем следующие группы:

1 группа: 21 – 33 млн. руб.

2 группа: 33 – 45 млн. руб.;

3 группа: 45 – 57 млн. руб.

4 группа: 57 – 69 млн. руб.

5 группа: 69 – 81 млн. руб.

Для построения интервального ряда необходимо подсчитать количество предприятий, входящих в каждую группу (частоты групп ).

Процесс группировки предприятий по объему выпуска продукции представлен во вспомогательной таблице 2. Графа 4 этой таблицы необходима для построения аналитической группировки (пункт 3 задания).

Таблица 2

Таблица для построения интервального ряда распределения и

аналитической группировки

Группы предприятий по объему выпуска продукции, млн. руб. № предприятия Выпуск продукции, млн. руб. Прибыль, млн. руб.
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Всего 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Всего 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Всего 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Всего 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Всего 229,0 26,9
Итого 183,1

На основе групповых итоговых строк «Всего» таблицы 3 формируется итоговая таблица 3, представляющая интервальный ряд распределения предприятий по объему выпуска продукции.

Таблица 3

Ряд распределения предприятий по объему выпуска продукции

Вывод. Построенная группировка показывает, что распределение предприятий по объему выпуска продукции не является равномерным. Наиболее часто встречаются предприятии с объемом выпуска продукции от 45 до 57 млн. руб. (12 предприятий). Наименее часто встречаются предприятий с объемом выпуска продукции от 69 до 81 млн. руб. (3 предприятия).

Построим графики ряда распределения.

Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты (для интервальных вариационных рядов в качестве аргумента принимают середину интервала) а на оси ординат - значения частот . Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Полигон представлен на рисунке 1.

Гистограмма – столбиковая диаграмма. Она позволяет оценить симметричность распределения. Гистограмма представлена на рисунке 2.

Рисунок 1 – Полигон распределения предприятий по объему

выпуска продукции

Мода

Рисунок 2 – Гистограмма распределения предприятий по объему

выпуска продукции

Мода – значение признака, которое встречается наиболее часто в исследуемой совокупности.

Для интервального ряда графически моду можно определить по гистограмме (рисунок 2). Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным (45 – 57 млн. руб.). Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения.

Млн. руб.

Вывод. В рассматриваемой совокупности предприятий наиболее часто встречаются предприятия с выпуском продукции в 52 млн. руб.

Кумулята – ломаная кривая. Она строится по накопленным частотам (рассчитаны в таблице 4). Кумулята начинается с нижней границы первого интервала (21 млн. руб.), накопленная частота откладывается в верхней границе интервала. Кумулята представлена на рисунке 3.

Медиана

Рисунок 3 - Кумулята распределения предприятий по объему

выпуска продукции

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

В интервальном ряду медиану можно определить графическим методом по кумулятивной кривой. Для определения медианы из точки на шкале накопленных частот, соответствующей 50% (30:2 = 15), проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Млн. руб.

Вывод. В рассматриваемой совокупности предприятий половина предприятий имеют объем выпуска продукции не более 52 млн. руб., а другая половина – не менее 52 млн. руб.


Похожая информация.


Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

Виды статистических признаков .

Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Таблица 1. Общий вид дискретного вариационного ряда частот

Значения признака x i x 1 x 2 x n
Частоты m i m 1 m 2 m n

Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

Таблица 2. Общий вид интервального вариационного ряда частот

Таблица 3. Графические изображения вариационного ряда

Ряд Полигон или гистограмма Эмпирическая функция распределения
Дискретный
Интервальный
Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
Полигон используется при изображении дискретных вариационных рядов .
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


Рис. Полигон распределения жилого фонда


На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЕГО 115 ----


Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЕГО 147 ---- ----

Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.