21.09.2019

Понятие статистического ряда распределения. Статистическая сводка и группировка. Статистический ряд распределения. Примеры решения задач


Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.

В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные)

Дискретные;

Интервальные.

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными). Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (тарифный разряд рабочих, число касс в магазине, число раскрытых преступлений и т.д.).

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

10. Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены.
Основными приемами, определяющими технику формирования статистических таблиц, являются следующие:
1. Таблица должна быть компактной и содержать только те данные, которые непосредственно отражают исследуемое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз;
2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события.
3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. Существуют различные способы соединения слагаемых граф с их итогом:
строка «Итого» или «Всего» завершает статистическую таблицу;
итоговая строка располагается первой строкой таблицы и соединяется с совокупностью ее слагаемых словами «В том числе».
4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.
5. Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (В) и так далее, а все последующие графы - номерами в порядке возрастания.
6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления целесообразно располагать в соседних друг с другом графах.
7. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям.
8. Числа целесообразнее, по возможности, округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.
Если все числа одной и той же графы или строки даны с одним десятичным знаком, а одно из чисел имеет точно два знака после запятой, то числа с одним знаком после запятой следует дополнять нулем, тем самым подчеркнув их одинаковую точность.
9. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и это по-разному отмечается:
а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «Х»;
б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.»;
в) если отсутствует явление, то клетка заполняется тире (-). Для отображения очень малых чисел используют обозначения (0,0) или (0,00.
10. В случае необходимости дополнительной информации - разъяснений к таблице, могут даваться примечания.
Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

Понятие о статистических рядах. В результате обработки и систематизации первичных статистических материалов получают ряды цифровых показателей, которые характеризуют отдельные стороны изучаемых явлений либо их изменение во времени. Эти ряды называются статистическими.

  • 1) ряды динамики, с помощью которых можно дать характеристику изменений размеров общественных явлений во времени;
  • 2) ряды распределения, характеризующие, как распределяются единицы совокупности по тому или иному признаку.

Рядом распределения называется упорядоченное распределение единиц совокупности по какому-либо варьирующему признаку. В большинстве случаев построение рядов распределения не имеет самостоятельного значения, а является составной частью операции обработки данных на основе их группировки.

Построение рядов распределения вытекает из принципов статистической группировки. В большинстве случаев ряд распределения - это простейшая группировка по одному признаку, в которой отдельные значения признака или выделенные группы характеризуются одним показателем: числом единиц или удельным весом каждой группы в общем объеме совокупности.

В ряду распределения выделяют два структурных элемента:

  • 1) варианты - различные значения группировочного признака. Их принято обозначать буквой X. Варианты могут характеризоваться словами (например, городское и сельское население) или цифрами (например, группировка рабочих по квалификации: 1, 2, 3, 4, 5, 6 разряды);
  • 2) число единиц в группах или их удельный вес в совокупности. Числа, показывающие, как часто встречается та или иная варианта в ряду распределения, называются частотами. Обозначаются латинской буквой /. Частоты являются всегда положительными числами, так как, показывая, сколько раз встречается варианта, они по своей природе не могут быть менее нуля. Частоты выражаются как в абсолютных величинах - числом единиц совокупности, так и в относительных величинах - в виде долей или в процентах к итогу.

Частоты, выраженные в виде относительных величин, называются частостями и обозначаются буквой d. Сумма частостей всегда равна 1, если они выражены в долях единицы, или 100%, если они выражены в процентах. Как правило, для расчета обобщающих характеристик используют как частоты, так и частости.

Частоты и частости могут быть кумулятивными (накопленными), когда они представлены в виде последовательно накопленных сумм.

Сумма частот ряда распределения называется объемом совокупности и обозначается латинской буквой п.

Пример распределения рабочих по заработной плате представлен в табл. 2.20.

Таблица 2.20

Распределение работников по заработной плате

Особый вид ряда распределения - ранжированный ряд, когда вместо частот или частостей поставлены ранги. Ранг - это число, показывающее порядковый номер варианты признака по возрастанию или убыванию.

Виды рядов распределения. Ряды распределения различаются по виду и характеру вариации признака (рис. 2.4).

  • 1. По виду признака ряды распределения могут быть атрибутивными и вариационными. Атрибутивные ряды - это ряды, в которых признак выражен определенным термином, фиксирующим свойство или качество предмета или явления. Вариационные ряды - это ряды, в которых варианты признака выражены цифрами.
  • 2. В зависимости от характера вариации различают дискретные и интервальные вариационные ряды.

Дискретные вариационные ряды - это ряды, в которых признак выражается в виде определенного числа, взятого с заданной степенью точности. Интервальные вариационные ряды - это ряды, в которых

варианты заданы в виде интервалов. Интервальные вариационные ряды объединяют варианты непрерывных признаков или имеющихся в широких пределах дискретных признаков.

Графически вариационный ряд можно изобразить, как и любой ряд значений аргумента и функции, используя прямоугольную систему координат. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма распределения.

Графическое изображение дискретного вариационного ряда строится в виде полигона распределения, представляющего собой распределение по признаку X. Для его построения по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат - величины частот (или частостей) (рис. 2.5). Иногда для замыкания полигона крайние точки соединяют с точками на оси абсцисс и получают многоугольник.

Графическое изображение интервального вариационного ряда строится в виде гистограммы распределения. При ее построении для вариационного ряда с равными интервалами на оси абсцисс откладываются границы интервалов и, используя отрезки, представляющие интервалы, как основания, строят на них прямоугольники с высотой, равной частоте данного интервала. В результате получается распределение, изображенное в виде смежных друг с другом столбиков. Гистограмма распределения рабочих по размеру месячной заработной платы представлена на рис. 2.6.


Рис. 2.5.


Рис. 2.6. Гистограмма распределения для вариационного ряда с равными

интервалами

Для интервальных рядов с неравными интервалами строят гистограмму плотностей распределения, так как в ряде с неравными интервалами именно плотность распределения дает представление о заполненности каждого интервала. Плотность распределения определяется по формуле

Площадь прямоугольников гистограммы равна произведению плотности на величину интервала, т.е. частоте. Следовательно, площадь всей гистограммы численно равна сумме частот или численности единиц совокупности.

Рассмотрим распределение населения района города по возрасту (табл. 2.21) и изобразим его графически.

Таблица 2.21

Распределение населения района по возрасту

График распределения населения района по возрасту представлен на рис. 2.7.

Рис. 2.7.

Любой вариационный ряд можно представить графически в виде кривой накопленных частот как функции признака. На оси абсцисс откладывают варианты или границы интервалов, а на оси ординат - соответствующие накопленные частоты. Полученные точки соединяют непрерывной линией, которая и является кумулятой. Изображение вариационного ряда в виде кумуляты более эффективно, если частоты выражены в частостях. График кумулятивной кривой представлен на рис. 2.8.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получится огива. Термин «огива» для графика кумулятивной кривой ряда распределения в 1875 г. ввел


Рис. 2.8.

Ф. Гальтон. Он положил начало применению графического метода для определения обобщающих статистических характеристик распределения, так как на основе огивы находил медиану и квартили.

Преобразование вариационных рядов. Вариационные ряды можно преобразовывать: дискретный ряд в интервальный и интервальный ряд в дискретный.

Преобразование дискретного ряда в интервальный. Представим дискретный ряд распределения рабочих по заработной плате в виде интервального. Для этого необходимо по формуле 2.1 рассчитать величину интервала: h = (9000 - 4000) : 3 = 1667 руб. (2000 руб.).

Получаем:


Преобразование интервального ряда в дискретный. Для преобразования интервального ряда с закрытыми интервалами в дискретный достаточно заменить интервал его серединой.

Получаем:

Ряды распределения имеют следующее значение:

  • 1) вариационные ряды служат средством свертывания или сжатия многообразной массовой информации в компактную форму, по ним можно составить достаточно определенное суждение о характере вариации, изучить конкретные различия признаков явлений, входящих в исследуемую совокупность;
  • 2) на основе рядов распределения исчисляются особые обобщающие характеристики совокупности (средняя, мода, медиана, дисперсия и т.д.), которые используются для более глубокого анализа социально-экономических явлений и процессов.

Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком .

В таблице 2 (только число банков) – малая выборка – простейший ряд.

Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:

Пример 2. : со студентами в аудитории.

Таблица 0

Распределение числа студентов группы 302

Число студентов (чел.)

Итого:

Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.

Выделяются 2 вида рядов:

1. атрибутивный

Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).

Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.

2. вариационный

Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.

Характеристики ряда распределения:

1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;

2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.

Пример 3. : Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.

Сумма всех частот равна сумме элементов ряда

Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0 .

В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.

(см. табл. 0: 83,3+16,7 = 100,0%)

(см. табл. 0: 0,83+0,17 = 1,00).

В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные .

В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.

Пример 4:

Таблица 4

Распределение семей по числу детей

Число детей в семье (чел.)

Количество семей (ед.)

S (накопленные частоты)

Итого:

Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.

В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину .

Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико.

Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.

Таблица 5

Распределение сотрудников предприятия по размерам месячной заработной платы, руб.

Зарплата (руб.)

Число сотрудников (чел.)

Накопленные частоты

Итого:

Кроме частот используются накопленные частоты или накопленные частости.

Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S.

Накопительные частоты называются аккумулированными частотами , они показывают сколько элементов ряда имеют значение до определенного ряда.

Введение

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления. Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития. Данные, учитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов от численности взрослого мужского населения, доходов казны от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.

С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.

Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика, являющаяся необходимо принадлежностью государственного аппарата. Статистические данные, таким образом, способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.

Для статистического анализа данных в своей работе я использовала программу Excel (расчет формул и построение графиков).

Статистические ряды распределения, их значение и применение в статистике

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения. В них известна численность единиц наблюдения в группах. Представленная в абсолютном и относительном выражении.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Статистические ряды подразделяются на:

Атрибутивные - это ряды, построенные по атрибутивным признакам, в порядке возрастания или убывания наблюдаемых знаний.

То есть качественным признакам, не имеющим числового выражения и характеризующим свойство, качество изучаемого социально-экономического явления.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам.

Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Число групп атрибутивного ряда распределения адекватно числу градаций. Разновидностей атрибутивного признака.

Пример атрибутивного ряда распределения приведен в таблице 1.

Таблица 1. Распределение студентов 1-го курса по успеваемости

Элементами данного ряда распределения являются градации атрибутивного признака «Успеваемость» («успевают» - «не успевают») и численность каждой группы в абсолютном (человек) и относительном (%) выражении.

Студентов, сдавших экзамен по дисциплине, было 46 человек. Их удельный вес составил 92%.

Вариационные - это ряды, построенные по количественному признаку.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот:

Варианты - это числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные - это прибыль, а отрицательные числа - это убыток.

Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяется числом элементов всей совокупности.

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные.

Дискретный вариационный ряд распределения - это ряд, в котором группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

Пример дискретного вариационного ряда распределения приведен в таблице 2.

Таблица 2. Распределение студентов по экзаменационному баллу

В гр. 1 таблицы 2 представлены варианты дискретного вариационного ряда. В гр. 2 - частоты, а в гр. 3 - частости. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенным пределах любые значения. Отличающиеся друг от друга на сколь угодно малую величину.

Интервальный вариационный ряд распределения - это ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения, в том числе и дробные.

Интервальный ряд распределения целесообразно строить, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

Правила и принципы построения интервальных рядов распределения аналогичны правилам и принципам построения статистических группировок. В случае, если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. При построении неравных интервалов нельзя получить информацию о степени заполнения каждого интервала. С целью проведения сравнительного анализа заполненности интервалов определяется показатель, характеризующий плотность распределения. Это отношение числа единиц совокупности к ширине интервала.

Пример интервального вариационного рада распределения приведен в таблице 3.

Таблица 3. Распределение строительных фирм региона по среднесписочной численности работающих*

* - Цифры условные

Представленный ряд распределения является интервальным, в основании образования групп которого лежит непрерывный признак.

Анализ рядов распределения можно для наглядности проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Расчетная часть задания № 5

Имеются выборочные данные (выборка 5%-я механическая) о среднегодовой стоимости основных производственных фондов и выпуске продукции предприятий отрасли экономики за отчетный период.

Таблица 4. Исходные данные

Выпуск продукции, млн. руб.

По исходным данным:

1. Постройте статистический ряд распределения предприятий по среднегодовой стоимости основных производственных фондов, образовав четыре группы предприятий с равными интервалами, охарактеризовав их числом предприятий и удельным весом предприятий.

2. Рассчитайте обобщающие показатели ряда распределения:

а) среднегодовую стоимость основных производственных фондов, взвешивая значения признака по абсолютной численности предприятий и их удельному весу;

б) моду и медиану;

в) постройте графики ряда распределения и определите на них значение моды и медианы.

Решение:

1. Сначала определяем длину интервала по формуле:

е=(х max - x min)/k,

где k - число групп в группировке (из условия k=4),

х max и x min - максимальное и минимальное значения ряда распределения,

е=(60 - 20)/4=10 млн. руб.

Затем определим нижнюю и верхнюю интервальные границы для каждой группы:

Номер группы

нижняя граница

верхняя граница

Составим рабочую таблицу 5, куда сведем исходные данные:

Таблица 5. Рабочая таблица

Группы пред-ий по среднегодовой стоимости ОПФ,

№ предпри-ятия

Среднегодовая стоимость ОПФ, млн. руб.

Выпуск продукции,

Рассчитаем характеристику ряда распределения по удельному весу предприятий по формуле:

где d - удельный вес предприятия;

f i - кол-во предприятий в группе;

F i - общее кол-во предприятий.

Подставляем данные в формулы. Полученные результаты заносим в итоговую таблицу 6.

Все формулы и расчеты таблицы 6 введены в программе Excel и даны в Приложении 1.

Таблица 6. Распределения предприятий по среднегодовой стоимости основных производственных фондов

Данная группировка показывает, что у наибольшей части данных предприятий (33,3%) среднегодовая стоимость основных производственных фондов составляет от 40 до 50 млн. руб.

2. а) Рассчитаем среднегодовую стоимость основных производственных фондов по формуле средней арифметической взвешенной, взвешивая значения по абсолютной численности предприятий:

и по удельному весу:

Для расчета средней из интервального ряда необходимо выразить варианты одним (дискретным) числом, это средняя арифметическая простая из верхнего и нижнего значений интервала:

Подставляем данные в формулы. Полученные результаты занесем в таблицу 7.

Все формулы и расчеты таблицы 7 введены в программе Excel и даны в Приложении 1.

Таблица 7. Расчет среднегодовой стоимости ОПФ

Показатели средних равны, что доказывает правильность расчетов. Среднегодовая стоимость ОПФ равна 41,333 млн. руб.

б) Рассчитаем моду и медиану данного ряда.

Мода - это значение признака, наиболее часто встречающееся в изучаемой совокупности. Для интервальных вариационных рядов распределения мода рассчитывается по формуле:

где x Mo - нижняя граница модального интервала;

i Mo - величина модального интервала;

f Mo - частота модального интервала;

f Mo-1 - частота интервала, предшествующего модальному;

f Mo+1 - частота интервала, следующего за модальным.

Первоначально по наибольшей частоте признака определим модальный интервал. Наибольшее число предприятий - 10 - среднегодовая стоимость основных производственных фондов в интервале 40 - 50 млн. руб., который и является модальным.

Подставляем данные в формулу.

Из расчета видно, что модальным значением стоимости ОПФ предприятий является стоимость равная 44 млн. руб.

Медиана - это вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части. Для интервальных вариационных рядов медиана рассчитывается по формуле:

где x Mе - нижняя граница медианного интервала;

i Mе - величина медианного интервала;

F - сумма частот ряда;

S Mе-1 - сумма накопленных частот ряда, предшествующих медианному интервалу;

f Mе - частота медианного интервала.

Определяем медианный интервал, в котором находится порядковый номер медианы. Для этого подсчитаем сумму частот накопленным итогом до числа, превышающего половину объема совокупности (30/2 = 15). Полученные данные заносим в расчетную таблицу 8.

Таблица 8. Расчет медианны

В графе «Сумма накопленных частот» значение 23 соответствует интервалу 40 - 50. Это и есть медианный интервал, в котором находится медиана.

Подставляем данные в формулу.

Из расчета видно, что у половины предприятий среднегодовая стоимость основных производственных фондов до 42 млн. руб., а у другой половина - выше этой суммы.

в) Построим графики данного ряда распределения по полученным данным:

Рис. 1.

Медиана

Рис. 2. Кумулята распределения предприятий по среднегодовой стоимости ОПФ

Несистематизированные данные, собранные в процессе статистического наблюдения, образуют первичный ряд данных. При достаточно большом объеме совокупности первичный ряд данных становится трудно обозримым и непосредственное его рассмотрение не может дать представления о распределении единиц совокупности по величине признака.

Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда (значений признака) в возрастающем или убывающем порядке. Ранжирование данных позволяет:

  • сразу увидеть максимальное и минимальное значения признака в совокупности и оцепить разницу между ними (Х тах - X min);
  • определить число повторений отдельных вариантов ряда (частоту).

В результате первичный неупорядоченный ряд данных преобразуется в упорядоченный ряд, в котором будет отражено число повторений каждой варианты:

Этот ряд называется статистическим рядом распределения. Он характеризует состав и структуру изучаемого явления, позволяет судить о степени однородности изучаемой совокупности, закономерности и границах варьирования анализируемого признака.

Элементами статистического ряда распределения являются варианты X, и частоты / (абсолютная величина числа повторений г-й варианты).

Для характеристики структуры совокупности используется показатель, который называется частостью (4) и определяется по формуле

Из определения частоты и частости следуют следующие равенства: где N - объем совокупности.

Ряд распределения может быть получен в результате группировки. Ряды распределения могут быть атрибутивными и вариационными.

Атрибутивным рядом является статистический ряд распределения, который построен по атрибутивному признаку. В качестве примера такого ряда можно рассматривать, в частности, распределение рабочих цеха предприятия по профессиям (табл. 3.2).

Распределение рабочих цеха по профессиям

Вариационным рядом является статистический ряд распределения, который построен по количественному признаку. Вариационный ряд можно считать дискретным рядом, если признак, по котором}" он построен, соответственно является дискретным. Вариационный ряд распределения также может быть и интервальным, если признак, по которому он построен, является непрерывным. В качестве примера такого ряда можно привести распределение рабочих цеха или предприятия по уровню квалификации (табл. 3.3).

Таблица 3.3

Распределение рабочих цеха по уровню квалификации

В качестве примера интервального ряда распределения можно привести пример распределения предприятий по объему производства (см. параграф 3.3). Интервальное распределение при этом выполняется в процессе построения соответствующей аналитической группировки, представленной в табл. 3.4.

Интервальный ряд распределения, наряду с дискретным рядом распределения, позволяет выявить и исследовать структуру изучаемого явления (объекта наблюдения).

Таблица 3.4

Распределение предприятий по объему производства продукции

Группы предприятий но объему производства, млн руб.

Количество

предприятий

(частота)

Удельный вес в общем количестве пред!хриятий

Накопленная

Xi

А

А

d,

Статистический ряд распределения можно рассматривать как обязательный итог любой статистической группировки. При построении рядов распределения число групп и длина интервала определяются по правилам, применяемым при выполнении статистических группировок (см. параграф 3.2).

Для наглядности и лучшего понимания статистические ряды распределения могут быть представлены не в табличном, а в графическом виде.

Наиболее часто графический вид рядов распределения используется для отображения вариационных статистических рядов распределения.

Для отображения дискретного ряда используют линейные диаграммы, которые называются полигонами распределения. При построении полигона распределения в прямоугольной системе координат на оси абсцисс откладывают варианты (значения) анализируемого признака. На оси ординат откладывают частость распределения вариантов или значений признака. Целесообразность отображения на оси ординат частостей объясняется следующим:

  • это наиболее удобный способ при большом объеме исследуемой статистической совокупности;
  • это дает возможность в рамках одного графика изображать статистические ряды распределения двух и более признаков с разным числом единиц совокупности.

Пересечение точек по оси абсцисс и оси ординат образует ломаную линию, которая и представляет собой полигон распределения (рис. 3.1 - на основе данных табл. 3.3).

Для графического отображения интервального ряда, как правило, используют столбиковые диаграммы, которые принято в данном случае называть гистограммами.

Можно построить гистограмму интервального ряда распределения предприятий по объему производства продукции (см. габл. 3.4). Ось абсцисс в данном случае представляет собой отрезки, равные величине интервалов ряда распределения (в принятом масштабе). Далее на этих отрезках строят прямоугольники, которые по высоте, откладываемой по оси ординат, равны частоте или частости каждого интервала (рис. 3.2).


Рис. 3.1.


Рис. 3.2.

Для решения таких задач, как определение структурных средних, наблюдение за процессом концентрации изучаемого явления и т.п., ряды распределения принято преобразовывать в кумулятивные ряды, которые выстраиваются в зависимости от накопленных частот или частостей. Правило расчета накопления частот (частостей) каждого интервала ряда распределения достаточно простое. Накопление частот (частостей) рассчитывается как сумма частоты (частости) данного интервала и частот (частостей) всех интервалов, предшествующих данному интервалу.

В качестве примера построения кумулятивного ряда возьмем данные табл. 3.4 из последней графы (см. накопленная частота s,) и построим соответствующую диаграмму (рис. 3.3).

При построении кумулятивных рядов в прямоугольной системе координат на оси абсцисс откладывают верхние границы интервалов ряда распределения, а на оси ординат - накопленные частоты (частости), которые соответствуют этим интервалам.


Рис. 3.3.

С использованием кумуляты может быть проиллюстрирован процесс концентрации, где наряду с накоплением частот (частостей) имеются в статистическом ряду распределения и суммы накопленных группировочных (или иных важных) признаков изучаемого явления. Такие кривые, которые отражают процесс концентрации, называют кривыми Лоренца.

Так, если обратиться к данным табл. 3.4 и рис. 3.3, то можно отметить, что накопленная частота второго интервала свидетельствует о том, что семь предприятий из 25 производят около 19% всего объема продукции, при этом каждое из семи предприятий имеет объем производства не более 8,2 млн руб. и эти семь предприятий составляют 28% общего количества рассмотренных предприятий.

Самым важным требованием из всех, которые могут быть предъявлены к построению статистических рядов распределения, является требование сопоставимости во времени и в пространстве данных об интервалах. При этом вполне понятно, что в рядах с равными интервалами это требование выполняется автоматически. В тех рядах распределения, интервалы которых не равны, принято рассчитывать плотность распределения как частное от деления частоты интервала на его длину. В графическом отображении рядов распределения с неравными интервалами на оси ординат принято откладывать нс частоты (частости), а значения плотности распределения.

Для облегчения построения группировок и графических отображений статистических рядов могут быть использованы редакторы электронных таблиц (например, Excel ).

  • См.: Макарова Н. В., Трофимец В. С. Статистика в Excel. М.: Финансы и статистика,2009; и другие подобные издания.



© 2024
womanizers.ru - Журнал современной женщины