21.09.2019

Что размах вариации. Статистическое изучение вариации


Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины:

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Коэффициент вариации – наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Тема 6. Виды и методы анализа рядов динамики

  1. Ряды динамики. Виды рядов динамики.
  2. Основные показатели рядов динамики
  3. Средние показатели рядов динамики

1. Явления общественной жизни, изучаемые социально-экономической статистикой, находятся в непрерывном изменении и развитии. С течением времени – от месяца к месяцу, от года к году – изменяются численность населения и его состав, объем производимой продукции, уровень производительности труда и т. д., поэтому одной из важнейших задач статистики является изучение изменения общественных явлений во времени – процесса их развития, их динамики. Эту задачу статистика решает путем построения и анализа рядов динамики (временных рядов).

Ряд динамики (хронологический, динамический, временной ряд) – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Ряд включает два обязательных элемента: время и конкретное значение показателя (уровень ряда).

Каждое числовое значение показателя, характеризующее величину, размер явления, называется уровнем ряда. Кроме уровней каждый ряд динамики содержит указания о тех моментах либо периодах времени, к которым относятся уровни.

При подведении итогов статистического наблюдения получают абсолютные показатели двух видов. Одни из них характеризуют состояние явления на определенный момент времени: наличие на этот момент каких-либо единиц совокупности или наличие того или иного объема признака. К таким показателям относится численность населения, парк автомобилей, жилищный фонд, товарные запасы и т. д. Величину таких показателей можно определить непосредственно только по состоянию на тот или иной момент времени, а потому эти показатели и соответствующие ряды динамики и называются моментными.

Другие показатели характеризуют итоги какого-либо процесса за определенный период (интервал) времени (сутки, месяц, квартал, год и т. п.). Такими показателями являются, например, число родившихся, количество произведенной продукции, ввод в действие жилых домов, фонд заработной платы и др. Величину этих показателей можно подсчитать только за какой-нибудь интервал (период) времени, поэтому такие показатели и ряды их значений называются интервальными.

Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней, поэтому в интервальном ряду динамики уровни за примыкающие друг к другу периоды времени можно суммировать, получая итоги (уровни) за более продолжительные периоды (так, суммируя месячные уровни, получим квартальные, суммируя квартальные, получим годовые, суммируя годовые – многолетние).

В моментном динамическом ряду одни и те же единицы совокупности обычно входят в состав нескольких уровней, поэтому суммирование уровней моментного ряда динамики само по себе не имеет смысла, так как получающиеся при этом итоги лишены самостоятельной экономической значимости.

При построении и перед анализом ряда динамики нужно прежде всего обратить внимание на то, чтобы уровни ряда были сопоставимы между собой, так как только в этом случае динамический ряд будет правильно отражать процесс развития явления. Сопоставимость уровней ряда динамики – это важнейшее условие обоснованности и правильности выводов, полученных в результате анализа этого ряда. При построении динамического ряда надо иметь в виду, что ряд может охватывать большой период времени, в течение которого могли произойти изменения, нарушающие сопоставимость (территориальные изменения, изменения круга охвата объектов, методологии расчетов и т. д.).

При изучении динамики общественных явлений статистика решает следующие задачи:

Измеряет абсолютную и относительную скорость роста либо снижения уровня за отдельные промежутки времени;

Дает обобщающие характеристики уровня и скорости его изменения за тот или иной период;

Выявляет и численно характеризует основные тенденции развития явлений на отдельных этапах;

Дает сравнительную числовую характеристику развития данного явления в разных регионах или на разных этапах;

Выявляет факторы, обусловливающие изменение изучаемого явления во времени;

Делает прогнозы развития явления в будущем.

2 . Простейшими показателями анализа, которые используются при решении ряда задач, в первую очередь при измерении скорости изменения уровня ряда динамики, являются абсолютный прирост, темпы роста и прироста, а также абсолютное значение (содержание) одного процента прироста. Расчет этих показателей основан на сравнении между собой уровней ряда динамики. При этом уровень, с которым производится сравнение, называется базисным, так как он является базой сравнения. Обычно за базу сравнения принимается либо предыдущий, либо какой-либо предшествующий уровень, например первый уровень ряда.

Если каждый уровень сравнивается с предыдущим, то полученные при этом показатели называются цепными, так как они представляют собой как бы звенья «цепи», связывающей между собой уровни ряда. Если же все уровни связываются с одним и тем же уровнем, выступающим как постоянная база сравнения, то полученные при этом показатели называются базисными.

Часто построение ряда динамики начинают с того уровня, который будет использован в качестве постоянной базы сравнения. Выбор этой базы должен быть обоснован историческими и социально-экономическими особенностями развития изучаемого явления. В качестве базисного целесообразно брать какой-либо характерный, типичный уровень, например конечный уровень предыдущего этапа развития (или средний его уровень, если на предыдущем этапе уровень то повышался, то понижался).

Абсолютный прирост показывает, на сколько единиц увеличился (или уменьшился) уровень по сравнению с базисным, т. е. за тот или иной промежуток (период) времени. Абсолютный прирост равен разности между сравниваемыми уровнями и измеряется в тех же единицах, что и эти уровни:

где уi – уровень i-го года; yi-1 – уровень предшествующего года; y0 – уровень базисного года.

Абсолютный прирост за единицу времени (месяц, год) измеряет абсолютную скорость роста (или снижения) уровня. Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных цепных приростов равна соответствующему базисному приросту, т. е. общему приросту за весь период.

Более полную характеристику роста можно получить только тогда, когда абсолютные величины дополняются относительными. Относительными показателями динамики являются темпы роста и темпы прироста, характеризующие интенсивность процесса роста.

Темп роста (Тр) – статистический показатель, который отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения – какую часть базисного уровня составляет сравниваемый уровень; измеряется отношением текущего уровня к предыдущему или базисному:

Между цепными и базисными темпами роста, выраженными в форме коэффициентов, существует определенная взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста за весь соответствующий период.

Темп прироста (Тпр) характеризует относительную величину прироста, т. е. представляет собой отношение абсолютного прироста к предыдущему или базисному уровню:

Темп прироста, выраженный в процентах, показывает, на сколько процентов увеличился (или уменьшился) уровень по сравнению с базисным, принятым за 100 %.

При анализе темпов развития никогда не следует упускать из виду, какие абсолютные величины – уровни и абсолютные приросты – скрываются за темпами роста и прироста. Нужно, в частности, иметь в виду, что при снижении (замедлении) темпов роста и прироста абсолютный прирост может возрастать.

В связи с этим важно изучать еще один показатель динамики – абсолютное значение (содержание) 1 % прироста, который определяется как результат деления абсолютного прироста на соответствующий темп прироста:

3. С течением времени изменяются не только уровни явлений, но и показатели их динамики – абсолютные приросты и темпы развития, поэтому для обобщающей характеристики развития, для выявления и измерения типичных основных тенденций и закономерностей и решения других задач анализа используются средние показатели временного ряда – средние уровни, средние абсолютные приросты и средние темпы динамики.

При вычислении средних показателей динамики необходимо иметь в виду, что к этим средним показателям полностью относятся общие положения теории средних величин. Это означает прежде всего, что динамическая средняя будет типичной, если она характеризует период с однородными, более или менее стабильными условиями развития явления. Выделение таких периодов – этапов развития – в определенном отношении аналогично группировке. Если же динамическая средняя величина исчислена за период, в течение которого условия развития явления существенно менялись, т. е. период, охватывающий разные этапы развития явления, то такой средней величиной нужно пользоваться с большой осторожностью, дополняя ее средними величинами за отдельные этапы.

Наиболее просто вычисляется средний уровень интервального ряда динамики абсолютных величин с равностоящими уровнями. Расчет производится по формуле простой средней арифметической:

где n – число фактических уровней за последовательные равные отрезки времени.

Для моментного ряда с разностоящими уровнями расчет среднего уровня ряда производится по формуле

Средний абсолютный прирост показывает, на сколько единиц увеличивался или уменьшался уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежемесячно, ежегодно и т. д.). Средний абсолютный прирост характеризует среднюю абсолютную скорость роста (или снижения) уровня и всегда является интервальным показателем. Он вычисляется путем деления общего прироста за весь период на длину этого периода в тех или иных единицах времени:

Расчет среднего абсолютного цепного прироста:

Расчет среднего абсолютного базисного прироста:

где – цепные абсолютные приросты за последовательные промежутки времени; n – число цепных приростов; У0 – уровень базисного периода.

Средний темп роста, выраженный в форме коэффициента, показывает, во сколько раз увеличивается уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.).

Для средних темпов роста и прироста сохраняет силу та же взаимосвязь, которая имеет место между обычными темпами роста и прироста:

Средний темп прироста (или снижения), выраженный в процентах, показывает, на сколько процентов увеличивался (или снижался) уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.). Средний темп прироста характеризует среднюю интенсивность роста, т. е. среднюю относительную скорость изменения уровня.

2. Вариация альтернативного признака

3. Виды дисперсий. Правило сложения дисперсий

4. Правило сложения дисперсий для альтернативного признака

Зарегистрированные в процессе статистического наблюдения различия величины признака уотдельных единиц совокупности называются вариацией признака. По степенивариации признака можно судить о процессах развития изучаемых явлений, о типичности средних величин. Дело в том, что средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывая строения совокупности.

Она не показывает, как относительно нее располагаются варианты осредняемого признака — сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но водном случае все индивидуальные значения могут мало отличаться от нее, а в другом - эти отличия могут быть велики, т. е. в одном случае вариация признака мала, а в другом - велика, что имеет большое значение для характеристики надежности средней величины.

Для определения меры вариации признака в статистике исполь-зуются абсолютные и относительные показатели вариации .

К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадрата чес кое отклонение.

Размах вариации (R) является самым простым из абсолютных показателей вариации и представляет собой разность между максимальным и минимальным значениями признака:

где X max - максимальное значение признака в совокупности;

X min - минимальное значение признака в совокупности.

Величина размаха вариации зависит только от крайних значений учитывает всех изменений варьирующего признака в пределах изучаемой совокупности. Поэтому при изучении вариации нельзя ограничиваться расчетом только этого показателя. Для анализа вариации необходимы показатели, дающие обобщенную характер всех колебаний варьирующего признака.

Среднее линейное отклонение является простейшим показате-лем такого типа и представляет собой среднюю величину абсолютных отклонений индивидуальных значений признака от их средней ариф-метической величины.

Среднее линейное отклонение для несгруппированных дан-ных определяется по формуле (5.2):

Среднее линейное отклонение для сгруппированных данных рассчитывается так (5.3):

Следует отметить, что среднее линейное отклонение не всегда улавливает степень вариации значений признака. Поэтому в статисти-ке применяется более чувствительный обобщающий показатель - дисперсия . Дисперсия представляет собой средний квадрат отклоне-ний индивидуальных значений признака от их средней величины. Возведение в квадрат позволяет резко усилить различия в величинах отклонений.


Дисперсия для несгруппированных данных вычисляется по формуле (5.4):

Дисперсия для сгруппированных данных рассчитывается так (5.5):

Для расчета дисперсии применяется также следующая формула (5.6):

Среднее квадратическое отклонение представляет собой ко-рень квадратный из дисперсии (5.7) или (5.8):

Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, на сколько в среднем отличаются индивидуальные значения признака от их среднего значения. Однако величине среднеквадратическое отклонение во всех случаях превыша-ет среднее линейное, так как более чутко реагирует на вариацию. Для симметричных и умеренно асимметричных распределений имеет ме-сто следующее соотношение (5.9):

Размах вариации, среднее линейное отклонение и среднееквад-ратическое отклонение выражаются в именованных числах, т. е. име-ют единицу измерения (такую же, как и значения признака). Поэтому их нельзя непосредственно использовать для сравнения степени ва-риации по одному и тому же признаку в двух группах с разным уров-нем средних, а также для сравнения вариации двух различных призна-ков в одной группе. В этих случаях применяются следующие относи-тельные показатели вариации.

Коэффициент осцилляции (5.10)

Относительное линейное отклонение (линейный коэффициент вариации) (5.11):

Коэффициент вариация (5.12):

Коэффициент вариации позволяет не только получить обоб-щающую характеристику вариации признака в совокупности, но и дает возможность сделать выводы об однородности совокупности.Со-вокупность считается однородной, если коэффициент вариации не превышает 33%.Средние величины, рассчитанные по однородной совокупности, являются ее достаточно надежными характеристиками.

Вариация альтернативного признака

В статистике помимо показателей вариации количественных признаков широко используются показатели вариации качественных признаков (в частности, при проектировании выборочного наблюдения). Вариация альтернативного признака количественно проявляется в значении 0 (нуля) у единиц, которые этим признаком не обладают, или 1 (единицы) у тех, которые данный признак имеют. Пусть р — до-ля единиц в совокупности, обладающих данным признаком, q — доля единиц, не обладающих данным признаком, причем p + q = 1.

Среднее значение альтернативного признака определим по формуле средней арифметической (5.13):

Дисперсия альтернативного признака определяется по формуле (5.14):

Таким образом, средняя величина альтернативного признака равна его доле в данной совокупности, а дисперсия — произведению доли его наличия и доли его отсутствия. Максимальное значение дис-персии альтернативного признака, означающее максимальную неод-нородность совокупности, равно 0,25 при p = q = 0,5.

Назначение сервиса . С помощью сервиса в онлайн режиме определяются следующие показатели:
  • средняя взвешенная, дисперсия, среднеквадратическое отклонение, мода, медиана, размах вариации;
  • квартили, децили, квартильный коэффициент дифференциации, линейный коэффициент вариации, коэффициент вариации;
  • среднее линейное отклонение, коэффициент осцилляции.

Инструкция . Чтобы рассчитать показатели вариации, выберите вид ряда, укажите количество исходных данных. Полученное решение сохраняется в файле Word (). Если предварительно требуется сгруппировать ряд (т.е. построить вариационный ряд), то необходимо воспользоваться онлайн-калькулятором Группировка .

Вид статистического ряда
Пример
X
3.45
3.89
5.00
3.00
2.56
1.71
3.34
4.21
4.85
Дискретный ряд
Пример
X i - X i+1 f
до 20 5
20-25 10
25-30 40
30-35 70
35-40 90
40-45 30
45-50 15
свыше 50 10
Итого 270
Интервальный ряд
Пример
X f
20 5
25 10
30 40
35 70
40 90
45 30
50 15
60 10
Итого 270
Вариационный ряд
Количество строк ",0);">

Проверка гипотезы о виде распределения ряда осуществляется через калькулятор Изучение формы распределения ряда .

Классификация показателей вариации

  1. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия и среднеквадратическое отклонение. Вторая группа показателей вычисляется, как отношение абсолютных показателей к средней арифметической (медиане).
  2. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.
Показатель Формула
Средняя арифметическая простая
Мода
Размах вариации R=X max -X min
;
;
Среднее квадратическое отклонение

Числовые характеристики вариационного ряда

Числовые характеристики вариационных рядов вычисляют по данным, полученным в результате наблюдений (статистическим данным), поэтому их называют также статистическими характеристиками или оценками. На практике часто оказывается достаточным знание сводных характеристик вариационных рядов: средних или характеристик положения (центральной тенденции); характеристик рассеяния или вариации (изменчивости); характеристик формы (асимметрии и крутости распределения).
Самой известной и наиболее употребляемой характеристикой любого вариационного ряда является его средняя арифметическая, называемая также выборочным средним . Средняя арифметическая характеризует значения признака, вокруг которого концентрируются наблюдения, т.е. центральную тенденцию распределения. В статистическом анализе кроме средней арифметической, называемой аналитической средней, широко применяют структурные, или порядковые, средние, к которым относятся медиана и мода.
Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше ее, а любой, больший медианы, продолжает быть большее ее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми. Особенность моды как меры центральной тенденции заключается в том, что она также не изменяется при изменении крайних членов ряда, т.е. обладает определенной устойчивостью к вариации признака.

Таблица - Числовые характеристики вариационного ряда

Характеристики положения Среднее арифметическое (выборочное среднее)
Мода Mo = x j , если m j = m max
Me = x k+1 , если n = 2k+1;
Me = (x k + x k+1)/2, еслиn = 2k
Характеристики рассеяния
Выборочная дисперсия
Выборочное среднее квадратичное отклонение
Исправленная дисперсия
Исправленное среднее квадратичное отклонение
Среднее абсолютное отклонение
Вариационный размах R = x max - x min
Квартильный размах R Q = Q в – Q н
Характеристики формы Коэффициент асимметрии
Коэффициент эксцесса

Для получения полного представления о вариационном ряде (определив центральную тенденцию распределения с помощью характеристик положения) далее оценивают рассеяние (вариацию, изменчивость) исследуемого признака вокруг этих величин. Простейшим и, весьма приближенным показателем вариации (изменчивости), является вариационный размах . Размах вариации наиболее полезен, если нужен быстрый и общий взгляд на изменчивость при сравнении большого количества выборок.
Но наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин, в частности, вокруг средней арифметической. К таким оценкам относятся выборочная дисперсия и среднее квадратичное отклонение . Выборочная дисперсия обладает одним существенным недостатком: если среднее арифметическое выражается в тех же единицах, что и значения случайной величины, то, согласно определению, дисперсия выражается уже в квадратных единицах. Этого недостатка можно избежать, если использовать в качестве меры вариации признака среднее квадратичное отклонение. При малых объемах выборки дисперсия является смещенной оценкой, поэтому при объемах n ≤ 30 используют исправленную дисперсию и исправленное среднее квадратичное отклонение .
Другой часто используемой характеристикой меры рассеяния признака является коэффициент вариации . Достоинством коэффициента вариации является то, что это безразмерная характеристика, позволяющая сравнивать варьирование несоизмеримых вариационных рядов. Кроме того, чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя. Совокупности с коэффициентом вариации V> 30-35% принято считать неоднородными.
Наряду с дисперсией используют и среднее абсолютное отклонение . Достоинством среднего линейного отклонения является его размерность, т.к. выражается в тех же единицах, что и значения случайной величины. Дополнительным и простым показателем рассеяния значений признака является квартильный размах. Квартильный размах включает в себя медиану и 50% наблюдений, отражающих центральную тенденцию признака, исключая наименьшие и наибольшие значения.
К характеристикам формы относят коэффициент асимметрии и эксцесс. Если коэффициент асимметрии равен нулю, то распределение имеет симметричную форму. Если распределение асимметрично, одна из ветвей полигона частот имеет более пологий спуск, чем другая. Если асимметрия правосторонняя, то справедливо неравенство:,что означает преимущественное появление в распределении более высоких значений признака. Если асимметрия левосторонняя, то выполняется неравенство: , означающее, что в распределении чаще встречаются более низкие значения. Чем больше значение коэффициента асимметрии, тем более асимметрично распределение (до 0,25 асимметрия незначительная; от 0,25 до 0,5 умеренная; свыше 0,5 – существенная).
Эксцесс является показателем крутости (островершинности) вариационного ряда по сравнению с нормальным распределением. Если эксцесс положителен, то полигон вариационного ряда имеет более крутую вершину. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине. Если эксцесс отрицателен - то полигон имеет более пологую вершину по сравнению с нормальной кривой. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от минимального до максимального значения. Чем больше абсолютная величина эксцесса, тем существеннее распределение отличается от нормального.

Типы вариации

Вариация – колеблемость или изменяемость величин признака у единиц совокупности.
Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям.
Под вариацией во времени подразумевают изменение значений признака в различные моменты времени. Так, со временем изменяются средняя продолжительность жизни, мнения людей и т.д.

Принципы определения показателей вариации

Для ранжированного ряда показатели вариации определяются по простым формулам (например, средняя величина определяется по формуле средней арифметической простой). Для вариационных рядов показатели вариации определяются по агрегатным формулам (с использованием частот). В этом случае показатели вариации являются взвешенными (например, взвешенная средняя).

Показатели вариации и способы их расчета

Понятие вариации

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической . В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи - один как причина (фактор), другой как следствие (результат) его действия. Точнее говоря, проявляется зависимость вариации одного признака от вариации другогоили от нескольких других.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией . Следовательно, общая вариация слагается из систематической и случайной вариации. Но систематическая вариация, если между признаками имеется довольно существенная связь, в конце концов пробивает себе дорогу через хаос случайных колебаний вариантов зависимого признака и проявляет себя.

Наличие вариации признаков, изучаемых статистикой явлений, ставит задачу определить меру вариации, ее измерение, найти соответствующие измерители - показатели, характеризующие размеры этой вариации, а также выявить сущность и методы вычисления определяющих ее факторов.

Показатели вариации и способы их расчета

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений признака. Исчислив среднюю арифметическую по данным вариационного ряда, мы не знаем о том, как отдельные значения изучаемого признака группируются вокруг средней. Для вариационного ряда важно изучать степень сплоченности всех отдельных значений признака вокруг его среднего значения, степень разбросанности этих значений, степень их колеблемости. Для этого в теории статистики используются показатели вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. К относительным показателям вариации относятся: коэффициенты вариации, осцилляции, относительное линейное отклонение и др. Относительные показатели вычисляются как отношение абсолютных показателей вариации к средней величине.

1.Размах вариации (R )представляет собой разность между максимальным (x max ) и минимальным (x min ) значением признака исследуемой совокупности:

.

Размах вариации (амплитуда колебаний) дает лишь самое общее представление о размерах вариации, характеризует предел изменения значений признака в исследуемой совокупности. Этот показатель вариации обладает существенным недостатком: он характеризует только отклонения и не дает представление о распределении отклонений по все совокупности. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из всех его значений. Для анализа вариации необходим показатель, который бы отражал все колебания варьирующего признака и давал обобщенную его характеристику.

2. Среднее линейное отклонение ()– это среднее из абсолютных отклонений значений признака от средней арифметической:

, .

Поскольку сумма отклонений значений признака от средней величины равна нулю, приходится все отклонения брать по модулю.

Таково в среднем линейное отклонение вариантов признака от их средней величины. Если среднее линейное отклонение по сравнению со средней величиной признака небольшое, это свидетельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя – типична. Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности.

3. Дисперсия – это среднее из квадратов отклонений индивидуальных значений признака от средней величины:

, .

Математические свойства дисперсии

1) Дисперсия постоянной величины равна нулю:

.

2) Дисперсия не изменится, если все значения признака увеличить или уменьшить на некоторую постоянную величину А.

.

3) Если все значения варьирующего признака разделить (умножить) на одну и ту же величину h , то дисперсия уменьшится (увеличится) в h 2 раз.

, .

4)Средний квадрат отклонений индивидуальных значений признака от любой величины А , отличающейся от средней арифметической (A ≠ ), всегда больше среднего квадрата отклонений, исчисленного от средней арифметической:

или .

Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней от этой условно взятой величины А , т.е. на .

Другими словами, дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин.

или .

В случае когда А приравнивается нулю и, следовательно, отклонения не вычисляются, формула принимает следующий вид:

, или .

4.Среднее квадратическое отклонение находится как корень из дисперсии. Показывает (как и среднее линейное отклонение) на сколько в среднем индивидуальные значения признака отклоняются от средней арифметической:

,
.

5.Коэффициент вариации – это относительный показатель, исчисляемый как отношение среднего квадратического отклонения к средней арифметической:

Считается, что если коэффициент вариации превышает 33%, то совокупность нельзя признать качественно однородной. Если K v ≤ 33%, то можно утверждать, что совокупность более или менее однородна, а следовательно, средняя, рассчитанная по такой совокупности, типична. Необходимость исчисления коэффициента вариации вызвана тем, что показатели вариации в абсолютных величинах, как правило, непосредственно несравнимы.



Таблица 8.1 – Распределение предприятий по объему продаж

Алгоритм расчета показателей вариации следующий:

1) определим размах вариации:

R = 21 – 1 = 20 млн. руб.

2) найдем середину интервалов по исходным данным (x i ) и запишем в табл. 8.2;

3) определим среднее значение по формуле средней арифметической взвешенной, для этого введем графу (x i f i ):

млн. руб.

4) для расчета среднего линейного отклонения введем графы и :

млн. руб.

Таково в среднем отклонение вариантов признака от их средней величины.

5) для расчета дисперсии введем графы и .

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение его причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака изучаемой совокупности,но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагается около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом - эти отличия велики, т.е. в одном случае вариация признака мала, а в другом велика, это весьма важное значение для характеристики надежности средней величины.

Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, - тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.

Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:

В первой бригаде 95, 100, 105 (???????х1=100 шт.);

Во второй бригаде - 75, 100, 125 (?х2=100 шт.)

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет 1=2=100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде гораздо меньше, чем во второй.

Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей:

  • * размах вариации;
  • *среднее линейное отклонение;
  • * дисперсия;
  • * среднее квадратическое отклонение;
  • *коэффициент вариации.

Самым элементарным показателем вариации признака является размах вариацииR, представляющим собой разность максимальным и минимальным значениями признака:

R = хmax- хmin.

В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде - R1= 10 шт. (т.е.105-95); во второй бригаде - R2=50 шт. (т.е 125-75), что в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива». Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3Ч125), а в первой - только 315 шт., т.е. (3Ч105).

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику. Простейший показатель такого типа - среднее линейное отклонение.

>Cреднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: (x -).

Среднее линейное отклонение:

* для несгруппированных данных

где n - число членов ряда;

*для сгруппированных данных

где?f - сумма частот вариационного ряда.

В формулах (2.1) и (2.2) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль - алгебраическая сумма отклонений вариантов отих средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

> Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется поформула простой и взвешенной дисперсий (в зависимости от исходных данных):

*простая дисперсия для несгруппированных данных

*взвешенная дисперсия для вариационного ряда

Техника вычисления дисперсии по формулам (2.3) и (2.4) достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой.

Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике). Приведем два из них:

  • 1) если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;
  • 2) если все значения признака уменьшить или увеличить в одно и тоже число раз (iраз), то дисперсия соответственно уменьшится или увеличится в i2раз.

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака.

  • >Среднее квадратическое отклонение у равно корню квадратному из дисперсии:
  • *для несгруппированных данных

*для вариационного ряда

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

>Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

Решение задач

Задача 3.6

Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность составляет 20 человек, а минимальный и максимальный доход соответственно равен 5000 и 30000 рублей.

Согласно формуле Стерджессаn = 1 + 3,322 - lgN,

где n - число групп;

N - число единиц совокупности, определим число групп в коллективе фирмы.

n = 1 + 3,322 - lg 20 = 1 + 3,322 -1,3?3.

Вариация признака (уровень дохода сотрудников) проявляется в сравнительно узких границах и распределение будет носить равномерный характер. Совокупность сотрудников разделится на 3 группировки с равными интервалами. Величина равного интервала определяется по следующей формуле:

h = R/n = (xmax-xmin)/n,

где xmax и xmin- максимальное и минимальное значение признака в совокупности;

n - число групп.

h = (30000 - 5000)/3 = 8333,33.

Итак, величина интервала определена, теперь можно определить границы групп:

  • 5000 - 13333,33 1-я группа
  • 13333,33 - 21666,66 2-я группа
  • 21666,66 - 30000 3-я группа.

Задача 7.4

По результатам зимней экзаменационной сессии одного курса студентов:

Определите:

  • а) средний балл оценки знаний студентов;
  • б) модальный балл успеваемости и медианное значение балла;
  • в) сделайте выводы о характере данногораспределении.

Средний балл найдем по формуле

ар= (2х6 + 3х75 + 4х120 + 5х99)/300 = 1212/300 = 4,04. Средний балл по итогам сессии достаточно высокий и равен 4.

Мода (Mo) - значение признака наиболее часто встречающееся в исследуемой совокупности, т.е., это один из вариантов признака, который в ряду распределения имеет наибольшую частоту (частость).

В дискретном ряду модальное значение определяется визуальнопо максимальной частоте. Соответственно, Mo= 4,т.к в данной совокупности именно эту оценку получило самое большое число студентов в группе.

Медиана (Ме) - значение признака (варианта), приходящееся на середину ранжированной (упорядоченной) совокупности, т.е. это вариант, который делит ряд распределения на две равные по объему части.

Медиана, как и мода, не зависит от крайних значений вариантов, поэтому применяется для характеристики центра в ряду распределения.

Для определения медианы в ранжированном ряду необходимо вначале найти номер медианы по формуле:

N = (300+1)/2 = 150,5

Затем используют кумулятивные частоты Sfили частость Sd.

Зная, чтоN = 150,5, накапливаем частоты до тех пор, пока кумулятивная частотаSfне будет равна этому номеру или превысит его. Следовательно, на 2 балла сдали 6 человек + 75 человек, сдавшие на 3 балла - это 81человек, + 120 человек, сдавшие на 4, равно 201 человек. Таким образом, медиана данного ряда распределения равна 4 баллам, т.е. половина студентов сдали на 2, 3 и 4,а половина на 4 и 5.

Вывод: средний балл,модальное значение и медиана совпадают и равняются 4 баллам. Это говорит о симметричном распределении частот множества.




© 2024
womanizers.ru - Журнал современной женщины