Light-electric.com

IT Журнал
103 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Как рассчитать коэффициент вариации в excel

Расчет показателей вариации в Excel

Добрый день, уважаемые любители статистического анализа данных, а сегодня еще и программы Excel.

Проведение любого статанализа немыслимо без расчетов. И сегодня в рамках рубрики «Работаем в Excel» мы научимся рассчитывать показатели вариации. Теоретическая основа была рассмотрена ранее в ряде статей о вариации данных. Кстати, на этом указанная тема не закончилась, к выпуску планируются новые статьи – следите за рекламой! Однако сухая теория без инструментов реализации – вещь не сильно полезная. Поэтому по мере появления теоретических выкладок, я стараюсь не отставать с заметками о соответствующих расчетах в программе Excel.

Сегодняшняя публикация будет посвящена расчету в Excel следующих показателей вариации:

— максимальное и минимальное значение

— среднее линейное отклонение

— дисперсия (по генеральной совокупности и по выборке)

— среднее квадратическое отклонение (по генеральной совокупности и по выборке)

Факт возможности расчета упомянутых показателей в Excel свидетельствует о практическом их использовании. И, несмотря на очевидность некоторых моментов, я постараюсь расписать все подробно.

Максимальное и минимальное значение

Начнем с формул максимума и минимума. Что такое максимальное и минимальное значение, уверен, знают почти все. Максимум – самое большое значение из анализируемого набора данных, минимум – самое маленькое (может быть и отрицательным числом). Это крайние значения в совокупности данных, обозначающие границы их вариации. Примеры реального использования каждый может придумать сам – их полно. Это и минимальные/максимальные цены на что-нибудь, и выбор наилучшего или наихудшего решения задачи, и всего, чего угодно. Минимум и максимум – весьма информативные показатели. Давайте теперь их рассчитаем в Excel.

Как нетрудно догадаться, делается сие элементарно – как два клика об асфальт. В Мастере функций следует выбрать: МАКС – для расчета максимального значения, МИН – для расчета минимального значения. Для облегчения поиска перечень всех функций можно отфильтровать по категории «Статистические».

Выбираем нужную формулу, в следующем окошке указываем диапазон данных (в котором ищется максимальное или минимальное значение) и жмем «ОК».

Функции МАКС и МИН достаточно часто используются, поэтому разработчики Экселя предусмотрительно добавили соответствующие кнопки в ленту. Они находятся там же, где суммаи среднее значение – в разворачивающемся списке.

В общем, для вызова функции максимума или минимума действий потребуется не больше, чем для расчета средней арифметической. Все архипросто.

Среднее линейное отклонение

Среднее линейное отклонение, напоминаю, представляет собой среднее из абсолютных (по модулю) отклонений от средней арифметической в анализируемой совокупности данных. Математическая формула имеет вид:

a – среднее линейное отклонение,

x – анализируемый показатель, с черточкой сверху – среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

В Excel эта функция называется СРОТКЛ.

После выбора функции СРОТКЛ указываем диапазон данных, по которому должен произойти расчет. Нажимаем «ОК». Наслаждаемся результатом.

Дисперсия

Дисперсия — это средний квадрат отклонений, мера характеризующая разброс данных вокруг среднего значения. Математическая формула дисперсии по генеральной совокупности имеет вид:

x – анализируемый показатель, с черточкой сверху – среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

Excel также предлагает готовую функцию для расчета генеральной дисперсии ДИСП.Г.

При анализе выборочных данных, следует использовать выборочную дисперсию, так как генеральная оказывается смещенной в сторону занижения.

Математическая формула выборочной дисперсии имеет вид:

в Excel выборочная дисперсия рассчитывает через функцию ДИСП.В.

Выбираем в Мастере функций нужную дисперсию (генеральную или выборочную), указываем диапазон, жмем кнопку «ОК». Полученное значение может оказаться очень большим из-за предварительного возведения отклонений в квадрат, поэтому дисперсия сама по себе мало о чем говорит. Ее обычно используют для дальнейших расчетов.

Среднее квадратическое отклонение

Среднеквадратическое отклонение по генеральной совокупности – это корень из генеральной дисперсии.

Выборочное среднеквадратическое отклонение – это корень из выборочной дисперсии.

Для расчета можно извлечь корень из формул дисперсии, указанных чуть выше, но в Excel есть и готовые функции:

— Среднеквадратическое отклонение по генеральной совокупности СТАНДОТКЛОН.Г

— Среднеквадратическое отклонение по выборке СТАНДОТКЛОН.В.

С названием этого показателя может возникнуть путаница, т.к. часто можно встретить синоним «стандартное отклонение». Пугаться не нужно – смысл тот же.

Далее, как обычно, указываем нужный диапазон и нажимаем на «ОК». Среднее квадратическое отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными. Об этом ниже.

Коэффициент вариации

Все показатели, рассмотренные выше, имеют привязку к масштабу исходных данных и не позволяют получить образное представление о вариации анализируемой совокупности. Для получения относительной меры разброса данных используют коэффициент вариации, который рассчитывается путем деления среднего квадартического отклонения на среднее арифметическое значение. Математическая формула такова:

В Экселе нет готовой функции для расчета коэффициента вариации, что не есть большая проблема. Расчет можно произвести простым делением стандартного отклонения на среднее значение. Для этого в строке формул пишем:

В скобках должен быть указан диапазон данных. При необходимости используется среднее квадратическое отклонение по выборке (СТАНДОТКЛОН.В).

Коэффициент вариации обычно выражается в процентах, поэтому ячейку с формулой можно обрамить процентным форматом. Нужная кнопка находится на ленте на закладке «Главная»:

Изменить формат также можно, выбрав «Формат ячеек» из выпадающего списка после выделения нужной ячейки правой кнопкой мышки.

Коэффициент вариации, в отличие от других показателей разброса значений, используется как самостоятельный и весьма информативный индикатор вариации данных. В статистике принято считать, что если коэффициент вариации менее 33%, то совокупность данных является однородной, если более 33%, то – неоднородной. Эта информация может быть полезна для предварительного описания данных и определения возможностей проведения дальнейшего анализа. Кроме того, коэффициент вариации, измеряемый в процентах, позволяет сравнивать степень разброса различных данных независимо от их масштаба и единиц измерений. Полезное свойство.

В целом, с помощью Excel все, или почти все, статистические показатели рассчитываются очень просто. Если что-то непонятно, всегда можно воспользоваться окошком для поиска в Мастере функций. Ну, и Гугл в помощь.

Расчет коэффициента вариации в Microsoft Excel

Одним из основных статистических показателей последовательности чисел является коэффициент вариации. Для его нахождения производятся довольно сложные расчеты. Инструменты Microsoft Excel позволяют значительно облегчить их для пользователя.

Вычисление коэффициента вариации

Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.

В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.

Шаг 1: расчет стандартного отклонения

Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из дисперсии. Для расчета стандартного отклонения используется функция СТАНДОТКЛОН. Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В.

Синтаксис данных функций выглядит соответствующим образом:

= СТАНДОТКЛОН(Число1;Число2;…)
= СТАНДОТКЛОН.Г(Число1;Число2;…)
= СТАНДОТКЛОН.В(Число1;Число2;…)

  1. Для того, чтобы рассчитать стандартное отклонение, выделяем любую свободную ячейку на листе, которая удобна вам для того, чтобы выводить в неё результаты расчетов. Щелкаем по кнопке «Вставить функцию». Она имеет внешний вид пиктограммы и расположена слева от строки формул.
Читать еще:  Надстройка поиск решения в excel 2020

Выполняется активация Мастера функций, который запускается в виде отдельного окна с перечнем аргументов. Переходим в категорию «Статистические» или «Полный алфавитный перечень». Выбираем наименование «СТАНДОТКЛОН.Г» или «СТАНДОТКЛОН.В», в зависимости от того, по генеральной совокупности или по выборке следует произвести расчет. Жмем на кнопку «OK».

Открывается окно аргументов данной функции. Оно может иметь от 1 до 255 полей, в которых могут содержаться, как конкретные числа, так и ссылки на ячейки или диапазоны. Ставим курсор в поле «Число1». Мышью выделяем на листе тот диапазон значений, который нужно обработать. Если таких областей несколько и они не смежные между собой, то координаты следующей указываем в поле «Число2» и т.д. Когда все нужные данные введены, жмем на кнопку «OK»

  • В предварительно выделенной ячейке отображается итог расчета выбранного вида стандартного отклонения.
  • Шаг 2: расчет среднего арифметического

    Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция – СРЗНАЧ. Вычислим её значение на конкретном примере.

      Выделяем на листе ячейку для вывода результата. Жмем на уже знакомую нам кнопку «Вставить функцию».

    В статистической категории Мастера функций ищем наименование «СРЗНАЧ». После его выделения жмем на кнопку «OK».

    Запускается окно аргументов СРЗНАЧ. Аргументы полностью идентичны тем, что и у операторов группы СТАНДОТКЛОН. То есть, в их качестве могут выступать как отдельные числовые величины, так и ссылки. Устанавливаем курсор в поле «Число1». Так же, как и в предыдущем случае, выделяем на листе нужную нам совокупность ячеек. После того, как их координаты были занесены в поле окна аргументов, жмем на кнопку «OK».

  • Результат вычисления среднего арифметического выводится в ту ячейку, которая была выделена перед открытием Мастера функций.
  • Шаг 3: нахождение коэффициента вариации

    Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.

      Выделяем ячейку, в которую будет выводиться результат. Прежде всего, нужно учесть, что коэффициент вариации является процентным значением. В связи с этим следует поменять формат ячейки на соответствующий. Это можно сделать после её выделения, находясь во вкладке «Главная». Кликаем по полю формата на ленте в блоке инструментов «Число». Из раскрывшегося списка вариантов выбираем «Процентный». После этих действий формат у элемента будет соответствующий.

    Снова возвращаемся к ячейке для вывода результата. Активируем её двойным щелчком левой кнопки мыши. Ставим в ней знак «=». Выделяем элемент, в котором расположен итог вычисления стандартного отклонения. Кликаем по кнопке «разделить» (/) на клавиатуре. Далее выделяем ячейку, в которой располагается среднее арифметическое заданного числового ряда. Для того, чтобы произвести расчет и вывести значение, щёлкаем по кнопке Enter на клавиатуре.

  • Как видим, результат расчета выведен на экран.
  • Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.

      Выделяем предварительно отформатированную под процентный формат ячейку, в которой будет выведен результат. Прописываем в ней формулу по типу:

    Вместо наименования «Диапазон значений» вставляем реальные координаты области, в которой размещен исследуемый числовой ряд. Это можно сделать простым выделением данного диапазона. Вместо оператора СТАНДОТКЛОН.В, если пользователь считает нужным, можно применять функцию СТАНДОТКЛОН.Г.

  • После этого, чтобы рассчитать значение и показать результат на экране монитора, щелкаем по кнопке Enter.
  • Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.

    Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.

    Отблагодарите автора, поделитесь статьей в социальных сетях.

    Прогнозируем с Excel: как посчитать коэффициент вариации

    Каждый раз, выполняя в Excel статистический анализ, нам приходится сталкиваться с расчётом таких значений, как дисперсия, среднеквадратичное отклонение и, разумеется, коэффициент вариации. Именно расчёту последнего стоит уделить особое внимание. Очень важно, чтобы каждый новичок, который только приступает к работе с табличным редактором, мог быстро подсчитать относительную границу разброса значений.

    В этой статье мы расскажем, как автоматизировать расчеты при прогнозировании данных

    Что такое коэффициент вариации и для чего он нужен?

    Итак, как мне кажется, нелишним будет провести небольшой теоретический экскурс и разобраться в природе коэффициента вариации. Этот показатель необходим для отражения диапазона данных относительно среднего значения. Иными словами, он показывает отношение стандартного отклонения к среднему значению. Коэффициент вариации принято измерять в процентном выражении и отображать с его помощью однородность временного ряда.

    Коэффициент вариации станет незаменимым помощником в том случае, когда вам необходимо будет сделать прогноз по данным из заданной выборки. Этот индикатор выделит главные ряды значений, которые будут наиболее полезными для последующего прогнозирования, а также очистит выборку от малозначительных факторов. Так, если вы видите, что значение коэффициента равно 0%, то с уверенностью заявляйте о том, что ряд является однородным, а значит, все значения в нём равны один с другим. В случае, если коэффициент вариации принимает значение, превышающее отметку в 33%, то это говорит о том, что вы имеете дело с неоднородным рядом, в котором отдельные значения существенно отличаются от среднего показателя выборки.

    Как найти среднее квадратичное отклонение?

    Поскольку для расчёта показателя вариации в Excel нам необходимо использовать среднее квадратичное отклонение, то вполне уместно будет выяснить, как нам посчитать этот параметр.

    Из школьного курса алгебры мы знаем, что среднее квадратичное отклонение — это извлечённый из дисперсии квадратный корень, то есть этот показатель определяет степень отклонения конкретного показателя общей выборки от её среднего значения. С его помощью мы можем измерить абсолютную меру колебания изучаемого признака и чётко её интерпретировать.

    Рассчитываем коэффициент в Экселе

    К сожалению, в Excel не заложена стандартная формула, которая бы позволила рассчитать показатель вариации автоматически. Но это не значит, что вам придётся производить расчёты в уме. Отсутствие шаблона в «Строке формул» никоим образом не умаляет способностей Excel, потому вы вполне сможете заставить программу выполнить необходимый вам расчёт, прописав соответствующую команду вручную.

    Вставьте формулу и укажите диапазон данных

    Для того чтобы рассчитать показатель вариации в Excel, необходимо вспомнить школьный курс математики и разделить стандартное отклонение на среднее значение выборки. То есть на деле формула выглядит следующим образом — СТАНДОТКЛОН(заданный диапазон данных)/СРЗНАЧ(заданный диапазон данных). Ввести эту формулу необходимо в ту ячейку Excel, в которой вы хотите получить нужный вам расчёт.

    Читать еще:  Убрать пароль excel 2020

    Не забывайте и о том, что поскольку коэффициент выражается в процентах, то ячейке с формулой нужно будет задать соответствующий формат. Сделать это можно следующим образом:

    1. Откройте вкладку «Главная».
    2. Найдите в ней категорию «Формат ячеек» и выберите необходимый параметр.

    Как вариант, можно задать процентный формат ячейке при помощи клика по правой кнопке мыши на активированной клеточке таблицы. В появившемся контекстном меню, аналогично вышеуказанному алгоритму нужно выбрать категорию «Формат ячейки» и задать необходимое значение.

    Выберите «Процентный», а при необходимости укажите число десятичных знаков

    Возможно, кому-то вышеописанный алгоритм покажется сложным. На самом же деле расчёт коэффициента так же прост, как сложение двух натуральных чисел. Единожды выполнив эту задачу в Экселе, вы больше никогда не вернётесь к утомительным многосложным решениям в тетрадке.

    Всё ещё не можете сделать качественное сравнение степени разброса данных? Теряетесь в масштабах выборки? Тогда прямо сейчас принимайтесь за дело и осваивайте на практике весь теоретический материал, который был изложен выше! Пусть статистический анализ и разработка прогноза больше не вызывают у вас страха и негатива. Экономьте свои силы и время вместе с табличным редактором Excel.

    XYZ-анализ: об управлении ассортиментом простыми словами

    СУТЬ XYZ-АНАЛИЗА

    XYZ-анализ – математически-статистический метод, позволяющий анализировать и прогнозировать стабильность продаж отдельных видов товаров и колебания уровня потребления тех или иных товаров. АВС-анализ показывает нам вклад товара в результат магазина, а XYZ анализ показывает стабильность или нестабильность спроса. Чем стабильнее спрос на товар, тем легче мы им управляем, тем ниже потребность в товарных запасах, тем легче планировать движение продукта. Таким образом, мы имеем дополнительный материал для принятия решений о пребывании товара в нашей ассортиментной матрице.

    Неделю назад продали 20 батонов хлеба, три дня назад -19 батонов, сегодня – 20, завтра продажи тоже будут равны -19-20 штук. Товар продается стабильно. Это товар Х.

    Категория X – есть товары, характеризуются стабильностью продаж и, как следствие, высокими возможностями прогноза продаж Отклонение от средних продаж незначительно (в ту или иную сторону). Отклонение от среднего значения называется КОЭФФИЦИЕНТОМ ВАРИАЦИИ. Для товаров Х коэффициент вариации не превышает 10%. Колебания спроса незначительны, спрос на них устойчив, следовательно, можно по этим товарам делать оптимальные запасы и использовать математические методы прогноза спроса и оптимального запаса. Так же ниже рассмотрим возможность заказа фиксированной партии – насколько это возможно для товаров группы Х.

    Конфеты: неделю назад продали 20 коробок, три дня назад – 12 коробок, сегодня – 17, завтра продажи будут 23 коробки. Это категория Y – товары, имеющие колебания в спросе и как следствие, средний прогноз продаж. Коэффициент вариации составляет 10% – 25%. Отклонение от средней величины продаж существует, но оно колеблется в разумных пределах – в пределах 25%.

    Дорогой элитный коньяк – неделю назад продали 2 бутылки, три дня назад – 0, сегодня пришел человек и купил ящик (наверное, в офис на подарки) – 12 штук, а завтра продажи будут равны 1 бутылке. Товар нестабилен, относится к категории Z. Категория Z – товары с нерегулярным потреблением, какие-либо
    тенденции отсутствуют, точность прогноза продаж невысокая. Коэффициент вариации превышает 25% и может быть более 100%. Это может быть группа товаров, привозимая по заказу клиентов или недавно поступившая в продажу или товары уникальные, особенные, подверженные сезонному спросу и так далее.

    Так же, как и в случае в АВС-анализом, это рекомендованные сочетания, и иногда можно делать допуск коэффициента вариации по группе Х – 0-15%, группе Y – 15-40%, группе Z – от 40%.

    ЭТАПЫ XYZ-АНАЛИЗА

    1 шаг. Выбираем объект анализа (группа, категория, позиция) и параметр, по которому мы будем сравнивать объекты (продажи за месяц, например). Традиционно в рознице объектами XYZ-анализа являются товарная категория или товарная единица. За основу анализа берется период продаж не менее трех месяцев.

    2 шаг. Определить количество периодов, по которым будет проводиться анализ: неделя, декада, месяц, квартал/сезон, полугодие, год. Чем больше период, тем лучше, тем вернее будет статистика спроса. Важно – для анализа надо брать не менее трех периодов, по которым ведется отчетность. Если товар имеет оборачиваемость более месяца, то надо взять период, как минимум в три раза превышающий оборачиваемость (например, оборачиваемость категории «швейные машины» – 2 месяца. Тогда за основу надо взять период не менее 6 – ти месяцев).

    3 шаг. Определить коэффициент вариации – среднее квадратическое отклонение – для каждого объекта анализа. Коэффициент вариации означает величину, насколько продажа товара отклоняется от среднестатистической, то есть показывает, стабилен ли спрос на товар или нет.

    Расчет коэффициента вариации.
    Формула для расчета коэффициента вариации (Кв):

    де, хi— значение параметра по оцениваемому объекту за i- тый период,
    x — среднее значение параметра по оцениваемому объекту анализа,
    п — число периодов

    Эта кажущаяся сложной и громоздкой формула легко перекладывается в формулы Excel, с помощью которых применение данного анализа становится очень простым.

    Формула Excel выглядит так:
    =СТАНДОТКЛОНП(B3:D3)/СРЗНАЧ(B3:D3)

    Пример расчета коэффициента вариации по формулам в Excel



    Обратите особое внимание на товары, у которых есть периоды с нулевыми значениями, то есть там, где товар отсутствовал в продаже. Либо исключите их из анализа, либо измените формулу расчета коэффициента вариации – на ноль делить нельзя.

    4 шаг. Составить рейтинговый список объектов анализа по возрастанию значения коэффициента вариации. И последнее – определяем, какие объекты относятся к группе X, Y и Z.

    Вывод: как видим, некоторые категории пользуются постоянным спросом и по ним можно прогнозировать последующие продажи довольно точно. Однако некоторые категории – «Средства от насекомых», «Бритвенные принадлежности», «Краски для волос» продаются нерегулярно. Стоит внимательнее отнестись к этим категориям – возможно, поставки этих товаров идут с перебоями, или на эти товары проходила акция, которая кратковременно простимулировала спрос. Так же особого внимания требуют товары группы Х – особенно, если их вклад в общий оборот или прибыль невелик. Вероятно, поставки идут фиксированным заказом и товар продается с нулевым остатком до следующей поставки. В таком случае следует дополнительно исследовать спрос на такой товар – возможно, мы недодаем покупателям нужный им товар.

    ВАЖНО: если в случае в АВС-анализом у нас всегда будут товары А, В и С, то в случае в XYZ-анализом каких-то товаров может не быть – например, продажи устойчивы и товаров Z нет вообще (что является очень хорошим признаком – значит, можем регулировать величину товарного остатка на основе статистики, спрос постоянный, товар есть на складе). Или хуже: может не быть товаров Х – что говорит о нерегулярном спросе или сбоях в поставках товара.

    ОГРАНИЧЕНИЯ XYZ-АНАЛИЗА
    В реальной жизни на продажи и доходность товаров в магазине оказывает влияние огромное количество факторов: сезонность спроса, регулярность поставок, колебания цен на аналогичные товары у конкурента,
    наличие или отсутствие специальных мероприятий по продвижению и т.д. Все эти факторы будут вызывать колебания продаж, и, как следствие, высокие показатели коэффициента вариации.

    Читать еще:  2 окна excel рядом

    Результаты XYZ-анализа будут достоверны, только если анализируется достаточно длительный период времени. Важно, чтобы период, взятый для анализа, в несколько раз превосходил оборачиваемость товара
    в днях. Например, если период оборачиваемости дорого шампанского или эксклюзивных часов составляет
    4 месяца, то для анализа нужно брать период не менее 12 месяцев.

    Если же ассортимент обновляется часто, то нужно также использовать информацию о жизненном цикле товара и смотреть тенденцию развития всех новых позиций. Весьма вероятно, что в магазине модной одежды все товары поступают в продажу на один сезон, и тогда в таком магазине у нас вообще не будет группы Х. В случае, если мы имеем дело с сезонными коллекциями одежды и обуви, которые держатся в продаже максимум один сезон, то тогда этот анализ можно проводить по торговым маркам или по поставщикам.

    Также важно выяснять причины попадания товара в группу Z: было это вызвано действительно непредсказуемостью спроса, или просто товар нерегулярно попадал в магазин.

    XYZ-анализ невозможен, если в ассортименте много новых товаров или поставки идут с перебоями. В таком случае необходимо вводить другой параметр для анализа, а именно запросы или обращения клиентов. Именно ранжирование по обращениям может сделать картину более реальной. Однако и здесь нужно отмечать, идет ли запрос от разных покупателей, или это повторение одного запроса. Поэтому если магазин существует в условиях постоянного дефицита, то этот вид анализа вряд ли покажет истинную картину.

    Часто это вид анализа используется в складской логистике, где важно определить частоту спроса для грамотного распределения пространства на складе. В таком случае товары группы Х располагаются в «горячей» зоне отгрузки, товары групп Y и Z – в более отдаленных местах.

    Этот анализ очень хорош в сочетании с АВС-анализом – это выявление безусловных лидеров (группы АХ) и аутсайдеров (СZ) в ассортименте магазина.

    Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel

    Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.

    Дисперсия

    Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.

    Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

    Формула дисперсии в теории вероятностей имеет вид:

    То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

    На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:

    s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,

    X – отдельные значения,

    – среднее арифметическое по выборке.

    Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.

    Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.

    Расчет дисперсии в Excel

    Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.

    В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.

    Свойства дисперсии

    Свойство 1. Дисперсия постоянной величины A равна (нулю).

    Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А 2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

    Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

    Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

    Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.

    Среднеквадратичное (стандартное) отклонение

    Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:

    На практике формула стандартного отклонения следующая:

    Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

    Расчет cреднеквадратичного (стандартного) отклонения в Excel

    Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

    Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

    Коэффициент вариации

    Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:

    По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.

    Расчет коэффициента вариации в Excel

    Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

    Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

    Коэффициент осцилляции

    Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

    Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

    Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.

    Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.

    Ссылка на основную публикацию
    ВсеИнструменты
    Adblock
    detector