Як знайти медіану у математичній статистиці. Формула моди та медіани у статистиці. Розрахунок моди та медіани в інтервальному ряду

Допустимо, вам потрібно дізнатися, яка середня середина знаходиться у поширенні оцінок учнів або зразок даних контролю якості. Щоб обчислити медіану групи чисел, використовуйте функцію МЕДІАНу.

Функція МЕДІАНА вимірює центральну тенденцію, яка є центром множини чисел у статистичному розподілі. Існує три найбільш поширені способи визначення центральної тенденції:

    Середнє значення- це середнє арифметичне, яке обчислюється шляхом додавання набору чисел з наступним розподілом отриманої суми на їх кількість. Наприклад, середнім значенням для чисел 2, 3, 3, 5, 7 і 10 буде 5, яке є результатом розподілу їх суми, що дорівнює 30, на їхню кількість, що дорівнює 6.

    Медіана- це число, яке є серединою множини чисел, тобто половина чисел мають значення більші, ніж медіана, а половина чисел мають значення менші, ніж медіана. Наприклад, медіаною для чисел 2, 3, 3, 5, 7 та 10 буде 4.

    Мода- Це число, що найчастіше зустрічається в даному наборі чисел. Наприклад, модою для чисел 2, 3, 3, 5, 7 та 10 буде 3.

При симетричному розподілі множини чисел всі три значення центральної тенденції збігатимуться. При зміщеному розподілі множини чисел значення можуть бути різними.

Знімки екрана в цій статті отримані в Excel 2016. Якщо ви використовуєте іншу версію, інтерфейс може трохи відрізнятися, але функції будуть такими самими.

Приклад

Щоб цей приклад було простіше зрозуміти, скопіюйте його на порожній лист.

Порада:Щоб переключитись між переглядом результатів та переглядом формул, що повертають ці результати, натисніть клавіші CTRL+` (знак наголосу) або на вкладці Формулив групі Залежність формулнатисніть кнопку Показувати формули.

Мода та медіана– особливого роду середні, що використовуються вивчення структури варіаційного ряду. Їх іноді називають структурними середніми, на відміну від розглянутих раніше статечних середніх.

Мода– це величина ознаки (варіанту), яка найчастіше зустрічається у цій сукупності, тобто. має найбільшу частоту.

Мода має велике практичне застосування і часом лише мода може дати характеристику громадських явищ.

Медіана- Це варіанта, яка знаходиться в середині впорядкованого варіаційного ряду.

Медіана показує кількісну межу значення ознаки, що варіює, якої досягла половина одиниць сукупності. Застосування медіани поруч із середньої чи замість неї доцільно за наявності у варіаційному ряду відкритих інтервалів, т.к. для обчислення медіани не потрібно умовне встановлення меж відритих інтервалів, і тому відсутність відомостей про них не впливає на точність обчислення медіани.

Медіану застосовують також тоді, коли показники, які потрібно використовувати як ваги, невідомі. Медіану застосовують замість середньої арифметичної за статистичних методів контролю якості продукції. Сума абсолютних відхилень варіанти від медіани менша, ніж від будь-якого іншого числа.

Розглянемо розрахунок моди та медіани у дискретному варіаційному ряду :

Визначити моду та медіану.

Мода Мо = 4 роки, оскільки цьому значенню відповідає максимальна частота f = 5.

Тобто. Найбільше робітників мають стаж 4 роки.

Щоб обчислити медіану, знайдемо попередньо половину суми частот. Якщо сума частот є числом непарним, ми спочатку додаємо до цієї суми одиницю, а потім ділимо навпіл:

Медіаною буде восьма за рахунком варіанта.

Для того, щоб знайти, який варіант буде восьмий за номером, накопичуватимемо частоти до тих пір, поки не отримаємо суму частот, що дорівнює або перевищує половину суми всіх частот. Відповідний варіант і буде медіаною.

Ме = 4 роки.

Тобто. половина робітників має стаж менше чотирьох років, половина більша.

Якщо сума накопичених частот проти одного варіанта дорівнює половині суми частот, то медіана визначається як середня арифметична цієї варіанти і наступної.

Обчислення моди та медіани в інтервальному варіаційному ряду

Мода в інтервальному варіаційному ряду обчислюється за формулою

де Х М0- Початкова межа модального інтервалу,

hм 0 - Величина модального інтервалу,

fм 0 , fм 0-1 , fм 0+1 - Частота відповідно модального інтервалу, попереднього модального і наступного.

Модальнимназивається такий інтервал, якому відповідає максимальна частота.

Приклад 1

Групи за стажем

Число робітників, чол

Накопичені частоти

Визначити моду та медіану.

Модальний інтервал, т.к. йому відповідає найбільша частота f = 35.

Хм 0 =6, 0 =35

hм 0 =2, 0-1 =20

0+1 =11

Висновок: Найбільше робочих має стаж приблизно 6,7 років.

Для інтервального ряду Ме обчислюється за такою формулою:

де Хм е- нижня межа медіального інтервалу,

е- Величина медіального інтервалу,

– половина суми частот,

е- Частота медіанного інтервалу,

е-1-Сума накопичених частот інтервалу, що передує медіанному.

Медіанний інтервал – такий інтервал, якому відповідає кумулятивна частота, що дорівнює або перевищує половину суми частот.

Визначимо медіану для прикладу.

т.к 82>50, то медіанний інтервал.

Хм е =6, е =35,

е =2, е-1 =47,

Висновок: Половина робітників має стаж менше 6,16 років, а половина має стаж більше ніж 6,16 років.

що таке медіана набору чисел? і як знайти медіану 13, 19, 24, 17, 15, 11? і отримав найкращу відповідь

Відповідь від Улія Деркач[гуру]
Медіаною набору чисел називається таке число, яке поділяє набір на дві рівні за чисельністю частини. Замість "медіана" можна було б сказати "середина".
1. Потрібно написати числа у порядку зростання (скласти ранжований ряд)
11,13,15,17,19,24
2. Одночасно закреслюємо "найбільше" і "найменше" числа даного набору чисел до тих пір, поки не залишиться одне число або два числа.
3. Якщо залишилося одне число, воно і є медіана.
4. Якщо залишилося два числа, то медіаною буде середнє арифметичне двох чисел, що залишилися.
Ме=15+17/2=16

Відповідь від A.R.E. R.U.[активний]
Розташуй їх у порядку зростання. Те, що посередині і буде медіаною.
Якщо їх парна кількість (як у твоєму випадку), то медіаною буде середнє арифметичне 2-х серединних чисел.
11, 13, 15, 17, 19, 24
(15+17)/2=16.


Відповідь від користувача видалено[експерт]
розташуй числа по порядку і в середині ряду буде твоя "медіана" зазвичай дають непарне число чисел ... а у тебе їх 6?


Відповідь від 3 відповіді[гуру]

Вітання! Ось добірка з відповідями на Ваше запитання: що таке медіана набору чисел? і як знайти медіану 13, 19, 24, 17, 15, 11?

Поряд із середніми величинами як статистичні характеристики варіаційних рядів розподілу розраховуються структурні середні – модаі медіана.
Мода(Mo) є значення досліджуваного ознаки, що повторюється з максимальною частотою, тобто. мода - значення ознаки, що зустрічається найчастіше.
Медіаною(Me) називається значення ознаки, що припадає на середину ранжованої (упорядкованої) сукупності, тобто. медіана – центральне значення варіаційного ряду.
Головна властивість медіани полягає в тому, що сума абсолютних відхилень значень ознаки від медіани менша, ніж від будь-якої іншої величини ∑|x i - Me|=min.

Визначення моди та медіани за несгрупованими даними

Розглянемо визначення моди та медіани за несгрупованими даними. Припустимо, робочі бригади, що з 9 людина, мають такі тарифні розряди: 4 3 4 5 3 3 6 2 6 . Оскільки у цій бригаді найбільше робочих 3-го розряду, цей тарифний розряд буде модальним. Mo=3.
Для визначення медіани необхідно провести ранжування: 2 3 3 3 4 4 5 6 6 . Центральним у цьому ряду є робітник 4-го розряду, отже даний розряд і буде медіанним. Якщо ранжований ряд включає парне число одиниць, медіана визначається як середня з двох центральних значень.
Якщо мода відбиває найпоширеніший варіант значення ознаки, то медіана практично виконує функції середньої для неоднорідної, не підпорядковується нормальному закону розподілу сукупності. Проілюструємо її пізнавальне значення наступним прикладом.
Допустимо, нам необхідно дати характеристику середнього доходу групи людей, що налічує 100 осіб, з яких 99 мають доходи в інтервалі від 100 до 200 доларів на місяць, а місячні доходи останнього становлять 50 000 доларів (табл. 1).
Таблиця 1 – Місячні доходи досліджуваної групи людей. Якщо скористатися середньою арифметичною, то отримаємо середній дохід, що дорівнює приблизно 600 – 700 доларів, який має мало спільного з доходами основної частини групи. Медіана ж, рівна у разі Me = 163 долара, дозволить дати об'єктивну характеристику рівня доходів 99 % цієї групи людей.
Розглянемо визначення моди та медіани за згрупованими даними (рядами розподілу).
Припустимо, розподіл робітників всього підприємства загалом по тарифному розряду має такий вид (табл. 2).
Таблиця 2 - Розподіл робітників підприємства за тарифним розрядом

Розрахунок моди та медіани для дискретного ряду

Розрахунок моди та медіани для інтервального ряду
Відеоінструкція

Розрахунок моди та медіани для варіаційного ряду
Відеоінструкція

Визначення моди за дискретним варіаційним рядом

Використовується побудований раніше ряд значень ознаки, відсортованих за величиною. Якщо обсяг вибірки непарний, беремо центральне значення; якщо обсяг вибірки парний, беремо середнє арифметичне двох центральних значень.
Визначення моди за дискретним варіаційним рядом: найбільшу частоту (60 осіб) має 5-й тарифний розряд, отже він і є модальним. Mo = 5.
Для визначення медіанного значення ознаки за такою формулою знаходять номер медіанної одиниці ряду (N Me): де n - обсяг сукупності.
У нашому випадку: .
Отримане дробове значення, що завжди має місце при парному числі одиниць сукупності, вказує, що точна середина знаходиться між 95 і 96 робітниками. Необхідно визначити, до якої групи належать робітники із цими порядковими номерами. Це можна зробити, розрахувавши накопичені частоти. Робітників із цими номерами немає у першій групі, де лише 12 людина, немає їх у другій групі (12+48=60). 95-й та 96-й робітники перебувають у третій групі (12+48+56=116), отже, медіанним є 4-й тарифний розряд.

Розрахунок моди та медіани в інтервальному ряду

На відміну від дискретних варіаційних рядів визначення моди та медіани за інтервальними рядами вимагає проведення певних розрахунків на основі таких формул:
, (6)
де x 0- нижня межа модального інтервалу (модальним називається інтервал, що має найбільшу частоту);
i- Величина модального інтервалу;
f Mo- Частота модального інтервалу;
f Mo -1– частота інтервалу, що передує модальному;
f Mo +1- Частота інтервалу, наступного за модальним.
(7)
де x 0– нижня межа медіанного інтервалу (медіанним називається перший інтервал, накопичена частота якого перевищує половину загальної суми частот);
i- Величина медіанного інтервалу;
S Me -1– накопичена інтервалу, що передує медіанному;
f Me- Частота медіанного інтервалу.
Проілюструємо застосування цих формул, використовуючи дані табл. 3.
Інтервал із межами 60 – 80 у цьому розподілі буде модальним, т.к. він має найбільшу частоту. Використовую формулу (6), визначимо моду:

Для встановлення медіанного інтервалу необхідно визначати накопичену частоту кожного наступного інтервалу доти, доки вона не перевищить половини суми накопичених частот (у нашому випадку 50%) (табл. 11).
Встановили, що медіанним є інтервал із межами 100 – 120 тис. руб. Визначимо тепер медіану:

Таблиця 3 - Розподіл населення РФ за рівнем середньодушових номінальних грошових доходів у березні 1994р.
групи за рівнем середньодушового місячного доходу, тис. руб.Питома вага населення, %
До 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Понад 3007,7
Разом100,0

Таблиця 4 - Визначення медіанного інтервалу
Таким чином, як узагальнену характеристику значень певної ознаки в одиниць ранжованої сукупності можуть бути використані середня арифметична, мода і медіана.
Основною характеристикою центру розподілу є середня арифметична, для якої характерно те, що всі відхилення від неї (позитивні та негативні) у сумі дорівнюють нулю. Для медіани характерно, що сума відхилень від неї за модулем є мінімальною, а мода є значенням ознаки, яке найчастіше зустрічається.
Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити його асиметрію. У симетричних розподілах усі три характеристики збігаються. Чим більша розбіжність між модою та середньою арифметичною, тим більше асиметричний ряд. Для помірно асиметричних рядів різниця між модою та середньою арифметичною приблизно втричі перевищує різницю між медіаною та середньою, тобто:
|Mo –`x| = 3 | Me - x |.

Визначення моди та медіани графічним методом

Моду та медіану в інтервальному ряду можна визначити графічно. Мода визначається за гістограмою розподілу. Для цього вибирається найвищий прямокутник, що є в даному випадку модальним. Потім праву вершину модального прямокутника з'єднуємо з верхнім правим кутом попереднього прямокутника. А ліву вершину модального прямокутника – з верхнім лівим кутом наступного прямокутника. З точки їхнього перетину опускаємо перпендикуляр на вісь абсцис. Абсцис точки перетину цих прямих і буде модою розподілу (рис. 3).


Рис. 3. Графічне визначення моди за гістограмою.


Рис. 4. Графічне визначення медіани за кумулятом
Для визначення медіани з точки на шкалі накопичених частот (частин), що відповідає 50%, проводиться пряма, паралельна осі абсцис до перетину з кумулятою. Потім із точки перетину опускається перпендикуляр на вісь абсцис. Абсцис точки перетину є медіаною.

Квартілі, децилі, перцентілі

Аналогічно з знаходженням медіани в варіаційних рядах розподілу можна знайти значення ознаки у будь-якій порядку одиниці ранжованого ряду. Так, наприклад, можна знайти значення ознаки у одиниць, що ділять ряд на чотири рівні частини, на 10 або 100 частин. Ці величини називаються "квартілі", "децили", "перцентілі".
Квартілі є значенням ознаки, що ділить ранжовану сукупність на 4 рівновеликі частини.
Розрізняють квартиль нижній (Q 1), що відокремлює ¼ частина сукупності з найменшими значеннями ознаки, і квартиль верхній (Q 3), що осідає ¼ частина з найбільшими значеннями ознаки. Це означає, що 25 % одиниць сукупності будуть меншими за величиною Q 1 ; 25% одиниць будуть укладені між Q1 і Q2; 25% - між Q2 і Q3, а решта 25% перевершують Q3. Середнім квартилем Q2 є медіана.
Для розрахунку квартилів за інтервальним варіаційним рядом використовуються формули:
, ,
де x Q 1– нижня межа інтервалу, що містить нижній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 25 %);
x Q 3– нижня межа інтервалу, що містить верхній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 75 %);
i- Величина інтервалу;
S Q 1-1- накопичена частота інтервалу, що передує інтервалу, що містить нижній квартіль;
S Q 3-1- накопичена частота інтервалу, що передує інтервалу, що містить верхній квартиль;
f Q 1- Частота інтервалу, що містить нижній квартіль;
f Q 3- Частота інтервалу, що містить верхній квартіль.
Розглянемо розрахунок нижнього та верхнього квартилів за даними табл. 10. Нижній квартиль перебуває у інтервалі 60 – 80, накопичена частота якого дорівнює 33,5 %. Верхній квартиль лежить в інтервалі 160 – 180 із накопиченою частотою 75,8 %. З огляду на це отримаємо:
,
.
Крім квартилів у варіаційних радах розподілу можуть визначатися децилі – варіанти, що ділять ранжований варіаційний ряд на десять рівних частин. Перший дециль (d 1) ділить сукупність у співвідношенні 1/10 до 9/10, другий дециль (d 1) - у співвідношенні 2/10 до 8/10 і т.д.
Обчислюються вони за формулами:
, .
Значення ознаки, що ділять ряд на 100 частин, називаються перцентилями. Співвідношення медіани, квартилів, децилів та перцентилів представлені на рис. 5.

Функція МЕДІАНУ в Excel використовується для аналізу діапазону числових значень і повертає число, яке є серединою досліджуваної множини (медіаною). Тобто, ця функція умовно поділяє безліч чисел на два підмножини, перше з яких містить менше медіани, а друге – більше. Медіана є одним із кількох методів визначення центральної тенденції досліджуваного діапазону.

Приклади використання функції МЕДІАНУ в Excel

При дослідженні вікових груп студентів використовувалися дані випадково обраної групи учнів у ВНЗ. Завдання – визначити середній вік студентів.

Вихідні дані:

Формула для розрахунку:


Опис аргументу:

  • B3:B15 – діапазон досліджуваних вікових груп.

Отриманний результат:

Тобто у групі є студенти, вік яких менший за 21 рік і більший за це значення.



Порівняння функцій МЕДІАНА та СРЗНАЧ для обчислення середнього значення

Під час вечірнього обходу у лікарні кожному хворому було виміряно температуру тіла. Продемонструвати доцільність використання параметра медіана замість середнього значення дослідження низки отриманих значень.

Вихідні дані:

Формула для знаходження середнього значення:

Формула для знаходження медіани:

Як видно з показника середнього значення, в середньому температура у пацієнтів вища за норму, проте це не відповідає дійсності. Медіана показує, що, як мінімум, у половини пацієнтів спостерігається нормальна температуратіла, що не перевищує показник 36,6.

Увага! Ще одним методом визначення центральної тенденції є мода (найчастіше зустрічається значення в досліджуваному діапазоні). Щоб визначити центральну тенденцію в Excel, слід використовувати функцію МОДА. Зверніть увагу: у даному прикладізначення медіани та моди збігаються:

Тобто серединна величина, що ділить одну множину на підмножини менших і більших значень також є і найбільш часто зустрічається значення в множині. Як видно, у більшості пацієнтів температура становить 36,6.

Приклад розрахунку медіани під час статистичного аналізу в Excel

Приклад 3. У магазині працюють 3 продавці. За результатами останніх 10 днів необхідно визначити працівника, якому буде видано премію. При виборі кращого працівника враховується рівень ефективності його роботи, а чи не число проданих товарів.

Вихідна таблиця даних:


Для характеристики ефективності будемо використовувати одразу три показники: середнє значення, медіана та мода. Визначимо їх для кожного працівника з використанням формул СРЗНАЧ, МЕДІАНА та МОДА відповідно:


Для визначення ступеня розкиду даних використовуємо величину, яка є сумарним значенням модуля різниці середнього значення та моди, середнього значення та медіани відповідно. Тобто коефіцієнт x = | av-med | + | av-mod |, де:

  • av – середнє значення;
  • med – медіана;
  • mod – мода.

Розрахуємо значення коефіцієнта x для першого продавця:

Аналогічно проведемо розрахунки інших продавців. Отримані результати:


Визначимо продавця, якому буде видано премію:

Примітка: функція НАЙМЕНШИЙ повертає перше мінімальне значення з діапазону значень коефіцієнта x, що розглядається.


Коефіцієнт x є деякою кількісною характеристикою стабільності роботи продавців, яку запровадив економіст магазину. З його допомогою вдалося визначити діапазон із найменшими відхиленнями значень. Цей спосіб демонструє, як можна використовувати одразу три методи визначення центральної тенденції для отримання найбільш достовірних результатів.

Особливості використання функції МЕДІАНУ в Excel

Функція має наступний синтаксис:

МЕДІАНА(число1; [число2];...)

Опис аргументів:

  • число1 - обов'язковий аргумент, що характеризує перше числове значення, що міститься в діапазоні, що досліджується;
  • [число2] - необов'язковий другий (і наступні аргументи, всього до 255 аргументів), що характеризує друге та наступні значення досліджуваного діапазону.

Примітки 1:

  1. При розрахунках зручніше передавати одночасно весь діапазон досліджуваних значень замість послідовного введення аргументів.
  2. Як аргументи приймаються дані числового типу, імена, що містять числа, дані посилання типу і масиви (наприклад, =МЕДІАНА((1;2;3;5;7;10))).
  3. При розрахунку медіани враховуються осередки, що містять порожні значення або логічні ІСТИНА, брехня, які будуть інтерпретовані як числові значення 1 та 0 відповідно. Наприклад, результат виконання функції з логічними значеннями в аргументах (ІСТИНА; брехня) еквівалентний результату виконання з аргументами (1; 0) і дорівнює 0,5.
  4. Якщо один або кілька аргументів функції приймають текстові значення, які не можуть бути перетворені на числові або містять коди помилок, результатом виконання функції буде код помилки #ЗНАЧ!.
  5. Для визначення медіани вибірки можуть бути використані інші функції Excel: ПРОЦЕНТИЛЬ.ВКЛ, КВАРТИЛЬ.ВКЛ, НАЙБІЛЬШИЙ Приклади використання:
  • =ПРОЦЕНТИЛЬ.ВКЛ(A1:A10;0,5), оскільки визначення медіана – 50-я процентиль.
  • =КВАРТИЛЬ.ВКЛ(A1:A10;2), оскільки медіана – 2-а квартиль.
  • =Найбільший(A1:A9;РАХУНОК(A1:A9)/2), але тільки якщо кількість чисел в діапазоні є непарним числом.

Примітки 2:

  1. Якщо в досліджуваному діапазоні всі числа розподілені симетрично відносно середнього значення, арифметичне середнє і медіана для даного діапазону будуть еквівалентні.
  2. При великих відхиленнях даних у діапазоні («розкиданні» значень) медіана краще відображає тенденцію розподілу значень, ніж середнє арифметичне. Відмінним прикладом є використання медіани для визначення реального рівня зарплат у населення держави, де чиновники отримують на порядок більше звичайних громадян.
  3. Діапазон досліджуваних значень може містити:
  • Непарна кількість чисел. У цьому випадку медіаною буде однина, розділяє діапазон на два підмножини великих і менших значень відповідно;
  • Чітка кількість чисел. Тоді медіана обчислюється як середнє арифметичне для двох числових значень, що розділяють безліч на два зазначені вище підмножини.