Квантили, квартили, децили, процентили: что это такое?

Если заглянуть в Википедию, то можно найти такое определение: “Квантиль – значение, которое заданная случайная величина не превышает с фиксированной вероятностью”.

На мой взгляд, такие определения хороши для тех, кто уже и так все знает. Я же попробую описать суть вещей на “пальцах”. Как обычно, делаю это, прежде всего, для себя.

В предыдущей заметке я упоминал такую статистику как медиана. Она делит распределение пополам. То есть с ее помощью мы можем показать, какое значение находится в середине упорядоченного набора данных. А что, если нам интересно посмотреть на значение, которое находится не в середине, а, например, на границе первой четверти? Или третьей четверти? Или вообще в произвольной точке?

Итак…
Поехали.

Предположим, что мы взяли в нашем ряду три точки, которые делят его на четыре равные части. Эти точки называют квартилями. Перед первым квартилем находится 25% данных, перед вторым 50%, перед третьим 75%. Кстати, второй квантиль соответствует медиане.

kvartili

Разница между третьим  и первым квартилями называется интерквартильным размахом. В примере на картинке он будет равен: 170- 165 = 5

Вот и все. С квартилями разобрались.

Осталось добавить, что квартиль – это частный случай квантиля. В роли квантиля может выступать любая точка в ряду, которая отделяет какую-то часть данных.

Простой пример. Представьте, что мы выбрали точку, которая соответствует верхней границе первых 60% данных (точка 0.6). Этой точке соответствует какое-то значение (число). Причем наша случайная величина не превышает это значение с вероятностью 60%.

kvantil

Зачем вообще все это нужно?

Некоторые квантили (в частности медиана) удобны для описания данных. Используя их, мы можем сравнить разные распределения данных и понять их характер.

Подведу итог:

  • Квантиль – значение, которое заданная случайная величина не превышает с фиксированной вероятностью
  • Квартиль – частный случай квантиля. Ему соответствуют точки: 0.25, 0.5, 0.75.
  • А еще есть Дециль и Процентиль. Это все частные случаи квантиля. Децилю соответствуют точки 0.1, 0.2, 0.3 …. 0.9. А процентилю соответствует еще более мелкий шаг, равный 0.01 (1%). То есть эти определения введены для удобства и, по сути, являются подвидами квантиля.

Leave a Reply

Your email address will not be published. Required fields are marked *