Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе | страница 22
Здесь необходимо сделать пояснение, что это эссе отражает исключительно субъективное мнение автора, который не приводит примеров «обычного» вкуса, не показывает, чем он отличается от вкусов богатых и успешных людей, которыми он так восхищается, и не обосновывает, действительно ли выбор большинства объективно хуже любого другого.
Кроме того, это мнение далеко не всегда справедливо. Мы живем в мире, где слушают музыку и Адель, и Rage Against The Machine, где играют в футбол или в 3D-шахматы. Тем не менее для целей нашей книги у Меклина можно почерпнуть важную мысль. Среднее значение часто отвлекает от более полезной информации.
Есть три средних значения, которые обычно применяются, и все они в определенных ситуациях бывают полезны.
• Среднее арифметическое. Именно это значение большинство людей понимают под средним. Это сумма всех статистических элементов, деленная на их количество. Среднее арифметическое последовательности 1, 3, 3, 4, 4, 6 – это 21/6, или 3,5. Если мы хотим, например, узнать уровень рождаемости, среднее арифметическое будет наиболее полезным статистическим показателем. В Великобритании в 1964 году, по данным Всемирного банка, уровень рождаемости составил 18,8 на 1000 человек. В 2013 году этот показатель был 12,2. Интересно.
• Медианное значение. Проблема со средним арифметическим показателем состоит в том, что при наличии резко отклоняющихся значений – как в большую, так и в меньшую сторону – результат получается искаженным. Например, если покупатели тратят 1, 3, 3, 4, 4, 6 и 28, то получается, что в среднем каждый из них тратит 49/7, или 7. Медиана – это уровень показателя, который делит некоторый набор данных на две равные половины. В данном случае это четвертый элемент из семи, то есть 4. Это более адекватное среднее значение при наличии чрезвычайно высоких показателей.
• Мода. В статистике мода – это значение во множестве наблюдений, которое встречается наиболее часто. Это то, что делает самая большая группа (или каким признаком она обладает), так что по этому показателю можно выстраивать приоритеты. Если среднее арифметическое товаров, которые покупают пользователи вашего сайта, равно 7, но при этом 8 из 10 пользователей не покупают ничего, то мода уровня покупок равна 0. И, возможно, с этого и стоит начинать, если вы хотите что-то менять.
К сожалению, средние значения могут затуманивать информацию. Например, с точки зрения правительства, среднее значение имеет смысл высчитывать, принимая за целое все население. С точки зрения компании по организации праздников, логичнее сначала разбить информацию по сегментам. Среднее число детей у одной женщины снижается, но нередко бывает полезным узнать среднее значение по отдельным группам. Например, для компании по организации праздников важнее информация о том, что у женщин, рожденных после 1981 года, в возрасте 30 лет медиана и мода по рождению детей равны нулю: половина из них в эти годы еще даже не вышли замуж, по данным Бюро национальной статистики Великобритании. Эта информация может повлиять на решения компании относительно того, какие праздники ей выгоднее организовывать для своих клиентов.