Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе | страница 20



Я не буду комментировать, действительно ли люди, у которых больше денег, производят материальные блага (создавая компании и новые рабочие места или покупая большие дома, позволяя тем самым заработать другим) или потребляют их (если они покупают несколько домов, которые стоят пустыми, кто-то другой мог бы на эти деньги приобрести необходимое жилье). Это относится к разряду субъективных мнений, и у разных политиков своя точка зрения на этот счет.



Как мы видим, цифры увеличиваются, но не сильно. Теперь мы можем составить точечную диаграмму, как показано далее.


Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)


Это весьма интересно: теперь стало очевидно, что цифры увеличиваются. При анализе диаграммы слева направо вырисовывается определенная история. Кажется, мы уловили закономерность.

Сейчас впервые в этой книге настало время серьезно задуматься о проблеме интерпретации данных. Точки на диаграмме рассеивания – это статистические данные. Статистика представляет собой информацию, но это не сама информация. В данном случае это измерение количества статей в прессе в базе данных под названием Factiva.com, которая собирает публикации газет и журналов со всего мира. Тем не менее статистика тоже может ошибаться (база данных может быть неполной), и закономерности в реальной жизни не бывают такими же четкими, как в школьных научных экспериментах. Эти данные подвержены влиянию множества факторов. Так что история, которую я рассказываю, – это всего лишь один из многих возможных вариантов.

В чем заключается моя история? Есть веские основания предполагать наличие закономерности: политики все чаще использовали этот термин на протяжении периода времени, обозначенного на диаграмме. Обратите внимание, если бы я просто отметил первый и последний годы и показатель последнего года был бы выше, речь шла бы о разнице, а не о закономерности.

Тогда, может быть, стоит соединить точки, чтобы сделать закономерность более очевидной, как на следующей диаграмме.


Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)


Визуально стало лучше, но можно пойти дальше. Никто не может предполагать, что количество статей было в точности таким. Одна хаотичная линия внесла ясность в диаграмму, но не в историю, которая стоит за ней. Лучше провести прямую линию, чтобы обозначить закономерность.

Чтобы начертить такую линию, прибегнем к методу наименьших квадратов, который активно используется в статистике. Для этого берутся все точки и рассчитывается линия с минимальным квадратом расстояния от каждой точки до линии. Эта черта называется линией наилучшего соответствия. Не переживайте, если до этого вы не имели дела со статистикой, – функция для создания этой линии заложена в программу по работе с таблицами. Однако одна линия может оказаться не слишком информативной. Как видно, точки располагаются не по прямой. Получается, что в начале и конце графика большинство точек находятся выше линии наилучшего соответствия, а в середине большинство точек располагаются под этой линией. Это не очень хорошо.