Анализ распределения в Excel | страница 20
Axis Options — Bins — Automatic
Параметры оси — Интервалы — Авто
Параметры группировки
Английское слово Bin буквально означает «корзина». Переводят его по-разному: «карманы», «корзины», «интервалы». Имеется в виду интервал значений, диапазон значений случайной величины для группировки данных. При построении гистограммы подсчитывается количество попаданий в этот интервал.
Гистограмма — это грубая, экспериментальная оценка формы графика плотности вероятности по реальным данным. Поэтому при настройке гистограммы самое главное — правильно выбрать количество интервалов.
Как подобрать количество интервалов — с этим подходом лучше всего познакомиться на практике. Выбираем вариант
Number of bins
Количество интервалов
Вручную вводим числа. Подбираем подходящее, оптимальное количество. Как влияет выбор количества интервалов на форму гистограммы, показано на следующих трёх рисунках.
Если выбрать слишком мало интервалов, пропадут подробности на графике.
Слишком мало интервалов
Если взять слишком много интервалов, то станут заметными случайные погрешности, и на их фоне потеряется полезная информация.
Слишком много интервалов
Нам нужно найти компромисс: не слишком много и не слишком мало интервалов.
Оптимальное количество интервалов
Настроим оформление графика. В соответствии с отечественными и международными стандартами, столбики на гистограмме должны соприкасаться сторонами, прилегать друг к другу. Это объясняется тем, что при группировке данных интервалы группирования тоже соприкасаются своими границами. На гистограмме границы интервалов превращаются в границы столбиков.
Чтобы установить правильную ширину столбиков, щёлкаем левой кнопкой по столбикам гистограммы и устанавливаем нулевой зазор между столбиками:
Format Data Series — Series Options — Gap Width — 0%
Формат ряда данных — Параметры ряда — Боковой зазор — 0%
Зазор между столбиками
Теперь настроим изображение столбиков. Слишком много закрашенных столбиков на графике отвлекает внимание от графика. Убираем заливку столбиков:
Format Data Series — Series Options — Fill & Line — Fill — No fill
Формат ряда данных — Параметры ряда — Заливка и границы — Заливка — Нет заливки
Очертания столбиков должны изображаться сплошной линией:
Border — Solid Line
Граница — Сплошная линия
Линии должны быть чёрного цвета:
Border — Color — Black
Граница — Цвет — Черный
Установим толщину линий 0,5 пункта:
Border — Width — 0.5 pt
Граница — Ширина — 0,5 пт
Только линии