Анализ распределения в Excel | страница 18




Маркер заполнения


При наведении на маркер заполнения курсор меняет форму с «белого перекрестия» на «чёрный плюс» — см. рисунок.


Форма курсора


Проверим, что автозаполнение охватило весь столбец. Нажмём комбинацию клавиш Ctrl + ↓. Это перемещает курсор в нижнюю заполненную ячейку столбца. Чтобы вернуться в вернюю ячейку, нажимаем соответственно Ctrl + ↑.


Округление с помощью INT


Если посмотреть на результаты работы функции INT, можно обнаружить, что округление делается «вниз», то есть в сторону «минус бесконечности». Это не соответствует привычному правилу «меньше 0,5 округляем в меньшую сторону, больше 0,5 — в бóльшую». Вообще говоря, существует как минимум пять разных методов округления. Мы будем использовать самый привычный и традиционный. Другими словами, будем округлять 226,91 до 227, а не до 226.

Поэтому используем функцию округления

ROUND (number, num_digits)

ОКРУГЛ (число; число_разрядов)

Аргументы функции:

number — округляемое число;

num_digits — количество знаков после запятой.

Щёлкаем по ячейке B3 и вводим формулу:

=ROUND (A3,0)

Используем автозаполнение и убеждаемся, что на этот раз округление сделано правильно:

B3: 226,91 ≈ 227

B4: 200,32 ≈ 200

B5: 244,38 ≈ 244

B6: 237,57 ≈ 238


Округление с помощью ROUND


Проделаем те же действия с равномерно распределёнными числами — округление, автозаполнение и правильные заголовки.

Сводка и группировка

Для анализа распределения случайной величины мы будем использовать такие методы статистики, как сводка и группировка. Группировка данных — это деление совокупности на группы по выбранному признаку. Сводка — это подсчёт итогов по каждой группе и по совокупности в целом.

Результаты сводки и группировки данных представляют в виде таблиц и графиков. Эти графики позволяют приблизительно оценить форму кривых распределения. Нас будут интересовать два основных графика: гистограмма и кумулята. Мы займёмся этими графиками в следующих разделах.

Гистограмма

Гистограмма — это столбиковый график частот. Это оценка формы кривой распределения, а точнее функции плотности вероятности.

Основание каждого столбика — интервал значений случайной величины. Высота столбика — частота, то есть количество попаданий в этот интервал, обычно в процентах. Столбики должны примыкать друг к другу. Между столбиками не должно быть просветов. В пакете Excel столбики изображаются одинаковой ширины.


Гистограмма и распределение


Чтобы построить гистограмму, нужно построить интервалы значений и подсчитать число попаданий в каждый интервал. Эти действия называются ГРУППИРОВКА ДАННЫХ. Мы делим все данные на группы и считаем их количество в каждой группе.