Фрикономика | страница 26



В данном случае все необходимые для изучения материалы предоставили сами общественные школы Чикаго. Они разрешили доступ к ответам на вопросы теста всех учеников от третьего до седьмого класса с 1993 по 2000 год. Это примерно тридцать тысяч учеников каждого класса в год — более семисот тысяч наборов ответов теста и около ста миллионов отдельных ответов. Полученные данные, объединенные по классам, включали ответы каждого ребенка на вопросы тестов по чтению и математике. (Сами листочки с ответами задействовать не удалось, поскольку они уничтожаются вскоре после окончания каждого теста.) Данные также включали сведения о каждом учителе и демографическую информацию по каждому ученику. Содержали они и результаты предыдущих и последующих тестов, доказавших свою важность для определения мошенничества учителей.

Теперь можно было составлять алгоритм, способный выделить из этого массива данных самое главное. Итак, каким образом можно определить классы, учителя которых мошенничают?

Первая вещь, которую нужно искать, — необычные конструкции ответов в отдельно взятом классе. К примеру, это могут быть блоки идентичных ответов большого количества учеников, особенно на сложные вопросы. В то же время здесь просто необходим избирательный подход. Если десять отличников (что доказали предыдущие и последующие тесты) правильно ответили на первые пять вопросов (обычно самых простых), это не считается подозрительным. Но если десять двоечников правильно ответили на последние пять вопросов (самых сложных), это должно вызывать сомнения. Еще одним сигналом будет необычная компоновка ответов любого ученика —например, правильные ответы на сложные вопросы и неправильные на простые. Это особенно подозрительно на фоне тысяч учеников из других классов, которые отвечали на тот же тест примерно одинаково и предсказуемо. Более того, алгоритм определяет класс, результаты учеников которого были гораздо хуже во время предыдущих и последующих тестов. Конечно, резкий скачок успеваемости в один год можно приписать хорошему учителю, но когда он так же резко обрывается, высока вероятность, что он был вызван искусственно.

Теперь давайте рассмотрим ответы, которые дали ученики двух шестых классов школ Чикаго на вопросы идентичного теста по математике. Каждая строка представляет ответы одного ученика. Буквы a, b, c и d обозначают правильные ответы, а цифрами отмечены неправильные, причем 1 соответствует а, 2 —