Убийственные большие данные | страница 136
Ученые заложили данные по Нью-Йорку в самообучающуюся систему, но при этом дали ей довольно специфические инструкции: машина не должна была группировать «жителей пригорода», или «миллениалов», или объединять людей по их покупательским предпочтениям. Она должна была находить сходства самостоятельно. Многие из этих критериев в результате оказались довольно бессмысленными: скажем, «люди, проводящие больше 50 % своего времени на улицах, названия которых начинаются на букву D» или «люди, проводящие большую часть своих перерывов на обед вне офиса». Но если система перелопачивает данные о миллионах людей, то неизбежно появятся какие-то осмысленные паттерны и корреляции, включая и такие, над которыми никому из нас не пришло бы и в голову задуматься.
Шли дни, компьютеры Sense продолжали обрабатывать огромный объем информации – и точки начали приобретать разные цвета. Какие-то покраснели, какие-то пожелтели, посинели и позеленели. Появлялись разные группы.
Что они собой представляли? Об этом знала только машина, но она ничего не объясняла. «Мы не всегда можем распознать, что общего у этих людей, – говорит один из основателей и бывший генеральный директор Sense Грег Скибицки. – Они не совпадали с традиционными группами, по которым мы бы их разбили». Когда точки закончили менять цвет, команда Sense начала отслеживать их перемещения по Нью-Йорку. Днем определенные районы были преимущественно синими, а вечером они становились красными с вкраплениями желтого. Одна группа, вспоминал Скибицки, постоянно посещала одно и то же место поздно вечером. Что это – ночной клуб? Наркопритон? Взглянули на адрес – оказалось, больница. Выходит, люди в этой группе чаще болеют или получают травмы? А может быть, они врачи или другие медицинские работники?
Компанию Sense в 2014 году купил оператор мобильной рекламы YP, отколовшийся от AT&T. По-видимому, результаты всей этой сортировки пока что будут использоваться для таргетированной рекламы. Но легко представить себе, как системы машинного обучения, которым скармливают самые разные потоки поведенческой информации, вскоре научатся размещать нас по сотням и тысячам групп. Члены этой группы будут сходным образом откликаться на одну и ту же рекламу. Эта группа демонстрирует сходство политических взглядов, члены вот этой чаще оказываются в тюрьме, а те – предпочитают фастфуд.
Настоящие океаны поведенческой информации в ближайшие годы окажутся в распоряжении систем искусственного интеллекта. И для живых людей эти системы останутся черными ящиками. Нам редко что удастся узнать о группах, в которые нас определили, и о том, почему нас туда определили. В эпоху машинного интеллекта большая часть результатов останется для нас загадкой. Многие такие группы будут постоянно мутировать – час за часом, минута за минутой, – и нас будут перебрасывать из одной группы в другую. В конце концов, один и тот же человек может вести себя очень, очень по-разному в восемь утра и восемь вечера.