Осмысление. Сила гуманитарного мышления в эпоху алгоритмов | страница 27
поставили цель использовать поисковые запросы для предсказания массовых вспышек гриппа. Ученые отслеживали в Google запросы, связанные с заболеванием. Предполагалось, что поисковая система поможет выявлять очаги гриппа быстрее, чем центры по контролю и профилактике заболеваний. С помощью технологии анализа данных в реальном времени и распознавания паттернов исследователи применили свою теорию на практике. Результаты были опубликованы в журнале Nature. Все указывало на грандиозный успех. Запросы Google позволяли прогнозировать вспышки гриппа на две недели быстрее, чем данные центров по контролю и профилактике заболеваний.
Но затем Google Flu Trends стала давать сбой. Она упустила из виду эпидемию вируса H1N1 в 2009 году и серьезно переоценила вспышки гриппа в 2012–2013 годах. За двухлетний период, закончившийся в 2013 году, прогнозы Google Flu Trends были завышены в 100 из 108 недель. Что пошло не так? Среди прочих проблем алгоритм Google был уязвим перед любыми запросами, связанными с сезоном гриппа, но не с самим заболеванием. Таким образом, запросы вроде «студенческий баскетбол»[8] и «куриный бульон» считались сигналом о гриппе, хотя это совершенно случайная корреляция без реальной причинно-следственной связи с заболеванием. Большим данным безразлично, почему сделан запрос: они отражают эмпирический подход. Любые отклонения и искажения при принятии решения людьми отбрасываются. Предпочтение отдается дедуктивному способу рассуждения. Индуктивные методы исследования отвергаются. При достаточном объеме данные говорят сами за себя, и вам не нужна теория. Но в случае с Google Flu Trends для того чтобы придать корреляциям значение и установить причинно-следственную связь, необходим более глубокий анализ. Большие данные не могут просто избавиться от зависимости от традиционных методов исследования. Их смысл по-прежнему зависит от интерпретации. Вопреки всем усилиям Кремниевой долины, большие данные никогда не будут нейтральными.
Несмотря на примеры вроде Google Flu Trends, показывающие ограничения больших данных, сторонники Кремниевой долины продолжают обращать людей в свою веру. Их доводы основаны на легендарной статье «Конец теории» Криса Андерсона, опубликованной в журнале Wired в 2008 году. Якобы то, как мы объясняли действительность в прошлом — с помощью моделей и гипотез, — становится все менее актуальным. Превращается в грубое приближение к истине. В 2008 году интернет, смартфоны и системы управления взаимоотношениями с клиентами уже обеспечивали переизбыток данных. «Цифры говорят сами за себя, — писал Андерсон, цитируя Питера Норвига, директора по исследованиям в