Убийственные большие данные | страница 60



Как только эти рекламные кампании перемещаются онлайн, уточнение информации происходит гораздо эффективнее. Интернет предоставляет рекламщикам бесценную лабораторию для исследования рынка потребления и определения круга потенциальных покупателей. Отклик от каждой рекламной кампании поступает в течение нескольких секунд – гораздо быстрее, чем в случае с почтовой рассылкой. В течение часов (вместо месяцев) можно отобрать наиболее эффективные послания и подойти ближе к заманчивой цели всей рекламной индустрии: застигнуть потенциального потребителя в нужное время с наилучшим посланием, которое может подтолкнуть его к нужному решению, – и таким образом одержать успех в вербовке еще одного потребителя, готового расстаться с деньгами. Настройка и отладка на достижение этой цели никогда не прекращаются.

А тем временем машины, перерабатывающие всю эту информацию, все в больших объемах получают от нас ценные данные, узнают все наши привычки и надежды, страхи и желания. Эти машины постоянно обучаются, искусственный интеллект совершенствуется – и в результате компьютер может разобраться в данных, следуя только самым базовым инструкциям. Алгоритм сам находит нужные паттерны, а затем, со временем, соединяет их с полученным результатом. В каком-то смысле он учится.

В сравнении с человеческим мозгом машина учится не слишком эффективно. Маленькая девочка притрагивается пальцем к плите, чувствует боль – и запоминает до конца жизни взаимосвязь между горячим металлом и пульсирующей болью в руке. Также она узнает слово, обозначающее то, что с ней случилось: ожог. Программе машинного обучения же зачастую требуются миллионы или миллиарды единиц информации, чтобы создать статистические причинно-следственные модели. Но впервые в истории эти петабайты информации сейчас стали доступны, вместе с мощными компьютерами, которые способны их обработать. Поэтому для многих профессий машинное обучение оказывается более гибким и настраиваемым, чем традиционные программы, основанные на жестких правилах.

Лингвисты, например, потратили десятилетия – с 1960-х до начала 2000-х – на то, чтобы научить компьютеры читать. И почти все это время ушло у них на программирование определений и грамматических правил. Но, как очень быстро уясняет для себя любой человек, изучающий иностранный язык, все живые языки просто переполнены исключениями. В них есть сленг. В них есть сарказм. Значение определенных слов меняется со временем и местоположением. Живая сложность любого языка – настоящий кошмар для программиста. По сути, кодирование правил оказывается бесполезным.