Со всеми и ни с кем: книга о нас – последнем поколении, которое помнит жизнь до интернета | страница 43
Самый элементарный алгоритм, который ищет признаки оскорбительного поведения, может отмечать такие слова, как «педик» или «шлюха». Но он не в состоянии поместить это слово в надлежащий контекст. Например, такой алгоритм способен пометить данный абзац как оскорбительный просто потому, что в нем содержатся эти слова. Однако наш мозг и наш рассудок не работают по принципу «вкл. – выкл.» Постижение смысла требует тонкого понимания контекста, а с этим у компьютера всегда возникают проблемы. Динакар решил создать способ идентифицировать темы. «Мозг, – сказал он, – это полином[45]. Другими словами, мы мыслим, комбинируя несколько понятий в определенном порядке и последовательности, а не распознавая отдельные слова. Если, например, я скажу парню, что ему пойдет губная помада, то компьютер не расценит это как оскорбление. Но человек поймет, что это издевка». Динакар захотел научить компьютер такому распознаванию.
Решение пришло в форме латентного размещения Дирихле (latent Dirichlet allocation, LDA), сложной модели семантического анализа текстов, разработанной в 2003 году. Модель позволяет обнаруживать темы внутри бесконечного числа словесных комбинаций, выбрасываемых мозгом. LDA полиномиально, как и наш мозг, и работает «с мешком неявных ассоциаций», как выразился Динакар. Он начал с простого допущения о том, что такой мешок существует: «Если нам удастся уловить дифференциал силы между людьми, то нам удастся искоренить и случаи травли».
Работа едва началась, когда Динакар получил письмо из управления делами президента США с вопросом, не придет ли он на совещание в округе Колумбия. Картик ответил утвердительно.
На совещании он познакомился с Анешем Чопрой, только что вступившим в должность главного управляющего США по развитию технологий. Чопра был назначен руководителем комитета по борьбе с травлей в интернете и пригласил Динакара участвовать в работе комитета. Три года спустя Белый дом поддержал новый проект Динакара под названием National Helpline (Национальная линия помощи). Этот проект продвигался усилиями как государственных, так и неправительственных организаций. Программа предусматривала работу с миллиардами отчаянных записок, вложенных подростками в цифровые бутылки и брошенные в волны всемирной сети. National Helpline сначала привлекает для анализа проблем, содержащихся в тексте писем, искусственный интеллект, затем – необходимые ресурсы и вырабатывает конкретные меры в связи с каждой проблемой. Получилась самая человечная нечеловеческая система. Рвение организации отчасти подогревается разочарованием Динакара в ограниченных возможностях традиционной психиатрии. Последняя в каждом научном исследовании, как правило, изучает только одну проблему и часто склонна обращаться к прошлому. В психиатрии, кроме того, принята очень расплывчатая терминология. Извлечь из нее полезные данные решительно невозможно, подчеркивает Динакар. «Думаю, что это очень своеобразная отрасль».