Исторические информационные системы: теория и практика | страница 47
Среди значимых примеров краудсорсинга – программа оцифровки австралийских газет, организованная Национальной библиотекой Австралии[46]. Платформа начала работать в августе 2008 г., а в ноябре 2009 г. уже содержала 8,4 млн статей для поиска, редактирования, добавления тегов и комментариев [Holley, 2010]. Позднее этот проект стал частью национального австралийского ресурса-агрегатора Trove[47], в котором и в настоящее время активно используется краудсорсинг для развития ресурса. Статистика на главной странице сайта позволяет оценить ежедневное приращение ресурса.
Еще один значимый проект – Transcribe Bentham[48]. Он стартовал в 2010 г. в Университетском колледже в Лондоне, его цель – вовлечение публики в онлайн-транскрипцию или набор оригинальных и неизученных рукописных статей философа и реформатора Джереми Бентама (1748–1832). На текущий момент волонтеры переписали более 20 тыс. страниц сочинений Бентама[49].
Крупнейшим отечественным проектом по оцифровке и созданию электронной публикации литературного наследия с привлечением труда волонтеров стал проект Tolstoy Digital[50], посвященный цифровому изданию 90-томного собрания сочинений Л. Н. Толстого. В 90 томов вошли как художественные произведения, так и черновики, дневники и письма писателя. При подготовке цифровой версии юбилейного собрания сочинений Государственный музей Л. Н. Толстого, Государственный мемориальный и природный заповедник «Музей-усадьба Л. Н. Толстого “Ясная Поляна”» и компания ABBY запустили в 2014 г. краудсорсинговый проект «Весь Толстой в один клик»[51]. Силами компании ABBY 90 томов, изданных в период с 1928 по 1964 г., были оцифрованы и распознаны в автоматическом режиме. Затем проверку текстов осуществляли волонтеры. В проекте приняли участие более 3 тыс. человек по всему миру, которые несколько раз вычитали порядка 46 тыс. страниц текста. Проект предусматривал три основных функции для участия волонтеров: 1) участник (первичное редактирование после автоматического распознавания программой), 2) аудитор (проверка качества отредактированного текста) и 3) редактор (профессиональная верификация).
Эффективность подхода и огромный интерес публики к подобным проектам иллюстрирует и тот факт, что вся работа по редактированию текстов была проделана в двухнедельный срок. В итоге компании ABBY и Wexler подготовили электронные версии 761 книги, в которые вошли как целые тома, так и отдельные произведения писателя (эти книги находятся в свободном доступе и свободны для скачивания на сайте «Лев Толстой»