Цифровой журнал «Компьютерра» 2013 № 45 (198) | страница 27



Постепенно у Кейла родилась идея создавать архивные копии веб-страниц и попутно добавлять к ним оцифрованные версии данных на аналоговых носителях. 


>Временное хранилище аналоговых носителей Internet Archive (фото: Lianne Milton / The New York Times). 

За прошедшие семнадцать лет Кейл весьма преуспел в этом. До пожара архив организации насчитывал 364 миллиарда веб-страниц, включая, помимо собственно текста, различные мультимедийные данные и связанный с ними программный код. Общий размер архива превышал десять петабайт.

В стремлении защитить данные от утраты и повреждений любого рода Internet Archive копирует децентрализованную систему самого интернета:

«У нас есть копии данных в нескольких местах, так что, даже если наш главный корпус был бы весь объят пламенем, мы всё равно сохранили бы большую часть тех уникальных данных, которые нам с таким трудом удалось собрать. Этот эпизод напомнил нам, что оцифровка и изготовление копий — хорошие стратегии для сохранения данных и обеспечения общего доступа к ним».

Ежедневно добровольцы в центре сканирования оцифровывают около тысячи новых книг. В официальном заявлении архива Сан-Франциско говорится о том, что ущерб удалось минимизировать благодаря разделению функционального назначения помещений:

«Некоторые аналоговые носители во время пожара были в центре сканирования, потому что находились в процессе оцифровки. Половина из них уже была обработана, и их потеря не так критична. К сожалению, была уничтожена и та часть, которая только дожидалась своей очереди, но большинство материалов находилось в отдельной запертой комнате, и все они сохранились».


>Несмотря на сильный пожар в здании Internet Archive в Сан-Франциско, большую часть аналоговых материалов удалось спасти (фото: blog.archive.org).

Основная ИТ-инфраструктура организации не пострадала, и сервис Wayback Machine продолжает работать. К примеру, сайт «Компьютерры» был сохранён уже 1 235 раз, и вы можете просмотреть любую архивную копию.

Мы часто воспринимаем что-то как данность, пока оно исправно работает. Так было и с «архивом интернета», которым миллионы людей безвозмездно пользовались годами. После пожара интерес к деятельности организации возрос, и сейчас у неё есть хорошие шансы привлечь больше волонтёров, чем обычно работало в центре сканирования. Это же касается и объёмов пожертвований, которые до несчастья трудно было назвать значительными.

Оценка ущерба ещё не завершена. По предварительным данным, восстановление оборудования обойдётся в $600 000 плюс затраты на ремонт самого здания.