Технологии программирования | страница 62



2) использование сканеров и соответствующие русифицированные программные средства для ввода документов с бумажных носителей низкого качества;

3) обеспечение эффективного индексирования и полнотекстового поиска неструктурированной информации большого объема.

Шаг 3. Возможность технической реализации рассматриваемой системы:

— появились дешевые носители — компактные диски; резко снизился показатель стоимость/производительность для высокоскоростных вычислительных систем, сетей и устройств;

— получили развитие аппаратно-программные системы, реализующие параллельную обработку запросов; повысился уровень интерфейса работы с СУБД;

— появились новые информационные технологии индексирования сверхбольших массивов данных;

— разработаны и развиваются отечественные технологии и программные продукты распознавания и анализа русскоязычных текстов;

— наметилось направление внедрения средств искусственного интеллекта, позволяющих моделировать и анализировать большие массивы информации.

Шаг 4. В качестве приоритетных задач совершенствования системы можно выделить следующие:

1) использование комбинации различных технологий индексирования и поиска. Наметилось несколько направлений построения электронных архивов в зависимости от используемых в них методов поиска (использование атрибутного поиска структурированных данных и полнотекстового индексирования неструктурированных данных);

2) использование специализированных промышленных сканеров, ориентированных на потоковый ввод архивных документов. Отличительная особенность таких сканеров — ротационный механизм перемещения документов, позволяющий вводить данные с бумажных носителей плохого качества;

3) из-за высоких требований к скорости доступа к поисковому образу документа и его целостности, осуществление его хранения в высокоскоростных отказоустойчивых системах хранения, например RAID-массивах. Наиболее подходящими носителями могут быть магнитооптические, фазоинверсные (PD/CD), компакт- (CD-R) и WORM-диски. Для автоматизации поиска информации, размещенной на этих дисках, ее извлечения и работе собственно с дисками используются автоматические библиотеки, или оптические дисковые автоматы (JukeBox);

4) использование только мощных масштабируемых RISC-платформ, ориентированных на параллельные вычисления.

Представленный способ описания и задания потребительских свойств систем позволяет детализировать результаты тенденций развития потребительского спроса, перевести их на язык разработчиков, поставить ориентиры превентивного совершенствования систем.