Технологии программирования | страница 62
2) использование сканеров и соответствующие русифицированные программные средства для ввода документов с бумажных носителей низкого качества;
3) обеспечение эффективного индексирования и полнотекстового поиска неструктурированной информации большого объема.
Шаг 3. Возможность технической реализации рассматриваемой системы:
— появились дешевые носители — компактные диски; резко снизился показатель стоимость/производительность для высокоскоростных вычислительных систем, сетей и устройств;
— получили развитие аппаратно-программные системы, реализующие параллельную обработку запросов; повысился уровень интерфейса работы с СУБД;
— появились новые информационные технологии индексирования сверхбольших массивов данных;
— разработаны и развиваются отечественные технологии и программные продукты распознавания и анализа русскоязычных текстов;
— наметилось направление внедрения средств искусственного интеллекта, позволяющих моделировать и анализировать большие массивы информации.
Шаг 4. В качестве приоритетных задач совершенствования системы можно выделить следующие:
1) использование комбинации различных технологий индексирования и поиска. Наметилось несколько направлений построения электронных архивов в зависимости от используемых в них методов поиска (использование атрибутного поиска структурированных данных и полнотекстового индексирования неструктурированных данных);
2) использование специализированных промышленных сканеров, ориентированных на потоковый ввод архивных документов. Отличительная особенность таких сканеров — ротационный механизм перемещения документов, позволяющий вводить данные с бумажных носителей плохого качества;
3) из-за высоких требований к скорости доступа к поисковому образу документа и его целостности, осуществление его хранения в высокоскоростных отказоустойчивых системах хранения, например RAID-массивах. Наиболее подходящими носителями могут быть магнитооптические, фазоинверсные (PD/CD), компакт- (CD-R) и WORM-диски. Для автоматизации поиска информации, размещенной на этих дисках, ее извлечения и работе собственно с дисками используются автоматические библиотеки, или оптические дисковые автоматы (JukeBox);
4) использование только мощных масштабируемых RISC-платформ, ориентированных на параллельные вычисления.
Представленный способ описания и задания потребительских свойств систем позволяет детализировать результаты тенденций развития потребительского спроса, перевести их на язык разработчиков, поставить ориентиры превентивного совершенствования систем.