Создание инструмента научных исследований на основе XML: Проблемы и методология | страница 13



Поисковый интерфейс позволяет пользователю вносить слова для поиска и сочетать их с булеаном «И» («Все слова») или булеаном «Или» («Любые слова»), или задавать кокретную фразу для поиска. Кроме того, пользователь может выбирать временной диапазон и предметную область. После того как пользователь выбирает какой-либо предмет поиска первого уровня (div1), страница динамично генерирует список заголовков второго уровня (div2), с уже выбраннным самым первым подзаголовком. Аналогично, как только пользователь выберет какой-либо подзаголовок второго уровня, страница динамично генерирует перечень входящих в него подзаголовков третьего уровня (div3). Если пользователь выбирает только раздел из верхнего уровня (div1) или второго уровня (div2), система запросов произведет поиск по всем div2 и/или div3 предметным категориям, содержащимся внутри выбранного верхнего или второго предметного заголовка. Это позволяет пользователю производить широкий поиск по одному общему предметному заголовку и всем подразделам, которые в нем находятся, либо ограничить поиск до одного определенного предметного подраздела второго или третьего уровня.  

Рисунок 1 показывает интерфейс поиска, каким он первоначально предстает пользователю.


Рисунок 1: Поисковый интерфейс Летописи (Первоначальный вид)


На рисунке 2 изображен поисковый интерфейс с выбранным подзаголовком третьего уровня (div3) и другими опциями из меню «Найти» и падающего меню «Период».


Рисунок 2: Поисковый интерфейс Летописи (с изображением большего количества опций)


Рисунок 3 ниже демонстрирует страницу с результатами поиска. Каждая ссылка указана с подзаголовком, непосредственно предшествующим ей структурно с соответствующей комбинацией римского номера, арабского номера и кириллической буквы, определяющей положение подзаголовка в предметной иерархии. Исследователи, использовавшие печатный вариант Летописи, знакомы с предметной иерархией и, вероятно, ожидают увидеть эти индикаторы положения ссылки в структуре Летописи.


Рисунок 3: Результаты поиска по Летописи


Рисунок 4 ниже показывает страницу результатов поиска, демонстрирующую ссылки с комбинацией фрагментов текста на русском/киррилическом и английском/латинском языках.


Рисунок 4. Результаты поиска по Летописи (с данными на русском и английском языках) 

5. Заключение

Проект «Летопись журнальных статей» ставит перед нами ряд значительных трудностей. Самая основная — завершение в срок оцифровки и кодирования большого объема данным, доступ к которым мы решили обеспечить на World Wide Web. Вторая трудность связана с техническими проблемами, присущими тексту на нескольких языках с несколькими задействованным алфавитами, с учетом того, что инструменты XML на сегодняшний день предоставляют поддержку Unicode, оставляющюю желать лучшего. Мы были вынуждены идти на компромиссы в целях преодоления этих трудностей, но мы уверены в том, что в итоге мы будем в состоянии предложить научному сообществу чрезвычайно ценный исследовательский инструмент и обеспечить сохранение интеллектуального ресурса, который в настоящее время находится на грани исчезновения. И в процессе выполнения этой важной научной миссии мы приобретем ценный опыт, который позволит нам и другим специалистам приниматься за осуществление более амбициозных научных проектов, пользующихся преимуществами огромного потенциала XML и других современных информационных технологий.