Корпоративное управление и стратегический менеджмент: информационный аспект | страница 96
Витрины данных (data marts), как и хранилища, представляют собой структурированные информационные массивы, но их отличие состоит в том, что витрины данных в еще большей степени являются предметно-ориентированными. Как правило, витрина содержит информацию, относящуюся к какому-либо определенному предметному направлению деятельности организации. Поэтому информация в витринах данных хранится в специальном виде, наиболее подходящем для решения конкретных аналитических задач или обработки запросов определенной группы аналитиков.
Есть два взгляда на витрины данных. В одном случае витрина, по сути, представляет собой часть хранилища, оптимизированную для запросов к данным конкретной предметной области, в том числе для передачи этих данных для последующей обработки в другие аналитические системы. В другом случае витрина – это OLAP-куб или его часть, оптимизированная для запросов пользователей к информации конкретной предметной области. Поэтому с точки зрения организации хранения данных витрины могут быть как реляционными, так и многомерными, однако в любом случае они обладают таким общим свойством, как предметная ориентированность.
Следующий уровень аналитической пирамиды занимают OLAP-системы (On-Line Analytical Processing) – системы аналитической обработки данных в режиме реального времени. Такие системы могут работать со всеми необходимыми данными и способны обеспечить решение широкого спектра аналитических задач. Примерами задач, решаемых при помощи OLAP-систем, могут служить финансово-экономический анализ, оценка степени достижения целевых значений ключевых показателей, анализ и прогнозирование рыночной ситуации.
Особенность OLAP-систем состоит в многомерности хранения данных (в отличие от реляционных таблиц), а также в предрасчете агрегированных значений. Это дает пользователю возможность строить оперативные нерегламентированные запросы к данным, используя ряд аналитических направлений. Кроме того, для OLAP-систем характерна предметная (а не техническая) структурированность информации, позволяющая пользователю оперировать привычными экономическими категориями и понятиями.
Еще одним элементом BI-платформы, который часто выделяют в отдельную категорию, являются средства обнаружения знаний (data mining). Соответствующие программные продукты позволяют выявлять закономерности в данных и на этой основе получать качественно новую информацию. Такая информация, возможно, не содержится в источнике данных явным образом, поэтому в этом случае происходит формирование знаний на основе данных. Один из ведущих экспертов в данной области Г. Пиатецкий-Шапиро (Gregory Piatetsky-Shapiro) определяет деятельность таких систем как процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [Piatetsky-Shapiro, Frawley, 1991]. В деятельности систем обнаружения знаний используются такие методы анализа данных, как фильтрация, деревья решений, ассоциативные правила, генетические алгоритмы, нейронные сети, статистический анализ.