div.main {margin-left: 20pt; margin-right: 20pt}
Внедрение OLAP. Первые шаги
C чего начинается практическое внедрение OLAP-системы? Нет, вовсе не с ее
приобретения. Прежде чем приобретать какой-либо конкретный программный продукт и
приступить к его внедрению, необходимо решить, какой именно тип OLAP лучше всего
подходит вашему предприятию. OLAP-системы отличаются одна от другой гораздо
сильнее, чем, например, реляционные базы данных, языки программирования или
текстовые редакторы, что увеличивает возможность ошибки при выборе. Поэтому
вопрос внедрения — это прежде всего вопрос выбора.
Выбирая, нужно не только найти конкретный продукт и достойного поставщика, но
и точно знать, что именно нужно вашему предприятию. Ни одно решение не хорошо во
всем. Большинство из них может подходить лишь к ограниченному диапазону
применений. Например, некоторые продукты могут обрабатывать очень большие объемы
данных, но непригодны на маленьких объемах, где они медленны, громоздки и менее
удобны. Другие ориентированы на коллективное использование большим количеством
пользователей, но не идеальны для небольших групп. Некоторые имеют хорошие
средства для работы в среде Веб, но не подходят для локального использования.
Другие имеют возможности реализовать многопользовательскую актуализацию данных,
но при этом работают недостаточно корректно в роли систем, предназначенных для
формирования отчетов. Настоящая статья поможет разобраться в структуре
OLAP-продуктов, знание которой даст вам возможность сделать правильный
выбор.
Компоненты OLAP-систем
OLAP-система состоит из множества компонентов. На самом высоком уровне
система включает в себя источник данных, OLAPсервер и программу-клиент. Источник
данных представляет собой ресурс, из которого берутся данные для анализа. Данные
из источника переносятся или копируются на OLAP-сервер, где они
систематизируются и подготавливаются для быстрого формирования ответов на
запросы. Клиент — это пользовательский интерфейс к OLAP-серверу. Рассмотрим эти
компоненты подробнее.
Источники
Источником в OLAP-системах является сервер, поставляющий данные для анализа.
Когда вы думаете о предполагаемом внедрении, необходимо обратить внимание на
способность OLAP-продукта работать с данными из различных источников.
Сервер
Прикладной частью OLAP-системы является OLAP-сервер. Эта составляющая
выполняет всю работу по анализу данных и хранит в себе всю информацию, к которой
обеспечивается активный доступ. Архитектура сервера может определяться
различными концепциями. В частности, основной функциональной характеристикой
OLAPпродукта является использование для хранения данных многомерной (ММБД) либо
реляционной (РБД) базы данных. В чем различия? Давайте рассмотрим подробнее.
MOLAP
MOLAP — это многомерный сервер OLAP. Такой сервер для хранения данных
использует многомерную базу данных. Поскольку большинство OLAP-продуктов
основаны на МДБД, под OLAP часто понимают также и MOLAP.
Смысл использования ММБД очевиден. Она может эффективно хранить многомерные
по своей природе данные, обеспечивая средства быстрого обслуживания запросов к
базе данных. Данные передаются из источника данных в многомерную базу данных, а
затем база данных подвергается агрегации. Предварительный расчет ускоряет
OLAP-запросы, поскольку расчет сводных данных уже произведен. Время запроса
становится функцией времени, необходимого для доступа к отдельному фрагменту
данных и выполнения расчета. Этот метод реализует концепцию, согласно которой
работа производится единожды, а результаты затем используются снова и снова.
ROLAP Термин ROLAP, то есть реляционный сервер OLAP, обозначает, что OLAP-сервер
использует реляционную модель данных. Исходные данные вводятся в реляционную БД,
обычно по схеме "звезда" или схеме "снежинка", что способствует сокращению
времени их извлечения. Сервер обеспечивает многомерную модель данных с помощью
оптимизированных SQL-запросов.
Существует ряд причин для выбора именно реляционной, а не многомерной базы
данных. РБД — это хорошо отработанная технология, имеющая множество возможностей
для оптимизации. К тому же, РБД поддерживают более крупные объемы данных, чем
ММБД. Основным аргументом против РБД является сложность запросов, необходимых
для получения информации из большой базы данных с помощью SQL.
Клиент
Клиент — это тот элемент, который используется для отображения данных и
работы с ними. Несмотря на то, что сервер представляет собой "хребет"
OLAP-решения, клиент не менее важен. Сервер может обеспечить прочный фундамент
для облегчения манипуляций с данными, но если клиент сложен или
малофункционален, пользователь не сможет воспользоваться всеми преимуществами
мощного сервера. Клиент настолько важен, что множество поставщиков сосредота
чивают свои усилия исклю чительно на разработке клиента.
Инструмент запросов/ Генератор отчетов
Инструмент запросов или генератор отчетов предлагает легкий доступ к
OLAP-данным. Они имеют простой в использовании графический интерфейс и позволяют
пользователям создавать отчеты перемещением объектов в отчет методом буксировки
мышью. В то время как традиционный генератор отчетов предоставляет возможность
быстро выпускать форматированные отчеты, генераторы отчетов, поддерживающие
OLAP, формируют отчеты актуальные. Конечный продукт имеет возможности углубления
в данные до уровня подробностей, поддержки иерархий и других дополнений
электронных таблиц. Приложения
Приложения — это тип клиента, использующий базы данных OLAP. Они идентичны
инструментам запросов и генераторам отчетов, описанным выше, но, кроме того,
вносят в продукт расширенные функциональные возможности. Приложение, как
правило, обладает большей мощностью, чем инструмент запроса.
Средства разработки
Обычно поставщики OLAP обеспечивают среду разработки для создания
пользователями собственных приложений. Среда разработки в целом представляет
собой графический интерфейс, поддерживающий объектно-ориентированную разработку
приложений. К тому же, большинство поставщиков обеспечивают API, который может
использоваться для интеграции баз данных OLAP с другими приложениями.
Объединение OLAP с технологией Data Mining и хранилищами данных
Еще один вопрос, который может возникнуть при выборе OLAP продукта — то, как
он соотносится с такими технологиями, как Data Mining и хранилища данных. Все
эти три технологии будут развиваться на вашем предприятии вместе по мере того,
как компания начнет осознавать ценность данных.
В целом, с течением времени все больше и больше компаний начали реализовывать
хранилища данных и применять к своим данным средства Data Mining. Хранилище
данных обеспечивает хранение и верификацию корпоративных данных. Данные по
транзакциям проверяются на корректность, категоризируются и затем помещаются в
хранилище. Инструменты Data Mining позволяют аналитикам предприятий выявить
скрытые тенденции в данных. Несмотря на то, что может показаться, что
OLAP-системы предлагают одновременно и хранилища данных, и инструменты Data
Mining, здесь есть некоторая тонкость.
Инструмент OLAP просто дает возможность выполнять быстрый и простой анализ
данных. В целом, пользователь-аналитик имеет представление о том, что он
собирается найти в некотором представлении данных. Он хочет получить средство
работы с данными, чтобы наиболее наглядно отразить некоторые их срезы.
Инструмент Data Mining пытается обнаружить скрытые тенденции в данных. В
данном случае не пользователь, а именно сам инструмент проводит анализ данных.
Обычно инструмент Data Mining занят поиском тенденций и различных аспектов,
которые человеку трудно выявить в большом объеме данных.
|