7.1. Используемая терминология
Что касается общей терминологии
реляционного подхода, мы будем
активно пользоваться
соответствующими терминами. К
таким терминам относятся названия
реляционных операций - селекция,
проекция, соединение; названия
теоретико-множественных операций -
объединение, пересечение, разность
и т.д.
В тех случаях, когда традиционная
терминология System R расходится с
общепринятой, мы будем отдавать
предпочтение терминологии System R. В
частности, это касается
использования термина "поле
отношения" вместо "атрибут
отношения".
В самой System R при переходе к
коммерческим системам также
произошла некоторая смена
терминологии. В частности, в
некоторых последних публикациях
появилась тенденция к употреблению
более привычных в среде
пользователей IBM терминов: файл,
запись и т.д. Мы будем использовать
термины System R, более близкие
реляционным системам. Далее мы
опишем некоторые основные термины
System R, исходя при этом в основном не
из теоретических соображений, а
стремясь отразить практические
аспекты соответствующих понятий.
Базовым понятием System R является
понятие таблицы (приближенный к
реализации эквивалент основного
понятия реляционного подхода
отношение; иногда, в зависимости от
контекста, мы будем использовать и
этот термин). Таблица - это
некоторая регулярная структура,
состоящая из конечного набора
однотипных записей - кортежей.
Каждый кортеж одного отношения
состоит из конечного (и
одинакового) числа полей кортежа,
причем i-тое поле каждого кортежа
одного отношения может содержать
данные только одного типа, и набор
допустимых типов данных в System R
предопределен и фиксирован. В силу
регулярности структуры отношения
понятие поля кортежа расширяется
до понятия поля таблицы. I-тое поле
таблицы можно трактовать как набор
одноместных кортежей, полученных
выборкой i-тых полей из каждого
кортежа этой таблицы, т.е. в
общепринятой терминологии как
проекцию отношения на i-тый атрибут.
В терминологию System R не входит
понятие домена, оно заменяется
здесь понятием типа поля, т.е. типом
данных, хранение которых в данном
поле допускается (это не вполне
эквивалентная замена, но такова
реальность System R).
Таблицы, составляющие базу данных
System R, могут физически храниться в
одном или нескольких сегментах,
которые проще всего понимать как
файлы внешней памяти (и это вполне
соответствует действительности).
Сегменты разбиваются на страницы, в
которых располагаются кортежи
отношений и вспомогательные
служебные структуры данных
индексы. Соответственно, каждый
сегмент содержит две группы
страниц - страницы данных и
страницы индексной информации.
Страницы каждой группы имеют
фиксированный размер, но страницы с
индексной информацией меньше по
размеру, чем страницы данных. В
страницах данных могут
располагаться кортежи более, чем
одного отношения (это очень важное
свойство физической организации
баз данных System R; следующие из этой
организации преимущества
разъясним позже).
Этим, конечно, не исчерпывается
набор понятий System R, но остальные
термины мы будем пояснять по ходу
изложения, поскольку для этого
требуется соответствующий
понятийный контекст.
Предыдущая
глава || Оглавление
|| Следующая глава
|