<<
>>

2.1 РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ

Определение модели данных предусматривает указание множества допустимых информационных конструкций, множества допустимых операций надданными и множества ограничений для Хранимых значений данных.

Модель данных, с одной стороны, представляет собой формальный аппарат для описания информационных потребностей пользователей, а с другой - большинство СУБД ориентируются на конкретную модель данных, и, таким образом, если информационные потребности удается точно выразить средствами одной из моделей данных, то соответствующая СУБД позволяет относительно быстро создать работоспособный фрагмент ЭИС.

Информационные конструкции, операции и ограничения моделей данных выбираются из достаточно небольшого множества вариантов, характеризующего "крупные" информационные объекты и операции.

В частности, не допускается рассмотрение отдельных символов данных, операций сложения атрибутов, ограничения на соответствие типов данных и т. п., что характерно для языков программирования.

Классификация информационных конструкций (информационных объектов) тесно связана с областью их использования в ЭИС.

1. Объекты для технологии баз данных - отношения и веерные отношения. 2.

Объекты для технологии искусственного интеллекта - предикаты, фреймы н семантические сети. 3.

Объекты для технологии мультимедиа - тексты, графические изображения, фонограммы и видеофрагменты.

Информационные объекты послужили основой для объектно-ориентированного проектирования систем, когда фиксируется множество информационных объектов н действий над объектами. Типичный список действий включает в себя создание/уничтожение объекта, редактирование объекта, фиксацию одного объекта в качестве части другого объекта, связывание объектов, синхронизацию действий над объектами.

Довольно-таки часто все названные объекты встраиваются в структуру отношений, которые можно считать простейшими универсальными объектами.

Количество существенно различных моделей данных определяется наличием различных множеств информационных конструкций.

С этой точки зрения принципиальными различиями обладают трн модели данных - реляционная, сетевая и иерархическая.

Реляционная модель данных характеризуется следующими компонентами: •

информационной конструкцией - отношением с двухуровневой структурой, •

допустимыми операциями- проекцией, выборкой, соединением н некоторыми другими, •

ограничениями-функциональными зависимостями между атрибутами отношения.

Каждому классу объектов Р материального мира ставится в соответствие некоторое множество атрибутов, например А1, А2,...,Ап. Отдельный объект класса Р описывается строкой величин (al, а2,..., an), где ai - значение атрибута Ai.

Строка (al, а2,..., an) называется кортежем. Всему классу объектов соответствует множество кортежей, называемое отношением. Обозначим отношение, описывающее класс объектов Р, также через Р.

Выражение Р(А1, А2,...,Ап) называется схемой отношения Р.

Для каждого компонента кортежа должна быть указана ее связь с соответствующим атрибутом. В реляционной модели данных для обеспечения этой связи порядок компонентов кортежа совпадает с порядком следования атрибутов в схеме отношения.

Каждое отношение представляет состояние класса объектов в некоторый момент времени. Следовательно, одной схеме отношения в разные моменты времени могут соответствовать разные отношения.

Множество значений отношения можно представить в виде таблицы, в которой соблюдаются следующие соответствия: •

название таблицы и перечень названий граф соответствуют схеме отношения, •

строке таблицы соответствует кортеж отношения,

« все строки таблицы (н соответственно все кортежи) раз- • личны, •

порядок строк н столбцов произвольный (в частности, реляционная модель данных не предполагает специальную сортировку строк).

Отношение реляционной БД может быть описано в терминах теории множеств. Рассмотрим множество доменов

D = { Dl, D2, D3, .... Dk } н создадим декартово произведение доменов U = D1 • D2 • D3 •...

• Dk.

Каждый элемент U имеет вид (dl, d2, d3 dk), где di - элемент домена Dl, d2 - элемент D2 н т.д. В множестве U представлены всевозможные сочетания значений доменов, полученные по названному принципу. Среди элементов нз U содержатся такне, которые не соответствуют реально имеющимся сообщениям и ие могут храниться в БД. Отношение R, включающее истинные сообщения, является подмножеством U. Атрибуты отношения R используют домены нз D в качестве свонх областей определения.

Реляционная база данных представляет собой множество отношений.

Схема реляционной БД содержит следующие компоненты S(rel) = 1

где А - множество имен атрибутов,

R - множество имен отношений, Dom - вхождение атрибутов в домены, Rei - вхождение атрибутов в отношения,

V(s) - множество ограничений (в том числе функциональных зависимостей).

Описание процессов обработки отношений может быть выполнено двумя способами: •

указанием перечня операций, выполнение которых приводит к требуемому результату (процедурный подход), •

описанием свойств, которым должно удовлетворять результирующее отношение (декларативный подход).

Приводимые далее операции над отношениями ориентированы на процедурное описание процессов обработки данных.

Множество отношений и операций иад ними образует реляционную алгебру.

Прн рассмотрении операций над отношениями будет использоваться как алгебраическая форма запнсн операций, так н запись на языке реляционных СУБД семейства dBASE (для определенности - dBASE 3). Далее будут рассмотрены аналогичные конструкции языка SQL.

Как правило, список операций содержит проекцию, выборку, объединение, пересечение, вычитание, соединение и деление.

Проекцией называется операция, которая переносит в результирующее отношение те столбцы исходного отношения, которые указаны в условии операции. Алгебраическая запись проекции имеет вид:

т = R[X],

где R - исходное отношение,

T - результирующее отношение,

X - списох атрибутов в структуре отношения T (условие проекции).

Пример

Рассмотрим два отношения: W1, содержащее сведения о продаже продукции в 1998 г., и W2, в котором указаны цены на продукцию и комплектующие изделия для соответствующих видов продукции.

'

Если требуется отношение XI, содержащее сведения только о фактическом выпуске продукции, то оно получается в результате выполнения проекции

XI - Wl[Mara3HH, Продукция, Факт] и имеет вид: Х1 Магазин Продукция Факт Динамо Эдв-12 140 Динамо Э8И 200 АТЭ Эдв-12 170 АТЭ Эдв-30 100 Столбцы результирующего отношения могут указываться в любом порядке:

Х2 - Wl[Пpoдyкция, Магазин, Факт]. В СУБД DBASE проекция реализуется двумя командами н этот же пример выглядит как

use W1 && открыть отношение W1

copy to XI field Магазин, Продукция, Факт && проекция

Знак && означает комментарий.

Следующий пример проекции - это получение справочника ХЗ цен на продукцию: use W2

copy to ХЗ field Продукция, Цена Значения отношения ХЗ показаны ниже: ХЗ Продукция Цена Эдв-12 40 Эдв-12 40 Эде-30 20 Эде-30 20 ЗВИ 120 Значительным неудобством в ХЗ является наличие одинаковых строк. В реляционной алгебре требуется, чтобы результат проекции не содержал одинаковых строк, однако практически такие СУБД, как dBASE, не обеспечивают этого. Правильным результатом проекции Х4 = \У2[Продукция, Цена] является отношение Х4 Продукция Цена Эдв-12 Эде-30 ЗВИ 40

20 120 Отношение с заданной структурой зачастую можно получить из различных исходных отношений БД. В этом случае, естественно, не гарантируются одинаковые результаты.

Пусть нам необходим список отделов учреждения. В базе данных имеются отношения Служащий (Фамилия, Отдел,...) н Технолог (Фамилия,Отдел,...). Проекция Служащий[Отдел] формирует полный список отделов, а Технолог{Отдел} может содержать меньше значений, если в некоторых отделах не работают технологи. Выборкой называется операция, которая переносит в результирующее отношение те строки из исходного отношения, которые удовлетворяют условию выборки. Условие выборки проверяется в каждой строке отношения по отдельности н не может охватывать информацию из нескольких строк. Существуют две простейшие разновидности условия выборки: 1.

Условие вида Имя_атрнбута <знак сравнения> Значение, где допускаются знаки сравнения =, #, >, =>, <, <=. Например, Цеиа > 100. 2.

Условие вида Имя_атрнбута_1 <знак сравнения > Имя_ _атрнбута_2. Например, Факт > План.

Имена атрибутов должны содержаться в структуре исходного отношения. Алгебраическая запись выборки имеет вид Т = ВД

где R - исходное отношение;

Т - результирующее отношение;

р - условие выборки.

В качестве примера получим значения

Х5'= W1 [Продукция = "Эдв-12"} Х5 Магазин Продукция План Факт Динамо Эдв-12 120 140 АТЭ Эдв-12 80 170 В СУБД dBASE выборка реализуется командой сору с опцией for, например, use W1

copy to Х6 for Факт => План Хб Магазин Продукция План Факт Динамо Эдв-12 120 140 Динамо ЗВИ 200 200 АТЭ Эд»-12 80 170 В команде сору условия выборки н проекции могут присутствовать одновременно, но атрибуты условия выборки должны включаться в условие проекции.

Операции объединения, пересечения и вычитания производятся над двумя исходными отношениями с одинаковой структурой. Точных аналогов этих операций в dBASE нет.

Обозначим исходные отношения через R1 н R2, а результирующее - Т.

Объединение Т = U(R1, R2) содержит строки, прнсутству-' ющиелнбо в отношении R1, либо в R2.

Пересечение Т = I(R1, R2) содержит строки, присутствующие в отношениях R1 н R2 одновременно.

Вычитание Т = M(R 1, R2) содержит те строки нз R1, которые отсутствуют в R2.

Если справочник цен на продукцию Х4 необходимо дополнить новыми сведениями из отношения W3, то надо выполнить объединение

Х7 = U (Х4, W3).

В dBASE предусмотрена операция добавления append, которая для нашего примера реализуется командами use Х4

append from W3, что приводит к добавленню в отношение Х4 всех строк из отношения W3. Отлнчня добавления от объединения - создание результирующего отношения на месте исходного отношения и возможность появления одинаковых строк в результирующем отношении.

Операция соединения отношений выполняется над двумя исходными отношениями и создает одно результирующее.

Каждая строка первого исходного отношения сопоставляется по очереди со всеми строками второго отношения, н если для этой пары строк соблюдается условие соединения, то они сцепляются н образуют очередную строку в результирующем отношении. Условие соединения имеет вид:

Имя_атрнбута_ 1 <знак сравнення> Имя_атрнбута_2,

где Имя_атрнбута_1 находится в одном исходном отношении, а Имя_атрнбута_2 - в другом. Будем использовать следующее обозначение операции соединения:

Т = Rl[p]R2,

где R1 и R2 - исходные отношения,

Т - результирующее отношение, р - условие-соединения.

Практически наиболее важный частный случай соединения называется натуральным соединением н имеет следующие особенности: •

знаком сравнения в условии соединения является "=", •

Имя_атрнбута_1 н Имя_атрибута_2 должны совпадать, а точнее, содержать пересечение списков атрибутов исходных отношений, •

список атрибутов результирующего отношения образуется в результате объединения списков атрибутов исходных отношений.

Обозначение натурального соединения не содержит условия соединения и имеет вид Т = R1 * R2.

Если требуется сведения о продаже продукции из отношения W1 дополнить данными о ценах на продукцию из отношения Х7, то задача решается с помощью соединения

Х8 = Wl( Продукция - Продукция }Х7 Х8 Магазин Продукция План Факт Продукция Цена Динамо Эдв-12 120 140 Эдв-12 40 Динамо ЗВИ 200 200 ЗВИ 120 АТЭ Эдв-12 80 170 Эдв-12 40 АТЭ Эдв-30 150 100 Эдв-30 20 Первая строка из W1 и первая строка из Х7 удовлетворяют условию Продукция - Продукция, поэтому сцепляются. Остальные строки из Х7 не будут сцепляться с первой строкой из W1 (условие не соблюдается). Вторая строка из W1 при сравнении со всеми строками из Х7 сцепится только с третьей строкой и т. д. Если применять операцию натурального соединения, то в отношении Х8 будет отсутствовать второй столбец с именем Продукция.

В СУБД DBASE для проведения соединения необходимо использовать две области для исходных отношений: SELECT 1

USE W1 && открытие отношения W1 SELECT 2

USE Х7 && открытие отношения Х7 SELECT 1

JOIN WITH Х7 ТО Х9 FOR Продукция=Х7->Продукция

FIELDS Магазин, Продукция, Х7->Цена, План, Факт Опция with называет второе исходное отношение, опция for содержит условие соединения, опция fields перечисляет имена атрибутов результирующего отношения. В приведенном примере выполнено натуральное соединение и передвинут столбец Цена.

В ряде случаев соединение дает некорректные результаты, например:

XI0 = Wl * W2

содержит неоднократно одинаковые сообщения о выпуске продукции только потому, что эти виды продукции используют несколько комплектующих изделий. хю Магазин Продукция План Факт Цена Ком пл Динамо Эдв-12 120 140 40 Вк-15 Динамо Эдв-12 120 140 40 Р-20 Динамо ЗВИ 200 200 120 Р-20 АТЭ Эдв-12 80 170 40 Вк-15 АТЭ Эдв-12 80 170 40 Р-20 АТЭ Эдв-30 150 100 20 Вк-15 АТЭ Эдв-30 150 100 20 Р-20 Вообще говоря, ограничения, которые присутствуют в исходных отношениях, определенным образом трансформируются в ограничения для отношений, полученных в результате применения операций реляционной алгебры. Соответствующие закономерности будут рассмотрены в п. 2.2 в связи с анализом ограничений, присущих реляционной модели данных.

Натуральное соединение определено н в тех случаях, когда соединяемые отношения совпадают по структуре или не содержат общих атрибутов. Если структура отношений R н S одинакова, то R * S выполняет фактически пересечение I(R,S).

Когда отношения R и S не содержат общих атрибутов, считается, что условие соединения выполнено для любой пары сопоставляемых строк отношений, и R * S сцепляет каждую строку нз R со всеми строками нз S.

Операция натурального соединения имеет ряд свойств, например коммутативность н ассоциативность.

Свойство коммутативности означает, что операции X1=R * S и X2=S * R порождают, в сущности, одно н то же "отношение.

Свойство ассоциативности означает, что операция Y1=(R*S)*T и операция Y2=R*(S*T) дают одинаковый результат. Различия, безусловно, состоят в неодинаковом порядке строк XI и Х2 (Y1 н Y2 соответственно). Кроме того, промежуточные отношения при вычислении Yl н Y2 могут иметь резко различающиеся размеры (число строк), хотя Y1 и Y2 содержат равное число строк.

Описание операции деления отношений начнем с примера. Пусть существует отношение У(ФИО, ЯП), где для каждого программиста с фамилией ФИО указываются языки программирования ЯП, которые он знает. Y ФИО ЯП Иванов Си Иванов Фортран Иванов Паскаль Петров Си Петров Паскаль Семин Си Семин Фортран Яшин Фортран Яшин Паасаль Необходимо выделить фамилии программистов, знающих языки Си и Фортран одновременно. Попытка воспользоваться операцией выборки

XII = Y[ ЯП = "Си" AND ЯП = "Фортран"] (через AND обозначена логическая операция "и") будет безуспешной, так как в одной строке отношенил нет информации о двух языках программирования сразу и отношение XII будет пустое.

Определим операцию, называемую "образ". В отношении Т(А,В) образом значения а атрибута А является множество значений атрибута В, и каждый элемент b этого множества образует вместе с а некоторую строку (или часть строки) отношения Т.

im В(а) = (Ь1,Ь2 bk),

где іш - знак операции "образ",

а - значение, образ которого вычисляется, В - имя атрибута для образа значения а,

Ы,Ь2 bk - значения атрибута В.

Стоящая перед нами задача решается путем вычисления образов значений "Си" и "Фортран" и последующего пересечения найденных образов.

im ФИО("Си") = {"Иванов","Петров","Семин"} im ФИОС'Фортран") = ("Иванов","Семин","Яшин"} ішФИО("Сн")п ітФИО("Фортран") = {"Иванов","Семин"} Такая связка операций взятия образа и пересечения полученных множеств (количество значений, для которых вычисляется образ, может быть произвольным, а не 2, как в нашем примере) требуется достаточно часто, поэтому вводится специальная операция - деление.

Условимся, что существует отношение-делимое W(A,B) (в нашем примере это Y) и отношение-делитель V(A). Для необходимого нам запроса отношение-делитель имеет вид:

ЯП

Си

Фортран

Результатом операции деления является отношение Q(B), содержащее пересечение образов всех строи отношения-делителя V(A), вычисленных на основе отношения-делимого W(A,B), Q = D (W,V), где D - знак операции деления.

Результат деления Х12 = D (Y,Z) содержит следующие значе-

Х12

ФИО

Иванов Семин

В СУБД семейства DBASE отсутствует операция деления отношений, и для реализации деления необходима специальная подпрограмма.

Декларативный подход к обработке реляционных баз данных основан на интерпретации понятий и методов математической логики. В частности, реляционное исчисление базируется на исчислении предикатов. Перечислим необходимые для реляционного исчисления понятия математической логики.

1. Символы переменных и констант. В языковых конструкциях реляционного исчисления им соответствуют имена атрибутов и переменных, а также константы. 2.

Логические связки "и", "или", "не" и знаки сравнения =, # (не равно), >, <, >=, <=. 3.

Термы, т. е. любые константы и переменные, а также функции, аргументами которых служат термы. 4.

Элементарные формулы - предикаты, аргументами которых являются термы. Предикаты, связанные операциями "и", "или", "не", также являются элементарными формулами. Элементарными формулами служат, например, выражения Фамилия = "Мишенин" и Сумма <= Итог. 5.

Формулы, т. е. результат применения кванторов общности илн существования к элементарным формулам. Формула соответствует запросу к реляционной базе данных, выраженному средствами реляционного исчисления.

В применяемых ниже языковых конструкциях используется синтаксис языков ALPHA и QUEL. Объявление переменной и ее привязка к определенному отношению производятся с помощью оператора Диапазон (range) следующего вида

range of <переменная> is <отношение><квантор>

Квантор принимает одно из значений:

some, когда переменная обозначает одну из строк отношения (квантор существования);

all, когда переменная обозначает все строки отношения (квантор общности).

Основной формой оператора запроса Получить (get) является выражение

get <отношенне> (<целевойсписок>) where <условие>.

Условие соответствует формуле исчисления кортежей. В условиях можно использовать все знаки сравнения н логические связки "и", "или", "не".

Языковая конструкция для кванторов может быть такой:

range of Z is Перевозка some.

Переменная Z при вычислении означаетодну из строк (some - квантор существования) отношения Перевозка.

range of W is Перевозка all.

Переменная W означает все строки (all - квантор общности) отношения Перевозка.

Реализацией запроса к базе данных из "Получить даты поставок из города Киева" является запись средствами реляционного исчисления:

range of Z is Перевозка some

get W (Дата) where nocraBUBiK.Kofl_nocTaBiionca=Z.Koii_nocraBUiHKa

and Посгавщик.Город="Киев".

В последнее время наиболее распространенным декларативным языком запросов является SQL (структурированный язык запросов). Центральным средством доступа к БД в SQL являются команда Select и ее параметры - From, Where, Group by, Having, Order by.

В команде Select указываются имена выводимых атрибутов илн знак *, если надо выводить все атрибуты. Параметр From является обязательным и содержит имена требуемых для выполнения запроса отношений. Если здесь указано несколько отношений, то они будут преобразованы командами натурального соединения в одно отношение. Параметр Where оп- ределяет условия, которым должны удовлетворять выводимые данные. В записи условий применяются знаки сравнения (=,> и т.д.), опции All, Any, Between, Exists, Like, In и логические операторы. Параметр Group by объединяет запнсн с одинаковым значением некоторого атрибута-ключа. Параметр Having при необходимости проверяет условия внутри группы записей, выделенных с помощью Group by. Параметр Order by определяет имена атрибутов, по которым должен быть отсортирован результат.

Ранее упомянутый запрос "Получить даты поставок из города Киева" выполняется командой

Select Дата

From Перевозка, Поставщик Where Поставщик.Город="Киев"

Другой подход к декларативному представлению запросов реализован в языке Пролог. Значения отношения в Прологе хранятся в виде множества фактов. Например, для отношения Изделие (Код, Поставщик, Цена) факты могут иметь вид

Изделие (513,"Динамо", 800) Изделие (155,"Динамо",600) Изделие (247, "АТЭ",600)

Простейший запрос для отношения Пролога сводится к ука- • занию в структуре отношения нменн переменной на месте атрнбута-цели запроса, указанию требуемых значений на месте атрибутов, для которых задано условие выборки, и указанию знака _ на месте атрибутов, значение которых безразлично.

Например, запрос "Получить список изделий с ценой 600" реализуется выражением goal (цель) Goal: Изделие (х,_,600) Ответ Пролога имеет вид х-155 х=247.

<< | >>
Источник: Мишенин А. И.. Теория экономических информационных систем: Учебник. - 4-е изд., доп. и перераб. - М.: Финансы и статистика. - 240 с. 2002

Еще по теме 2.1 РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ:

  1. 2.1 РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ
  2. 2.3 СЕТЕВАЯ И ИЕРАРХИЧЕСКАЯ МОДЕЛИ ДАННЫХ
  3. МОДЕЛЬ ИНВЕРТИРОВАННЫХ ФАЙЛОВ И ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ
  4. 4.1 СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ
  5. 1.4. Модели представления данных
  6. 1.4.3. Реляционная модель
  7. 1.6. Реляционная алгебра
  8. 1. Система экономико-математических моделей, используемых в прогнозировании синтетических показателей экономического и социального развития Грузинской ССР
  9. Системы управления базами данных (СУБД)
  10. Модели геохимической зональности месторождений золото-скарнового типа
  11. Система математических моделей гравитационного поля Земли
  12. Программное обеспечение экспертно-информационной системы
  13. Фреймы, сценарии и ситуационные модели