4.1 СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ
Известные средства описання данных ориентируются на формы представления информации (синтаксические модели данных) илн смысловые характеристики информации (семантические модели).
Синтаксическими являются модели, рассмотренные в гл. 2:Семантические модели данных представляют собой средство представления структуры предметной области. Такие модели имеют много общего с иерархическими н сетевыми моделями данных, онн могут использоваться как средство построения структуры соответствующих баз данных.
Семантические модели должны отвечать следующим требованиям: •
обеспечить интегрированное представление о предметной области; •
понятийный аппарат модели должен быть понятен как специалисту предметной области, так и администратору БД; •
модельдолжна содержать информацию, достаточную для дальнейшего проектирования ЭИС.
Семантические модели данных используют общий набор понятнй и отличаются конструкциями, применяемыми для нх выражения, полнотой отражения понятнй в модели, удоб- ством использования при разработке ЭИС. Как эталон семантической полноты рассматривается естественный язык, а для формализации языковых конструкций в моделях применяется аппарат математической лннгвнсгнки.
Рассмотрим конструкции естественного языка, декомпозиция которых невозможна без утраты смысла, т. е. высказывания. Структура высказываний оказывается достаточной для выражения закономерностей, присутствующих в предметной области н ЭИС.
Элементами высказываний служат атомарные факты. Способ представлення атомарного факта состоит в указании объектов, нх взаимодействий н свойств, которые описывают событие, соответствующее атомарному факту, а также указании времени наступления этого события.
Объекты могут быть атомарными и составными. Атомарный объект - это любой объект, разложение которого на другие объекты в рамках данной предметной области не производится.
Составные объекты содержат так или иначе организованные множества объектов. Рекурсивно применяя это определение, можно получить произвольную структуру объектов и фактов и рассматривать ее как составной объект. Информация о том, что объект имеет некоторое свойство нлн несколько объектов взаимосвязаны, представляется в виде высказывания об объекте (нли группе объектов).Существуют правила вывода новых свойств и связей нз ранее определенных свойств н связей. Конъюнкция двух свойств является новым свойством. Свойства могут образовывать комбинации н наследоваться через связи.
Объект может существовать независимо от того, определены нли нет свойства н связи, относящиеся к этому объекту. Обязательное свойство, необходимое для определения существующего объекта, - это время его появлення и время его исчезновения (как элемента информационных потребностей пользователей ЭИС). 188 Атомарный факт представляется тремя компонентами: (х, у, t),
где х - множество объектов 01, 02,..., Ok;
у - свойство или связь объектов; t - время.
Объект может быть составным, т. е. построенным как множество других объектов н, возможно, атомарных фактов.
Объекты могут вступать в отношения двух типов - обобщения, когда один объект определяется в виде множества других объектов, н агрегации, когда объект соотносится с именем действия, в котором он может участвовать. Например, объект Личность обобщает такие объекты, как Рабочий, Служащий, Студент; объект Транспорт агрегируется с действием Перевозка. Обобщения н агрегации могут образовывать иерархические структуры.
Семантические модели данных обычно предполагают два уровня интерпретации, уровень объектов предметной области н уровень атрибутов базы данных. Оба уровня прн необходимости можно'совместнть в одном представлении.
Известно достаточно большое число семантических моделей данных (например, модель "сущность-связь", модель семантических сетей н др.); однако используемые в инх понятия, идеи и методы характеризуются большим сходством, что облегчает их совместное рассмотрение.
Модель сущностей и связей
Наиболее распространенной семантической моделью является модель, названная "сущность-связь".
Эта модель использует графическое представление всех компонентов. Базовыми элементами в модели "сущность-связь" служат типы сущностей, обозначаемые далее прямоугольниками, и типы связей, обозначаемые двойными прямоугольниками. Многие сущности, рассматриваемые в этой модели, соответствуют физическим объектам предметной области.Структура предметной области в модели "сущность-связь" изображается в форме диаграммы. Дуги-на диаграмме соединяют тип сущности с типом связи. На дугах указывается 1 или m в соответствии с тем, сколько раз идентификатор объекта может возникнуть в строках отношений, представляющих связи объектов (1 - одни раз, ш - несколько раз).
Диаграмма может представлять только объекты и связи или дополнительно содержать атрибуты, описывающие их свойства.
В структуре связей объектов допускаются следующие типы связен: •
М-арныесвязи(рис.4.1 ,а), приводится пример тернарной связи; •
рекурсивные связи (рис. 4.1 ,б); •
несколько связей для одной н той же пары объектов (рнс. 4.1,в).
РАБОЧИЙ ДЕТАЛЬ ОБОРУДОВАНИЕ
выпуск
СЛУЖАЩИЙ 1 [ руководство
б
плановый выпуск
ПРЕДПРИЯТИЕ ПРОДУКЦИЯ
фактический выпуск
Рис. 4.1. Варианты соответствий между сущностями и связями: а - N-арные связи; б - рекурсивные связи; в - несколько связей для одной и той же пары объектов
НИИ j—|~в ы поли я 8Т [—| ТЕМА |~| финансирует |-| ЗАКАЗЧИК | есть-насть
? [ СОТРУДНИіГ| 1 выполняет j Q
Рис. 4.2. Модель "сущность-связь" для базы данных, рассмотренной в п. 2.2.2
В качестве примера списания предметной области средствами модели "сущность-связь" на рнс. 4.2 показано представление, использованное в примерах к гл. 2 (метки дуг 1 н m не показаны).
Представление предметной области с помощью модели "сущность-связь" позволяет: •
однозначно разработать структуру многоуровневой сетевой базы данных; •
обеспечить одинаковое понимание всеми пользователями содержимого базы данных.
Модель "сущность-связь" характеризуется рядом недостатков: •
не содержит изобразительных средств для фиксации организационной иерархии процессов управлення н агрегации данных по уровням управлення,- •
принятое в модели правило формирования множества отношений базы данных создает слишком много отношений для объектов н связей.
В результате диаграмма объектов и связей реальной задачи быстро становится громоздкой н необозримой.Модель семантических сетей
Возможности выражения семантики в терминах сущностей н связей весьма ограничены. Повышение выразительной силы изобразительных средств достигается в модели семантической сети. В определенном смысле возможности семантической сети являются наиболее универсальными нз известных к настоящему времени.
Поэтому приложения аппарата семантических сетей целесообразно разделить на две ветви - для обеспечения осмысленности информации, хранимой в базе данных (что и рассматривается далее в этом параграфе), и для представлення знаний любой природы (рассматривается в п. 4.2).
Семантические сети применительно к задачам проектирования структуры базы данных ЭИС используются в сравнительно узком диапазоне - для представления структуры понятий и структуры событий.
Семантические сети представляют собой ориентированные графы с помеченными дугами.
Они позволяют структурировать имеющуюся информацию и знания. Аппарат семантических сетей является естественной формализацией ассоциативных связей, которыми пользуется человек прн извлечении каких-то новых фактов нз имеющихся. Построение сети способствует осмыслению информации н знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации н т. п.
Обычно в семантической сети предусматриваются четыре категории вершин: •
понятия (объекты), •
события, •
свойства, •
значення.
Понятия представляют собой константы или параметры, которые определяют физические или абстрактные объекты. События представляют действия, происходящие в реальном мире, и определяются указанием типа действия и ролей, кото- рые играют объекты в этом действии. Свойства используются для представления состояния или для модификации понятий и событий.
Сведения семантической сети образуют сценарий, который является набором понятий, событий, причинно-следственных связей.
Применительно к базе данных сценарий мбжет рассматриваться как шаблон, которому должна соответствовать хранимая информация, чтобы обеспечивалась ее осмысленность.Необходимо различать вершины, обозначающие экземпляры объектов, и вершины, представляющие классы объектов. Например, Новиков - экземпляр типа Студент. В семантической сети экземпляр может принадлежать более чем одному классу (Новиков - н Студент, н Спортсмен). Различные роли Новикова отображаются его принадлежностью к различным классам. Новиков - студент в своих связях с преподавателями н дисциплинами, а в отношениях с тренером и командой он - спортсмен.
В других моделях в отпнчне от семантической сети типы объектов указаны в схеме, а экземпляры объектов представлены значениями ъ базе даниъ». В семантической сети один и тот же экземпляр объекта может быть соотнесен с несколькими типами.
В синтаксических моделях (реляционной, сетевой нлн иерархической) для обеспечения такой связи потребуется дублирование информации об объекте.
Различие между вершинами сети (представление экземпляра н представление класса) приводит к существоваиню трех типов дуг: •
дуга, соединяющая два экземпляра, соответствует утверждению, •
дуга между классом и экземпляром показывает пример элемента класса, •
дуга, связывающая два класса, определяет бниарное отношение классов.
Все семантические отношения предметной области можно разделить на следующие: •
лингвистические, •
логические, •
теоретико-множественные, •
квантификационные.
Лингвистические отношения бывают глагольные (время, вид, род, число, залог, наклонение) и атрибутивные (модификация, размер, форма). Логические отношения подразделяются на конъюнкцию, дизъюнкцию, отрицание н импликацию.
Теоретико-множественные отношения - это отношение подмножества, отношение части и целого, отношение множества и элемента. Эти отношения обладают свойством транзитивности.
Квантификационные отношения делятся на логические кванторы общности и существования, не логические кванторы ("много", "несколько") и числовые характеристики -
Основой для определения того илн иного понятия является множество его отношений с другими понятиями.
Обязательными отношениями являются: •
класс, к которому принадлежит данное понятие, •
свойства, выделяющие понятие из всех понятий данного класса,
» примеры данного понятия.
Поскольку термины, использованные в определении понятия, сами служат понятиями, то их определение организуется по той же схеме.
В итоге связи понятий образуют структуру, в общем случае сетевую.Существуют две обязательные связи прн установлении структуры понятий: •
связь "есть-нек" (отелов "есть некоторый"). Направлена от частного понятия к более общему н показывает принадлежность элемента к классу, •
связь "есть-часть". Показывает, что объект содержит в своем составе разнородные компоненты (объекты), не подобные данному объекту.
Пример семантической сети для описания структуры понятия "юридическое лицо" приведен на рис. 4.3. Одинарными Юридическое лицо Организация Иванов
Завод «Салют» Рис. 4.3. Пример семантической сети для отображения связи понятий
лнннями показаны связи "есть-нек", двойными линиями - связи "есть- часть". В семантической сети с помощью связи "есть- нек" можно показывать ссылку на экземпляр объекта.
Рассмотрим теперь представление событий н действий с помощью семантической сети. Предварительно выделяются простые отношения, которые характеризуют основные компоненты события. В первую очередь из события выделяется действие, которое обычно описывается глаголом. Далее необходимо определить объекты, которые действуют, объекты, над которыми эти действия производятся, н т. д. Все эти связи предметов, событий н качеств с глаголом называются падежами. Обычно рассматривают следующие падежи: •
агент - предмет, являющийся инициатором действия; •
объект-предмет, подвергающийся действию; •
источник - размещение предмета перед действием; •
приемник - размещение предмета после действия; •
время - указание на то, когда происходит событие; •
место - указание на то, где происходит событие; •
цель - указание иа цель действия.
На рнс. 4.4 приводится семантическая сеть, описывающая структуру события "Директор завода "САЛЮТ" остановил 25.03.96 цех № 4, чтобы заменить оборудование".
13- 195
25.03.90 время f
ДИРЕКТОР —згент—,/ остановил —^^—заменить объект | ^ место объест^
ЦЕХ №4 «САЛЮТ» ОБОРУДОВАНИЕ
Рис. 4.4. Пример семантической сети для отображения связи событий
Необходимо отметить ряд преимуществ семантических сетей: •
описание объектов и событий производится на уровне, очень близком к естественному языку; •
обеспечивается возможность сцепления различных фрагментов сети; •
в семантической сети возможные отношения между понятиями и событиями образуют достаточно небольшое и хорошо формализованное множество; •
для каждой операции над данными и знаннями можно выделить из полной сети, представляющей всю семантику (или все знання), некоторый участок семантической сети, который охватывает необходимые в данном запросе смысловые характеристики.
В настоящее время ведутся теоретические исследования семантических моделей данных для обеспечения их совместимости с программными спецификациями запросов к базе данных. В итоге описання структуры информации и алгоритмов используют общий понятийный аппарат.
Еще по теме 4.1 СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ:
- 12.2 Аналитические модели объяснения
- ПРЕДИСЛОВИЕ
- 2.1 РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ
- 4.1 СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ
- МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ КАЧЕСТВОМ ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ Черкашин Б.Н.
- Понятие и модель знака Огдена и Ричардса
- Трансакционная модель коммуникативной личности
- Фреймы, сценарии и ситуационные модели
- Какова технология моделирования понятийно-терминологического аппарата диссертации?
- II Глава. Разработка модели и педагогических условий формирования иноязычной коммуникативной компетенции курсантов вузов МЧС России на основе социокультурного подхода.Специфика социокультурного подхода
- Модель формирования иноязычной коммуникативной компетенции курсантов вузов МЧС России на основе социокультурного подхода
- §3. Модель формирования эколого-профессиональной компетентности студентов в условиях гуманитарного вуза
- 1. 2 Понятие «метафорическая модель» в современных лингвистических исследованиях
- 2.2.2. Лексико-грамматическая парадигма форм редукции семантического субъекта
- 1.3. Модель формирования самообразовательной компетентности студентов вуза посредством интерактивных компьютерных технологий
- 1.2.2. Лексико-семантические свойства репрезентантов абсолютной конструкции модели1: «существительное + прилагательное/причастие»
- 2.1.1. Средства выражения абсолютной конструкции разновидности! модели2 «существительное! + предлог + существительное2»