18.Реляционная модель. Основные понятия: отношение, кортеж, атрибут, домен, первичный ключ, внешний ключ. Ограничения целостности данных. Связывание таблиц.
Реляционный подход был создан Э. Кодда в 70-е годы. Основная идея Кодда состояла в том, чтобы применить концепцию математических отношений к моделированию данных. Отношение – это таблица из строк и столбцов. Наиболее важные характеристики реляционной модели заключаются в следующем: •Описание данных производится в соответствии с их естественной структурой, т. е. не требуется добавления дополнительных структур для машинного представления. •Обеспечивается независимость данных от их физического представления, от связей между данными и от соображений реализации. •Модель обеспечивает строгую математическую основу для интерпретации выводимости, избыточности и непротиворечивости отношений.
В настоящее время реляционные СУБД (наиболее известных из них являются следующие): FoxBase (Fox Software), Paradox (Borland), Access (Microsoft), Clarion (Clarion software), Oracle (Oracle) и др.Реляционные системы продолжают совершенствоваться. В связи с распространением объектного подхода в 90-е гг. появились объектно-реляционные модели. Расширяется и сфера применения реляционных систем. Примером развития реляционной модели является постреляционная модель. Классическая реляционная модель предполагает неделимость данных, постреляционная модель снимает ограничение неделимости данных, допускает многозначные поля, состоящие из множества значений. Набор значений многозначных полей считается отдельной таблицей, встроенной в основную таблицу (табл. 1).
На длину и количество полей в записях не накладывается требование постоянства, поэтому структура данных и таблиц имеет большую гибкость. К недостаткам можно отнести сложность решения проблемы обеспечения целостности и непротиворечивости хранимых данных.
Реляционная модель определяется тремя аспектами данных: структурой данных (объектами данных), целостностью данных и обработкой данных. Основными понятиями, описывающими структуру данных в реляционной модели, являются: отношение, кортеж, атрибут, домен, первичный ключ. Под отношением будем понимать двумерную таблицу, содержащую некоторые данные о рассматриваемой предметной области.
Кортеж представляет упорядоченный набор элементов (соответствует строке этой таблицы). Атрибут соответствует столбцу таблицы. Количество атрибутов называется степенью отношения. Домен представляет множество всех значений для определенных атрибутов отношения.
Первичный ключ – уникальный идентификатор отношения, однозначно определяющий каждый кортеж.
В реляционной теории определяются свойства отношений: - Отношение не должно содержать одинаковых кортежей. Важным следствием этого свойства является то, что каждую строку можно однозначно определить с помощью набора атрибутов, составляющих первичный ключ. - Кортежи не упорядочены сверху вниз. - Атрибуты не упорядочены слева направо. - Все значения атрибутов должны быть атомарными (простыми), т.е. не допускать группы значений в одном столбце одной строки (не расчленять значения).
С помощью внешних ключей устанавливаются связи между отношениями. Например, имеются следующие отношения КЛИЕНТЫ (Код клиента, Название клиента, Адрес клиента) и ЗАКАЗЫ (Номер заказа, Код клиента, Количество товара). Если определить атрибут Код клиента в отношении КЛИЕНТЫ как первичный ключ, то в отношении ЗАКАЗЫ этот атрибут будет являться внешним ключом. Если каждый клиент может разместить только один заказ, то говорят, что таблицы связаны соотношением "один-к-одному". Если же каждый клиент может разместить любое количество заказов (в том числе и ни одного), то таблицы связаны соотношением "один-ко-многим". Таблица КЛИЕНТЫ в этом контексте называется основной, таблица заказы – дополнительной. Существуют типы связей "многие-ко-многим" и "многие-к-одному".
Список, в котором указываются имена реляционных таблиц с перечислением их атрибутов (первичные ключи подчеркнуты) и определений внешних ключей называется реляционной схемой базы данных.
Для пользователей информационной системы является важным, чтобы база данных отражала предметную область однозначно и непротиворечиво. Если она обладает такими свойствами, то говорят, что БД удовлетворяет условию целостности. Чтобы добиться выполнения этого условия, на БД накладывают некоторые ограничения, называемые ограничениями целостности. Выделяют два основных типа ограничений: целостность сущностей и ссылочная целостность.
Кортежи реляционной таблицы представляют в модели элементы конкретных объектов реального мира – сущностей. Любое отношение должно обладать первичным ключом. Это требование автоматически удовлетворяется, если в системе не нарушаются базовые свойства отношений. Первичный ключ определяет каждый кортеж, а следовательно, каждый элемент сущности. Для работы с данными каждого кортежа необходимо знать значение ключа. Таким образом, элемент не должен записываться в базу данных до тех пор, пока не определены значения его ключевых атрибутов. Т. е. никакой ключевой атрибут любой строки не должен быть пустым.
Внешние ключи служат для обеспечения целостности данных, называемое ссылочной целостностью. Это означает, что значение внешнего ключа должно быть либо пустым, либо равным одному из текущих значений первичного ключа другой таблицы, иначе каждому значению внешнего ключа должны соответствовать строки в связываемых отношениях. Для нашего примера это означает, что если в отношении ЗАКАЗЫ указан Код клиента, то этот клиент должен существовать.
Ограничения целостности должны поддерживаться СУБД. Для соблюдения целостности сущностей достаточно гарантировать отсутствие в отношении кортежей с одним и тем же значением первичного ключа. Со ссылочной целостностью значительно сложнее. Необходимо следить за тем, чтобы не появлялись некорректные значения внешних ключей при обновлении отношений (например, заказы несуществующих клиентов). При удалении кортежа существует три подхода, позволяющие поддерживать ссылочную целостность: •запрещается производить удаление кортежа, на который существуют ссылки (либо сначала удалить ссылающиеся кортежи, либо изменить значения их внешнего ключа); •при удалении кортежа, на который имеются ссылки, во всех ссылающихся кортежах значение внешнего ключа становится неопределенным; •при удалении кортежа из отношения, на которое ведется ссылка, из ссылающегося отношения автоматически удаляются все ссылающиеся кортежи (каскадное удаление).
Большинство современных СУБД способны контролировать соблюдение правила ссылочной целостности. Для этой цели используются различные объекты баз данных (ссылочные ограничения и правила, триггеры и др.).
Уточним еще раз условия, которым должны удовлетворять данные в реляционных таблицах: •все строки таблицы должны быть уникальны, т. е. не может быть в таблице двух одинаковых строк; •имена столбцов таблицы должны быть различны, а значения их атомарными; •все строки одной таблицы должны иметь одну структуру, соответствующую именам и типам столбцов; •последовательность размещения строк и столбцов в таблице является несущественной.
База данных включает одну или несколько таблиц, объединенных смысловым содержанием, процедурами контроля целостности и обработки информации. Помимо таблиц, база данных содержит: экранные формы, отчеты, прикладные программы, работающие с информацией базы данных. Кроме того база данных хранит словарь данных (метаданные – "данные о данных").