Реляционная база данных - это комплекс таблиц, в каждой из которых содержится информация об объектах определенного типа и которые связаны по определенному принципу. Подробнее об основных элементах реляционных БД и о том, в каком виде организуют в таких базах данных информацию, будет рассказано в представленной статье.
Структура реляционных баз данных
Основные термины и понятия реляционных баз данных представлены:
- отношениями - двумерными таблицами, содержащими информацию о различных объектах;
- полями таблицы - столбцами таблиц, содержащими значения, характеризуемые определенными свойствами (размер, формат данных, обязательность заполнения);
- типами данных - типами значений конкретных столбцов;
- атрибутами - заголовками столбцов таблиц, характеризующими поименованное свойство объекта;
- доменами - множеством всех допустимых значений атрибута;
- кортежами - строками таблиц, записями, состоящими из логически связанных значений атрибутов;
- ячейками - структурными элементами таблиц, задающими определенные значения соответствующих полей;
- первичными ключами - полем (или набором полей) таблицы, однозначно идентифицирующим каждую из ее записей. Набор полей называется составным ключом;
- альтернативными ключами - не совпадающими с первичным ключом полями таблицы, дающими каждой записи уникальное определение;
- внешними ключами - полем или набором полей таблицы, значения в которых совпадают со значениями первичных ключей других таблиц.
Файлы реляционной базы данных имеют свои особенности:
- каждую таблицу именуют уникальным названием;
- число полей в таблицах фиксируется;
- пересечение столбца и строки представлено только одним значением;
- записи отличаются друг от друга хотя бы одним значением элемента;
- полям присваиваются индивидуальные имена;
- в каждом столбце должны содержаться однородные данные.
Организация информации в реляционной базе данных
Информация в реляционной базе данных организуется по следующему принципу: пары таблиц объединяются между собой при помощи совпадающих ключей (одинаковых столбцов), которые называются информационными связями. Выделяют информационные связи трех типов:
- «один к одному». Связи данного типа предполагают наличие в двух связанных таблицах только одного одинакового атрибута;
- «один ко многим». Это означает, что при данном типе связи один атрибут первой таблицы совпадает с несколькими атрибутами во второй;
- «многие ко многим». В данном случае связи между двумя таблицами устанавливаются через несколько соответствующих друг другу атрибутов.
Чтобы информация в таблицах не дублировалась и не возникало затруднений ее обновления из-за необходимости редактирования каждой записи, реляционные базы данных, базу данных требуется нормализовать. Под нормализацией понимается организация данных в БД - создание таблиц и построение связей между ними.
Чаще всего при работе с БД выполняются три основных правила нормализации, что относит базу данных к:
- первой нормальной форме. В таких БД исключаются повторяющиеся группы в отдельных таблицах, для каждого набора связанных данных создаются отдельные таблицы, каждый набор связанных данных идентифицируется при помощи первичного ключа;
- второй нормальной форме. БД, соответствующая второму правилу нормализации, имеет отдельные таблицы, связанные при помощи внешнего ключа и содержащие наборы значений, которые применяются к нескольким записям;
- третьей нормальной форме. Третье правило нормализации исключает из БД не связанные с ключами поля.
Благодаря такой организации сокращается объем избыточных данных в БД, уменьшаются затраты на ее ведение, устраняется противоречивость хранимой в базе информации и обеспечивается ее безопасность.
Узнать более подробно об организации информации в реляционных базах данных все желающие смогут в рамках профессиональной подготовки по курсу «Инструментальные средства бизнес-аналитики», которую проводит ВШБИ НИУ ВШЭ. Записаться на обучение по данному курсу можно на нашем сайте.
← Назад к списку