Третя нормальна форма

Третя нормальна форма (3НФ) — нормальна форма використовна в нормалізації баз даних. 3НФ первісно була визначена 1971 року Едгаром Коддом.[1] За Коддом таблиця знаходиться в 3НФ тоді й лише тоді, коли виконуються наступні умови:

Неключовий атрибут R — атрибут, що не є частиною будь-якого потенційного ключа.[2] Транзитивною називають таку функціональну залежність, в якій XZ (X визначає Z) непрямо, а через XY і YZ (і неправильно, що YX).[3]

Інше визначення 3НФ тотожне до визначення Кодда, 1982 року дав Карло Заніоло. Це визначення стверджує, що таблиця в 3НФ тоді й лише тоді, коли для кожної її функціональної залежності XA, вірна хоча б одна з наступних умов:

  • X містить A (тоді XA це тривіальна функціональна залежність), або
  • X це суперключ, або
  • A-X, різниця множин A і X це ключовий атрибут (тобто, A-X міститься в потенційному ключі)[4]

Визначення Заніоло пояснює різницю між 3НФ і строгішою нормальною формою Бойса-Кодда. НФБК просто виключає третій варіант («A це ключовий атрибут»).

Підсумкове визначення

Підсумкове визначення Кодда 3НФ було дане Біллом Кентом: кожен неключовий атрибут «має надавати факт про ключ, цілий ключ, і ні про що окрім ключа.»[5]

Вимога, щоб неключовий атрибут знаходився в залежності від «цілого ключа», гарантує, що таблиця знаходиться в 2НФ; наступна вимога, щоб неключові атрибути були залежні від «нічого окрім ключа», гарантує, що таблиця знаходиться в 3НФ.

Крістофер Дейт згадував підсумок Кента, як «інтуїтивно привабливу характеризацію» 3НФ, і зауважував, що з невеличкою адаптацією він може слугувати, як визначення трохи сильнішої нормальної форми Бойса-Кодда: «Кожен атрибут має уособлювати факт про ключ, про цілий ключ, і нічого окрім ключа.»[6] Версія визначення для 3НФ слабша за варіант Дейта для БКНФ, бо попередня забезпечує гарантію залежності від ключів лише для неключових атрибутів. Ключові атрибути (які є ключами або їх частиною) мають бути вільними від функціональної залежності взагалі; кожен з них подає факт про ключ в сенсі надання частини ключа або цілого ключа. (Це правило застосовується тільки для функціонально залежних атрибутів, застосування його до всіх атрибутів спричинить неявну заборону складних потенційних ключів, бо кожна частина такого ключа буде порушувати умову «цілого ключа».)

Приклад таблиці в 2НФ, що порушує вимоги 3НФ:

Переможець змагання
ЗмаганняРікПереможецьДата народження переможця
Вище неба1998Степан Гуцало21 липня 1975
Осінній лист1999Яромир Грабар28 вересня 1968
День вареників1999Степан Гуцало21 липня 1975
Вище неба1999Іван Швидкосвист14 березня 1977

Через те, що кожний рядок таблиці має сказати нам, хто виграв конкретне змагання конкретного року, складний ключ {Змагання, Рік} - це найменший набір атрибутів, який гарантовано визначає рядок. Тобто, {Змагання, Рік} є потенційним ключем для цієї таблиці.

Таблиця не знаходиться в 3НФ, бо неключовий атрибут «Дата народження переможця» транзитивно залежить від потенційного ключа {Змагання, Рік} через неключовий атрибут «Переможець». Функціональна залежність «Дата народження переможця» від «Переможець» призводить до логічних несумісностей, у цій таблиці ніщо не заважає одній особі мати дві дати народження в різних записах.

В порядку відображення цього факту без порушення 3НФ, необхідно розбити таблицю на дві:

Переможець змагання
ЗмаганняРікПереможець
Вище неба1998Степан Гуцало
Осінній лист1999Яромир Грабар
День вареників1999Степан Гуцало
Вище неба1999Іван Швидкосвист
Дата народження гравців
ГравецьДата народження
Степан Гуцало21 липня 1975
Яромир Грабар28 вересня 1968
Іван Швидкосвист14 березня 1977

Аномалії оновлення не можуть статися в цих таблицях, бо обидві в 3НФ.

Отримання умов Заніоло

Визначення 3НФ запропоноване Карло Заніоло в 1982, доводиться наступним чином: Нехай X → A нетривіальна функціональна залежність (тобто X не містить A) і нехай A неключовий атрибут. Також нехай Y буде ключем для R. Тоді Y → X. Отже A не транзитивно залежить від Y тоді і тільки тоді, коли X → Y, тобто, тоді і тільки тоді, коли X —суперключ.[7]

Примітки

  1. Codd, E.F. "Further Normalization of the Data Base Relational Model." (Presented at Courant Computer Science Symposia Series 6, "Data Base Systems," New York City, May 24th–25th, 1971.) IBM Research Report RJ909 (August 31st, 1971). Republished in Randall J. Rustin (ed.), Data Base Systems: Courant Computer Science Symposia Series 6. Prentice-Hall, 1972.
  2. Codd, p. 43.
  3. Codd, p. 4546.
  4. Zaniolo, Carlo. "A New Normal Form for the Design of Relational Database Schemata." ACM Transactions on Database Systems 7(3), September 1982.
  5. Kent, William. "A Simple Guide to Five Normal Forms in Relational Database Theory", Communications of the ACM 26 (2), Feb. 1983, pp. 120–125.
  6. Date, C.J. An Introduction to Database Systems (7th ed.) (Addison Wesley, 2000), p. 379.
  7. Zaniolo, p. 494.

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.