SQL

SQL (/ˌɛsˌkjuːˈɛl/ або /ˈsiːkwəl/, англ. Structured query language — мова структурованих запитів) декларативна мова програмування для взаємодії користувача з базами даних, що застосовується для формування запитів, оновлення і керування реляційними БД, створення схеми бази даних та її модифікації, системи контролю за доступом до бази даних. Сама по собі SQL не є ані системою керування базами даних, ані окремим програмним продуктом. На відміну від дійсних мов програмування (C або Pascal), SQL може формувати інтерактивні запити або, бувши вбудованою в прикладні програми, виступати як інструкції для керування даними. Окрім цього, стандарт SQL містить функції для визначення зміни, перевірки та захисту даних.

SQL
Парадигма мульти-парадигмовий
Дата появи 1974
Творці Дональд Чамберлін та Раймонд Бойс
Розробник IBM
Останній реліз SQL:2016 (2016)
Система типізації строга статична типізація
Основні реалізації багато
Діалекти SQL-86, SQL-89, SQL-92, SQL:1999, SQL:2003, SQL:2006, SQL:2008[1], SQL:2011, SQL:2016.
Під впливом від Datalog
Вплинула на CQL, LINQ, Windows PowerShell
Операційна система крос-платформова
Звичайні розширення файлів .sql
 SQL у Вікісховищі

SQL — це діалогова мова програмування для здійснення запиту і внесення змін до бази даних, а також керування базами даних. Багато баз даних підтримує SQL з розширеннями до стандартної мови. Ядро SQL формує командна мова, яка дозволяє здійснювати пошук, вставку, оновлення і вилучення даних за допомогою використання системи керування і адміністративних функцій. SQL також включає CLI (Call Level Interface) для доступу і керування базами даних дистанційно.

Основу бази даних SQL Server утворює сервер або ядро бази даних.[джерело?] Ядро бази даних відповідає за обробку запитів, які надходять від клієнтів, і передачу відповідних результатів клієнтським компонентам.[джерело?]

Перша версія SQL була розроблена на початку 1970-х років у IBM. Ця версія мала назву SEQUEL і була призначена для обробки та пошуку даних, що містилися в реляційній базі даних IBM, System R. Мова SQL надалі була стандартизована Американськими Держстандартами (ANSI) в 1986. На початку SQL була запланована як мова запитів і управління даними, а пізніші модифікації SQL створені продавцями системи управління базами даних, які додали процедурні конструкції, control-of-flow команд і темпоральні розширення мов. З випуском стандарту SQL:1999 такі розширення були формально запозичені як частина мови SQL через Persistent Stored Modules (SQL/PSM).

Критика SQL включає відсутність крос-платформенності, невідповідну обробку відсутніх даних (дивіться Null (SQL)). Часто це неоднозначна граматика і семантика мови.

Історія

На початку 1970-х років в одній з дослідницьких лабораторій компанії IBM була розроблена експериментальна реляційна СУБД System R, для якої потім була створена спеціальна мова SEQUEL, що дозволяла відносно просто керувати даними в цій СУБД. Абревіатура SEQUEL розшифровувалася як англ. Structured English QUEry Language — «структурована англійська мова запитів». Пізніше з юридичних міркувань[2] мова SEQUEL була перейменована в SQL. Коли в 1986 році перший стандарт мови SQL був прийнятий ANSI (American National Standards Institute), офіційною вимовою стало [,es kju:' el] — ес-к'ю-ел. Попри це, навіть англомовні фахівці по традиції часто називають SQL "сіквел", замість "ес-кью-ел".

Метою розробки було створення простої непроцедурної мови, якою зміг би скористатися будь-який користувач, що навіть не має навичок програмування. Власне розробкою мови запитів займалися Дональд Чемберлін (Donald D. Chamberlin) та Рей Бойс (Ray Boyce). Пет Селінджер (Pat Selinger) займалася розробкою вартісного оптимізатора (англ. cost-based optimizer), Реймонд Лорі (Raymond Lorie) займався компілятором запитів.

Варто зазначити, що SEQUEL не була єдиною мовою подібного призначення. У Каліфорнійському університеті в Берклі була розроблена некомерційна СУБД Ingres (що була, між іншим, дальнім прародичем популярної зараз некомерційної СУБД PostgreSQL), яка була реляційною СУБД, але використовувала свою власну мову QUEL, яка, проте, не витримала конкуренції за кількістю СУБД, що підтримували її, з мовою SQL.

Першими СУБД, що підтримують нову мову SQL1979 року), стали Oracle V2 для машин VAX від компанії Relational Software Inc. (що згодом стала компанією Oracle) і System/38 від IBM, заснована на System/R.

Перший офіційний стандарт мови SQL був прийнятий ANSI в 1986 і ISO (Міжнародною організацією зі стандартизації) в 1987 (так званий SQL-86), який був уточнений в 1989 році. Наступний розвиток мови постачальниками СУБД зажадав ухвалення в 1992 р. нового розширеного стандарту (ANSI SQL-92, або просто SQL2), в якому були визначені спеціальні темпоральні розширення в стандарті SQL. Наступним стандартом став SQL:1999 (SQL3). В наш час[коли?], діє стандарт, який був прийнятий у 2003 році (SQL:2003), а надалі зазнав незначних модифікацій.

Стандарти

Повністю історія версій стандартів-ревізій SQL:

РікНазваІнша назваКоментар
1986SQL-86SQL-87Вперше оприлюднено ANSI. Ратифіковано ISO в 1987.
1989SQL-89FIPS 127-1Незначні зміни.
1992SQL-92SQL2Вагомі зміни.
1999SQL:1999SQL3Додано регулярні вирази, рекурсивні запити, тригери та деякі об'єктно-орієнтовані нововведення.
2003SQL:2003SQL 2003Впроваджені розширення для роботи з XML-даними.
2006SQL:2006SQL 2006ISO/IEC 9075-14:2006. Функціональність роботи з XML-даними значно розширено. З'явилась можливість сумісного використання в SQL та XQuery.
2008SQL:2008SQL 2008Вдосконалені можливості віконних функцій, усунуто деякі неоднозначності стандарту SQL:2003. Легалізовано ORDER BY поза визначенням курсору. Додано тригери INSTEAD OF. Додано заяви TRUNCATE.
2011SQL:2011SQL 2011Додає часові дані (PERIOD FOR) (додаткова інформація у: Тимчасова база даних#Історія). Покращення функцій вікон та пропозиції FETCH.
2016 SQL:2016 SQL 2016 Додає рядки підрівнювання посилань, поліморфні функції таблиці, JSON.

Синтаксис

Мова SQL поділяється на кілька видів елементів:

  • Пункти (диз'юнкти) (англ. Clauses), що є складовими частинами інструкцій та запитів. (Іноді вони не обов'язкові.)[3]
  • Вирази (англ. Expressions), які можуть генерувати скалярні значення, або таблиці з стовпчиками і рядками даних
  • Предикати (англ. Predicates), які описують умови, результатом яких є значення тризначної логіки SQL (true/false/unknown) або Булеві значення істинності і які використовуються для обмеження ефекту інструкцій та запитів, або для зміни потоку виконання програми.
  • Запити (англ. Queries), які отримують дані на основі заданих критеріїв.
  • Інструкції (англ. Statements), які чинять дію на схему даних чи самі дані, або контролюють транзакції, потік виконання програми, з'єднання, сесії, та виконують діагностику.
    • Інструкції SQL також включають крапку з комою (";") для позначення кінця інструкції. Хоча вона не є обов'язковою на кожній платформі, вона описується як стандартна частина граматики SQL.
  • Незначимі пропуски загалом ігноруються в інструкціях і запитах SQL, дозволяючи форматувати код SQL з метою покращення читабельності.

Структура SQL

SQL (Structured query language — мова структурованих запитів), складається з:

Data Definition Language

  • CREATE — створення об'єкта (наприклад, таблиці);
  • ALTER — зміна об'єкта (наприклад, додавання/зміна полів таблиці);
  • DROP — видалення об'єкта.

Data Manipulation Language

  • INSERT — вставлення рядочка;
  • SELECT — вибірка;
  • UPDATE — зміна;
  • DELETE — видалення.

Data Control Language

  • GRANT — надання прав користувачу;
  • DENY — явна заборона для користувача;
  • REVOKE — скасування заборони/дозволу користувачу.

Transaction Control Language

  • BEGIN TRANSACTION — почати транзакцію;
  • COMMIT — прийняти зміни прийняті в транзакції;
  • ROLLBACK — відкат.

Питання сумісності

Як і з багатьма стандартами в IT-індустрії, з мовою SQL виникла проблема: багато розробників ПЗ вирішили, що функціональність стандартної версії недостатня (що, в принципі, для ранніх версій SQL було певною мірою справедливо) і їх бажанням стало її розширення. Це призвело до того, що у різних виробників СУБД застосовуються різні діалекти SQL, здебільшого, несумісні між собою.

До 1996 року питаннями відповідності комерційних реалізацій SQL стандарту займався переважно інститут NIST, який і встановлював рівень відповідності стандарту. Відтоді, як останній підрозділ, що займався СУБД, був розформований, всі зусилля з перевірки СУБД на відповідність стандарту були покладені на її виробника.

Вперше поняття «Рівня відповідності» було запропоноване в стандарті SQL-92. ANSI і NIST визначали чотири рівні відповідності реалізації цьому стандарту:

  • Entry (базовий)
  • Transitional (перехідний) — перевірку на відповідність цьому рівню проводив тільки інститут NIST
  • Intermediate (проміжний)
  • Full (повний)

Легко можна зрозуміти, що кожен наступний рівень відповідності свідомо передбачав відповідність попередньому рівню. Далі, згідно з цими рівнями стандартів, будь-яка СУБД, що відповідала рівню Entry, могла бути охарактеризована як «SQL-92-відповідна», хоча насправді її здатність до перенесення і відповідність стандарту обмежувалися набором можливостей, що входять до вказаного рівня.

Ситуація змінилася з ухваленням стандарту SQL:1999. Відтоді стандарт набув модульної структури — основна частина стандарту була винесена в розділ «SQL/Foundation», а все інше було виведене в окремі модулі. Залишився лише один рівень сумісності Core. Підтримка решти можливостей залишена на розсуд виробників СУБД. Аналогічно організовані й наступні версії стандарту.

Переваги

Незалежність від конкретної СУБД

Не зважаючи на наявність діалектів і відмінностей в синтаксисі, більшість текстів SQL-запитів, що містять, DDL і DML, можуть бути досить легко перенесені з однієї СУБД в іншу. Існують системи, розробники яких спочатку орієнтувалися на застосування щонайменше кількох СУБД (наприклад: система електронного документообігу Documentum може працювати як з Oracle, так і з Microsoft SQL Server та IBM DB2). Природно, що при застосуванні деяких специфічних для реалізації можливостей, такого рівня перенесення дуже важко досягти.

Наявність стандартів

Наявність стандартів і наборів тестів для виявлення сумісності та відповідності конкретній реалізації SQL загальноприйнятому стандарту тільки сприяє «стабілізації» мови. Щоправда, слід звернути увагу на той факт, що сам по собі стандарт місцями занадто формалізований і має завеликі розміри, наприклад, Core-частина стандарту SQL:2003 містить понад 1300 сторінок тексту.

Декларативність

За допомогою SQL програміст описує лише дані, які потрібно витягнути або модифікувати. Яким саме чином це зробити, вирішує СУБД безпосередньо при обробці SQL-запиту. Не слід вважати, що це повністю універсальний принцип — програміст описує набір даних для вибірки або модифікації, проте йому корисно уявляти, як СУБД інтерпретуватиме текст його запиту. Такі моменти стають особливо критичними при роботі з великими базами даних та зі складними запитами чим складніше сконструйований запит, тим більше варіантів виконання він припускає. Ці варіанти можуть дуже відрізнятися за швидкістю виконання та використаними ресурсами, хоча результат (набір даних) має бути однаковим.

Недоліки

Невідповідність реляційній моделі даних

Творець реляційної моделі даних Едгар Кодд, Крістофер Дейт та їхні прихильники вказують на те, що SQL не є істинно реляційною мовою. Зокрема, вони привертають увагу до таких проблем SQL[4]:

  • Рядки, що повторюються
  • Невизначені значення (null)
  • Явна вказівка порядку стовпчиків зліва направо
  • Стовпчики без імені та імена стовпчиків, що повторюються
  • Відсутність підтримки властивості «=»
  • Використання вказівників
  • Значна надлишковість

В опублікованому Крістофером Дейтом і Г'ю Дарвеном Третьому маніфесті[5], вони декларували принципи СУБД наступного покоління та пропонували мову Tutorial D, яка є справді реляційною.

Складність

Хоча мову SQL було початково заплановано як засіб роботи кінцевого користувача, урешті-решт вона стала настільки складною, що перетворилася на інструмент програміста.

Відхилення від стандартів

Попри існування міжнародного стандарту ANSI (SQL-92, SQL:1999 та подальші версії), багато компаній, що розробляють СУБД (наприклад, Oracle, Sybase, Microsoft, MySQL), вносять свої зміни до мови SQL, що застосовується в розроблених ними СУБД. Цим вони створюють передумови відхилення від стандартів. Тож у кожній конкретній СУБД застосовуються специфічні діалекти мови SQL.

Складність роботи з ієрархічними структурами

Раніше SQL не пропонувала стандартного способу маніпуляції деревовидними структурами. Деякі постачальники СУБД запропонували свої рішення. Для прикладу, Oracle використовує вираз CONNECT BY. В наш час[коли?] як стандарт прийнята рекурсивна конструкція WITH.

Процедурні розширення

Оскільки SQL не є мовою програмування (тобто не надає засобів для автоматизації операцій з даними), нововведення різних виробників стосувалися в першу чергу процедурних розширень. Це збережені процедури (англ. stored procedures) і процедурні мови - «надбудови». Практично в кожній СУБД застосовується своя процедурна мова. Подібні мови для найпопулярніших СУБД приведені в наступній таблиці.

СУБД Коротка назва Розшифрування
Borland InterBase/
Firebird
PSQL Procedural SQL
IBM DB2 SQL PL SQL Procedural Language (розширює SQL/PSM)
Microsoft SQL Server/
Sybase ASE
Transact-SQL Transact-SQL
MySQL SQL/PSM SQL/Persistent Stored Module
Oracle PL/SQL Procedural Language/SQL (заснований на мові Ada)
PostgreSQL PL/pgSQL Procedural Language/PostgreSQL Structured Query Language (схожий на Oracle PL/SQL)

Простий приклад

Простий запит для виведення списку із атрибутами Name, Address, Class із таблиці School у певній базі даних має такий вигляд:

SELECT Name, Address, Class
FROM School;

Примітки

  1. http://archives.postgresql.org/pgsql-hackers/2008-09/msg00071.php
  2. «„SEQUEL“ був торговою маркою британської авіабудівної групи компаній Hawker Siddeley» // Andy Oppel. Databases Demystified. — San Francisco, CA : McGraw-Hill Osborne Media. — С. 90—91. — ISBN 0-07-225364-9.
  3. ANSI/ISO/IEC International Standard (IS).
  4. O'Reilly Network. Архівовано 3 травня 2007 у Wayback Machine. An Interview with Chris Date
  5. The Third Manifesto

Див. також

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.