Математична лінгвістика

Математи́чна лінгві́стика (також обчи́слювальна лінгві́стика або комп'ю́терна лінгві́стика) — напрямок штучного інтелекту, який ставить за мету використання математичних моделей для опису природних мов.

Комп'ютерна лінгвістика частково перетинається з обробкою природних мов. Проте останнім часом акцент робиться не на абстрактні моделі, а на прикладні методи опису та обробки мови для комп'ютерних систем.

Розділи математичної лінгвістики

Вони залежать від середовища, в якому використовуються мови, бувають усними та письмовими. А також від дій над мовою (аналіз, створення, переклад)

Розпізнавання та синтез мови
Синтаксичний аналіз та генерація - це розділи, які "розберуть і по частинах складуть" будь-яке речення.
Власне машинний переклад.
Автоматичне реферування.

Математична лінгвістика - ряд галузей теоретичного і прикладного мовознавства, в яких використовуються поняття і методи математики (теорії імовірностей, математичної статистики, теорії інформації, математичної логіки, теорії алгоритмів тощо). Ще на початку 20 ст. російський математик А. А. Марков (старший) застосував теорію імовірностей до вивчення розподілу літер на позначення голосних і приголосних звуків у друкованих російських текстах («Євгеній Онєгін» О. С. Пушкіна, «Дитячі роки Багрова-онука» С. Т. Аксакова). Такі дослідження починаючи з 1930-х років набули важливого застосування в телеграфії й телефонії. Основне завдання тут полягало в передачі по каналах зв'язку максимальної кількості повідомлень найекономнішим способом. Щоб вирішити це завдання, потрібно знати кількісні закономірності в мовах: розподіл літер (для телеграфії) і розподіл фонем (для телефонії). Застосовуючи поняття теорії інформації, розробляють за допомогою сучасних обчислювальних пристроїв статистики мов (лінгвістична статистика). Одержані результати є важливими не тільки для телефонії і телеграфії, а й для теоретичного мовознавства. З винайденням електронних обчислювальних машин і розвитком кібернетики перед мовознавством постала низка нових завдань: машинний переклад з однієї мови на іншу, подання в автоматичні пристрої програми дії і даних, сформульованих безпосередньо у вигляді друкованих текстів або усної мови (так зване «мовне керування механізмами»). Все це потребує вивчення граматичних і лексичних властивостей мов математичними методами.

Основні поняття, які використовуються в математичній лінгвістиці

множина вихідних символів (алфавіт);
відношення між елементами алфавіту, що сприймаються як аксіоми (постулюються);
правила виводу, тобто обчислення всіх можливих множин символьних ланцюжків;
ізоморфізм, тобто одно-однозначні відношення між елементами послідовності, при яких кожному елементові однієї послідовності ставиться у відповідність елемент іншої;
гомоморфізм, одно-багатозначні відношення, послідовності, коли одному елементу першої послідовності відповідає декілька елементів другої і навпаки;
відмічений ланцюжок, тобто такий, що відповідає правилам виводу;
входження символу в послідовність, тобто поява його на заданому місці в ланцюжку;
поділ вихідної множини класу ланцюжків за певними правилами на підкласи.

Використання операцій, які базуються на цих поняттях, дає можливість одержати аналоги граматичних класів і підкласів, категорій, парадигм, синтаксичних одиниць і відношень. Властивості відношення одиниць досліджуваної знакової системи виявляють і вивчають шляхом побудови синтезувальних й аналітичних математичних моделей.

Джерела

Українська радянська енциклопедія : у 12 т. / гол. ред. М. П. Бажан ; редкол.: О. К. Антонов та ін. — 2-ге вид. — К. : Головна редакція УРЕ, 1974–1985.
В. С. Перебийніс. Математична лінгвістика // Українська мова : енциклопедія / НАН України, Інститут мовознавства ім. О. О. Потебні, Інститут української мови ; ред. В. М. Русанівський [та ін.]. — К. : Українська енциклопедія, 2000. — ISBN 966-7492-07-9.
Бук С. Основи статистичної лінгвістики: Навчально-методичний посібник / Відп. ред. проф. Ф. С. Бацевич.— Львів: Видавничий центр ЛНУ імені Івана Франка, 2008.— 124 с.
Дарчук Н. П. Комп'ютерна лінгвістика (автоматичне опрацювання тексту): підручник.— К.: Видавничо-поліграфічний центр “Київський університет”, 2008.— 351 с.
Карпіловська Є. А. Вступ до комп’ютерної лінгвістики.— Донецьк: Юго-Восток, 2003.— 184 с.
Ланде Д. В. Елементи комп’ютерної лінгвістики в правовій інформатиці. — К.: НДІІП НАПрН України, 2014. — 351 с. — ISBN 978-966-2344-33-2
Математична лінгвістика : навч. посіб. Кн.1 : Квантитативна лінгвістика / В. В. Пасічник, Ю. М. Щербина, В. А. Висоцька, Т. В. Шестакевич ; за ред. В. В. Пасічника ; М-во освіти і науки, молоді та спорту України. – Л. : Новий Світ-2000, 2012. – 359 с. : іл., табл. – (Серія "Комп'ютинг"). – Бібліогр.: с. 351-358 (139 назв). – ISBN 978-966-418-191-1

Див. також

Математична модель мови.
Редагометрія

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.