Natural Language Toolkit
Набір інструментів природної мови, або частіше NLTK, — це набір бібліотек і програм для символьної та статистичної обробки природної мови (NLP) для англійської мови, написаних мовою програмування Python. Його розробили Стівен Берд і Едвард Лопер з кафедри комп'ютерних та інформаційних наук університету Пенсільванії[5]. NLTK містить як набори даних, так і графічні матеріали. До пакету входить книга, яка пояснює основні концепції завдань обробки мови, що підтримуються набором інструментів[6], а також прикладами застосування пакету[7].
Тип | Обробка природної мови |
---|---|
Автор(и) | Стівен Берд, Едвард Лопер, Еван Клейн |
Розробник | Team NLTK |
Перший випуск | 2001[1] |
Стабільний випуск | 3.6.1 (7 квітня, 2021[2]) |
Версії | 3.6.2 (20 квітня 2021)[3] |
Репозиторій | github.com/nltk/nltk |
Мова програмування | Python |
Ліцензія | Apache 2.0[4] |
Вебсайт | www.nltk.org |
NLTK призначений для підтримки досліджень і викладання навчальних курсів пов'язаних з НЛП та близькоспорідненими областями, включаючи емпіричну лінгвістику, когнітивну науку, штучний інтелект, пошук інформації та машинне навчання[8]. NLTK успішно використовується як навчальний інструмент, а також як платформа для створення прототипів і побудови дослідницьких систем. У США та ще у 25 країнах 32 університети використовують NLTK у своїх курсах. NLTK підтримує функціональні можливості класифікації, токенізації, стемінгу, тегів, аналізу та семантичного міркування.[9]
Основні компоненти бібліотеки
- Лексичний аналіз: Токенізатор слів і тексту
- n-грам і колокації
- Теггер частини мови
- Модель дерева та фрагмент тексту для запису
- Розпізнавання іменованих об'єктів
Див. також
Примітки
- Project site on SourceForge. 9 липня 2001.
- NLTK ChangeLog. nltk.org. Процитовано 13 квітня 2021.
- Release 3.6.2 — 2021.
- NLTK License. NLTK Project. Процитовано 14 лютого 2015.
- Preface. www.nltk.org. Процитовано 15 червня 2016.
- Bird, Steven; Klein, Ewan; Loper, Edward (2009). Natural Language Processing with Python. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
- Perkins, Jacob (2010). Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing. ISBN 978-1849513609.
- Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). Multidisciplinary instruction with the Natural Language Toolkit. Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. Архів оригіналу за 2 September 2011.
- NLTK Courses. Google Docs. Процитовано 15 червня 2016.