Natural Language Toolkit

Набір інструментів природної мови, або частіше NLTK, — це набір бібліотек і програм для символьної та статистичної обробки природної мови (NLP) для англійської мови, написаних мовою програмування Python. Його розробили Стівен Берд і Едвард Лопер з кафедри комп'ютерних та інформаційних наук університету Пенсільванії[5]. NLTK містить як набори даних, так і графічні матеріали. До пакету входить книга, яка пояснює основні концепції завдань обробки мови, що підтримуються набором інструментів[6], а також прикладами застосування пакету[7].

Natural Language Toolkit
Тип Обробка природної мови
Автор(и) Стівен Берд, Едвард Лопер, Еван Клейн
Розробник Team NLTK
Перший випуск 2001 (2001)[1]
Стабільний випуск 3.6.1 (7 квітня, 2021 (2021-04-07)[2])
Версії 3.6.2 (20 квітня 2021)[3]
Репозиторій github.com/nltk/nltk
Мова програмування Python
Ліцензія Apache 2.0[4]
Вебсайт www.nltk.org
Синтаксичне дерево, згенероване за допомогою NLTK

NLTK призначений для підтримки досліджень і викладання навчальних курсів пов'язаних з НЛП та близькоспорідненими областями, включаючи емпіричну лінгвістику, когнітивну науку, штучний інтелект, пошук інформації та машинне навчання[8]. NLTK успішно використовується як навчальний інструмент, а також як платформа для створення прототипів і побудови дослідницьких систем. У США та ще у 25 країнах 32 університети використовують NLTK у своїх курсах. NLTK підтримує функціональні можливості класифікації, токенізації, стемінгу, тегів, аналізу та семантичного міркування.[9]

Основні компоненти бібліотеки

Див. також

Примітки

  1. Project site on SourceForge. 9 липня 2001.
  2. NLTK ChangeLog. nltk.org. Процитовано 13 квітня 2021.
  3. Release 3.6.2 — 2021.
  4. NLTK License. NLTK Project. Процитовано 14 лютого 2015.
  5. Preface. www.nltk.org. Процитовано 15 червня 2016.
  6. Bird, Steven; Klein, Ewan; Loper, Edward (2009). Natural Language Processing with Python. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
  7. Perkins, Jacob (2010). Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing. ISBN 978-1849513609.
  8. Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). Multidisciplinary instruction with the Natural Language Toolkit. Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. Архів оригіналу за 2 September 2011.
  9. NLTK Courses. Google Docs. Процитовано 15 червня 2016.

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.