Індекс підрядків
Індекс підрядків — структура даних, що дозволяє здійснювати пошук підрядка в тексті або наборі текстів за сублінійний час. Це означає, що маючи документ довжини або набір документів загальної довжини , ви можете знайти всі входження зразка за (Див. O-нотація). Словосполучення повнотекстовий індекс також іноді використовується для позначення індексу всіх підрядків тексту, але є неоднозначним, так як також використовується для позначення звичайних індексів слів, наприклад, інвертованого індексу.
Деякі індекси підрядків:
- Суфіксний автомат
- Суфіксне дерево
- Суфіксний масив
- Індекс N-грам
- FM-індекс
Джерела
- R. Grossi and J. S. Vitter, Compressed Suffix Arrays and Suffix Trees, with Applications to Text Indexing and String Matching, SIAM Journal on Computing, 35(2), 2005, 378-407. (англ.)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.