Алгоритм Ахо — Корасік

Алгоритм Ахо — Корасік алгоритм пошуку рядків, створений Альфредом Ахо і Маргарет Корасік. Алгоритм реалізує пошук множини підрядків із словника в цьому рядку. Час роботи пропорційно O (M + N + K), де N — довжина рядка-зразка, M — сумарна довжина рядків словника, а K — довжина відповіді, тобто сумарна довжина входжень слів із словника в рядок-зразок. Тому сумарний час роботи може бути квадратичним (наприклад, якщо в рядку «ааааааа», ми шукаємо слова «а», «аа», «ааа», …).

Принцип роботи

Алгоритм складається з двох частин. Перша частина будує за списком підрядків, які треба знайти скінченний автомат, а друга частина передає цьому автоматові рядок, в якому виконується пошук. Автомат отримує по черзі всі символи рядка та переходить за відповідними ребрами.

Поведінку автомата описують три функції:

  • функція переходів, яка для кожного стану і деяких вхідних символів вказує стан, в який треба перейти, описується префіксним деревом;
  • функція невдач, яка описує, в який стан потрібно перейти, якщо для вхідного символа в автоматі не знайшлося результату в функції переходів;
  • функція виводу, яка пов'язує певні стани автомата з результатом, який він повертає.

Література

Див. також

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.