NYSIIS
Фонетичний код, відомий як NYSIIS, є фонетичним алгоритмом розробленим у 1970 році як частина ідентифікації та інформаційної системи штату Нью-Йорк (в даний час частина штату Нью-Йорк відділу карного правосуддя Services). Він відрізняє підвищення точності 2,7% в порівнянні з традиційним алгоритмом Саундекс
Алгоритм полягає у наступному:
- Перетворюємо перші літери слова: MAC → MCC, К. М. → N, K → С, рН, PF → FF, SCH → SSS;
- Перетворюємо останні букви слова : Є. Є. → Y, IE → Y, DT, RT, RD, NT, ND → D;
- Перший символ в ключеві є першим символом слова;
- Перекладаємо інші літери за правилами:
- EV → AF інакше A, E, I, O, U → A
- Q → G, Z → S, M → N
- KN → N інакше K → C
- SCH → SSS, PH → FF
- H → Якщо попередній або наступний не є голосною, попередні.
- W → Якщо попередні є голосною, А.
- Додати потік до ключа, якщо потік не такий, як останній символ ключа.
- Якщо останній символ S, видалити її.
- Якщо попередні символи AY, замінити на Y.
- Видалити останній символ
- Додати ключ до слова, починаючи з 3 символу (перші символи обрізати)
- Якщо довжина, більша ніж 6 символів, обрізати, по перші 6 символів. (Лише вони потрібні для справжніх NYSIIS, деякі версії використовувати повний радок)
Список літератури
- Райковіч П; Янкович, Д. (2007)
- Тафт Р (1970), "Пошук по імені методи", Олбані, штат Нью-Йорк: Нью-Йорк державної ідентифікації та інформаційної системи
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.