суффиксные деревья и поиск в строке

Совершенно новая алгоритмическая техника.
Позволяющая решить многие не решаемые до этих пор задачи контекстного поиска, сравнений текстов, нахождения общих вхождений в текстах и т.д.
Начинать перечисление источников нужно с книги: Гасфилд Д. "Строки, деревья и последовательности в алгоритмах. Информатика и вычислительная биология":

Издательство: Невский диалект
ISBN: 5-7940-0103-8; 5-94517-321-9
Год: 2003
Страниц: 654

Свободно скачать книгу (и оно того стоит!) можете здесь

12.06 МБ

Olej писал(а):Начинать перечисление источников

Интересно и полезно:

Простое суффиксное дерево

18 мая 2015 в 18:03

Построение суффиксного дерева за линейное время

Лекция № 1 курса
«Алгоритмы для Интернета»
Юрий Лифшиц∗
28 сентября 2006 г.

Будем называть текстом T строку из n символов t1 . . . tn, а каждое окончание текста ti . . . tn — его суффиксом.
Суффиксное дерево (ST) — это способ представления текста. Неформально говоря, чтобы построить ST для текста T = t1 . . . tn, нужно приписать специальный символ $ в конец текста, взять все n + 1 суффиксов, подвесить их за начала и склеить все ветки, идущие по одинаковым буквам. В каждом листе записывается номер суффикса, заканчивающегося в этом листе. Номером суффикса является индекс его
начала в тексте T.

Суффиксное дерево. Алгоритм Укконена

редактировано: 4 Feb 2013 0

Суффиксные деревья

Второй курс, осенний 2017/18

Конспект лекций по алгоритмам
Собрано 23 октября 2017 г. в 19:17

Глава 3. Деревья суффиксов

Взяв за основу одну из опубликованных реализаций алгоритма Укконена построения суффиксного дерева за линейное время O(n), построил такую вот демонстрационную задачу...
На ней, на примерах, хорошо видно структуру того, что представляет из себя суффиксное дерево ... например те строки-тексты, которые используются в вышеприведенных публикациях (потому что так тестирование можно проверить):