Просмотреть запись

Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству

Электронный научный архив УРФУ

Информация об архиве | Просмотр оригинала
 
 
Поле Значение
 
Заглавие Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству
Use of decomposition on the basis of substrings at construction of indexes for similarity search
 
Автор Андрианов, И. А.
Минин, В. Н.
 
Тематика ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
 
Описание Данная работа посвящена созданию обновляемого индекса для выполнения поиска по подмножеству регулярных выражений и сходству фрагментов текста. За основу взят индекс, использующий мультиграммы (подстроки переменной длины) в качестве индексируемых элементов. Разработаны алгоритмы, позволяющие эффективно изменять индекс при вставке и удалении данных. Также в работе рассматривается использование разреженных суффиксных деревьев для определения степени сходства документов — результатов поиска.
The given work considers creation of a changeable index for search on a subset of regular expressions and on similarity. For a basis we take an index using multigrams (strings of variable length) as indexed elements. We offer the algorithms allowing effectively to change an index at performance of an insert and removal of data. Also we show how to use sparse suffix trees for definition of similarity of search results.
 
Дата 2008-11-18T05:13:15Z
2008-11-18T05:13:15Z
2007
 
Тип Article
Journal article (info:eu-repo/semantics/article)
Published version (info:eu-repo/semantics/publishedVersion)
 
Идентификатор Андрианов, И. А. Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству / И. А. Андрианов, В. Н. Минин // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 16–24.
978-5-7525-1788-5
http://elar.urfu.ru/handle/10995/1329
 
Язык ru
 
Связанные ресурсы Интернет-математика 2007. — Екатеринбург, 2007
 
Формат 231241 bytes
application/pdf
 
Издатель Изд-во Урал. ун-та