Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству
Электронный научный архив УРФУ
Информация об архиве | Просмотр оригиналаПоле | Значение | |
Заглавие |
Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству
Use of decomposition on the basis of substrings at construction of indexes for similarity search |
|
Автор |
Андрианов, И. А.
Минин, В. Н. |
|
Тематика |
ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ СБОРНИКИ СТАТЕЙ |
|
Описание |
Данная работа посвящена созданию обновляемого индекса для выполнения поиска по подмножеству регулярных выражений и сходству фрагментов текста. За основу взят индекс, использующий мультиграммы (подстроки переменной длины) в качестве индексируемых элементов. Разработаны алгоритмы, позволяющие эффективно изменять индекс при вставке и удалении данных. Также в работе рассматривается использование разреженных суффиксных деревьев для определения степени сходства документов — результатов поиска.
The given work considers creation of a changeable index for search on a subset of regular expressions and on similarity. For a basis we take an index using multigrams (strings of variable length) as indexed elements. We offer the algorithms allowing effectively to change an index at performance of an insert and removal of data. Also we show how to use sparse suffix trees for definition of similarity of search results. |
|
Дата |
2008-11-18T05:13:15Z
2008-11-18T05:13:15Z 2007 |
|
Тип |
Article
Journal article (info:eu-repo/semantics/article) Published version (info:eu-repo/semantics/publishedVersion) |
|
Идентификатор |
Андрианов, И. А. Применение декомпозиции на основе подстрок при построении индексов для поиска по сходству / И. А. Андрианов, В. Н. Минин // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 16–24.
978-5-7525-1788-5 http://elar.urfu.ru/handle/10995/1329 |
|
Язык |
ru
|
|
Связанные ресурсы |
Интернет-математика 2007. — Екатеринбург, 2007
|
|
Формат |
231241 bytes
application/pdf |
|
Издатель |
Изд-во Урал. ун-та
|
|