Извлечение значимой информации из web-страниц для задач информационного поиска
Электронный научный архив УРФУ
Информация об архиве | Просмотр оригиналаПоле | Значение | |
Заглавие |
Извлечение значимой информации из web-страниц для задач информационного поиска
Automatic Extraction of Significant Part of Web Pages for Informational Retrieval |
|
Автор |
Агеев, М. С.
Вершинников, И. В. Добров, Б. В. |
|
Описание |
В статье описываются разработанные нами методы разделения web-страниц на содержательную и навигационную части. Данные методы основаны на выделении одинаковых частей страниц с одного сайта. Основной целью данной работы является повышение качества информационного поиска за счет удаления навигационной части из web-страниц. Мы покажем, что разработанный алгоритм позволяет эффективно разделять страницы на содержательную и навигационную части. С другой стороны, проведенный нами эксперимент по анализу эффективности информационного поиска в web на основе коллекции РОМИП-WEB-narod.ru с использованием разработанного алгоритма не привел к улучшению средней оценки точности поиска. В статье описан детальный анализ результатов информационного поиска с использованием описанного алгоритма.
We describe a new algorithm for automatic partition of web page onto navigational and main parts. The algorithm is based on extraction of common parts in web-pages from one web-site. Our basic supposition is that we can improve quality of information retrieval system by purging navigational part of web-pages. We show that our method successfully extract navigational and main parts from web-pages. On the other hand, cutting of navigational part do not improve quality of web information retrieval. |
|
Дата |
2008-11-21T04:53:31Z
2008-11-21T04:53:31Z 2005 |
|
Тип |
Article
Journal article (info:eu-repo/semantics/article) Published version (info:eu-repo/semantics/publishedVersion) |
|
Идентификатор |
Агеев М.С. Извлечение значимой информации из web-страниц для задач информационного поиска / М. С. Агеев, И. В. Вершинников, Б. В. Добров // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 283-301.
http://elar.urfu.ru/handle/10995/1414 |
|
Язык |
ru
|
|
Связанные ресурсы |
Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005
|
|
Формат |
842144 bytes
application/pdf |
|
Издатель |
б. и.
|
|