Просмотреть запись

Автоматическая структуризация и анализ поискового поведения по логу поисковой машины

Электронный научный архив УРФУ

Информация об архиве | Просмотр оригинала
 
 
Поле Значение
 
Заглавие Автоматическая структуризация и анализ поискового поведения по логу поисковой машины
Automatic structuring and analysis of Web searcher behavior
 
Автор Бузикашвили, Н.
 
Тематика ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
 
Описание Работа основана на разделении логической структуры поиска, описывающей взаимозависимости запросов пользователя, и ее физической реализации. Помимо линейных зависимостей, логическая структура поиска допускает ветвления и склейки, а физическая реализация — еще и окказиональные нарушения линейности. Показано, что обе нелинейных структуры присутствуют в поисковом поведении (поток запросов лучше интерпретируется в терминах нелинейного поиска). При этом, (1) доля запросов, за которыми следует ветвление поиска, составляет порядка 5%, (2) число ветвей в среднем чуть больше двух, (3) доля запросов, соответствующих склейке поисковых цепочек, составляет порядка 3%, (4) слиянию часто предшествует ветвление, т.е. имеет место схождение ранее разветвившегося поиска, (5) длина сливаемых цепочек (в том числе, при слиянии ранее после ветвления) устойчиво мала (порядка двух модификаций запроса), тогда как (6) при ветвлении без последующего слияния последняя ветвь может быть длинной, (7) запрос-композиция далее уже почти никогда не модифицируется, он финальный. Кроме того, рассмотрено использование операций генерализации и конкретизации запроса, понимаемых как вхождение одного запроса в другой. Оказалось, что (8) конкретизация (наращивание запроса) используется примерно в 4 раза чаще генерализации (укорачивания) при линейной модификации и ветвлении, а при слиянии — в 20 раз чаще. (9) доля запросов-композиций, являющихся точным объединением сливаемых, составляет более 10% таких запросов.
The study bases on the concept of non-linear logical search structure and different physical realizations of this structure in the search process. Non-linear dependencies among queries submitted by a searcher during temporal sessions are common. The findings of the study are: (1) a searcher frequently use branching search (a number of branching queries is about 5%); (2) a number of branches is a little bigger than two, (3) a number of convergent queries is about 3%; (4) the same search process frequently combines branching and convergence; (5) convergent query chains are small; (6) branching (non-convergent) chains are longer, (7) a convergent query is not modified later. A fraction of generalized (by exclusion of terms) queries and a fraction of narrowed (by addition of terms) queries are considered. (8) The ratio of narrowed and generalized queries is equal to 4:1 for linear query modification and branching whilst the ration is equal to 20:1 for convergent queries. (9) A fraction of convergent queries which are precise unions of combined queries is bigger than 10% of all convergent queries.
 
Дата 2008-11-18T05:23:15Z
2008-11-18T05:23:15Z
2007
 
Тип Article
Journal article (info:eu-repo/semantics/article)
Published version (info:eu-repo/semantics/publishedVersion)
 
Идентификатор Бузикашвили, Н. Автоматическая структуризация и анализ поискового поведения по логу поисковой машины / Н. Бузикашвили // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 25–36.
978-5-7525-1788-5
http://elar.urfu.ru/handle/10995/1330
 
Язык ru
 
Связанные ресурсы Интернет-математика 2007. — Екатеринбург, 2007
 
Формат 313190 bytes
application/pdf
 
Издатель Изд-во Урал. ун-та