Поисковое поведение пользователя Яndexа (анализ веблогов)
Электронный научный архив УРФУ
Информация об архиве | Просмотр оригиналаПоле | Значение | |
Заглавие |
Поисковое поведение пользователя Яndexа (анализ веблогов)
The Yandex Study Technical Report: First Findings |
|
Автор |
Бузикашвили, Н.
|
|
Описание |
Изложены теоретические предпосылки, цели и результаты первого этапа анализа логов Яndexа. Введены понятия логической структуры и пространства физической реализации поиска. Рассмотрены типы отображений (реализаций) логической структуры и разные типы сессий как проекции реализации на подпространства пространства реализации. Высказано предположение об ограничениях на реализацию, вытекающих из ограниченности кратковременной памяти. Построена процедура автоматического выявления логических сессий и проверены гипотезы об их чередовании. Показано, что чередование с возвратом к прерванной сессии редко, а встречаясь, обычно имеет форму одноуровневой вложенности одной логической сессии в другую. Кроме того, получены стандартные характеристики поискового поведения пользователя русскоязычного Веба. Дальнейшая работа: (а) построение формального языка описания поискового поведения и автоматическая трансляция в него логов; (б) автоматический анализ и выделение закономерностей в полученных описаниях.
The theoretical background, goals and first findings of the Yandex TL study are described. The background includes: a logical structure of search process, a space of physical search realizations, mapping of the logical structure onto the space of realizations, different types of sessions as projections of the search process in the physical search space onto subspaces of this space. Also a hypothesis of different short-term memory based restrictions of different physical realizations is formulated. The term- and string-based queries similarity is introduced, and transitive closure of this relation is considered as a logical session. It is shown that switching with return to unfinished session (a) is very rare and (b) it formed as time inclusion of the second session, i.e. a searcher returns to the broken session only when he finishes a new session. The Yandex study is the first TLA of Russian-language search engine and the standard quantitative characteristics of user searching behavior are calculated. The further works: (a) design and implementation of the ‘Bates-Fidel language’ language and automatic translation of the transaction logs into this language, (b) automatic analysis of these descriptions and extraction of regularities. |
|
Дата |
2008-11-20T11:11:57Z
2008-11-20T11:11:57Z 2005 |
|
Тип |
Article
Journal article (info:eu-repo/semantics/article) Published version (info:eu-repo/semantics/publishedVersion) |
|
Идентификатор |
Бузикашвили Н. Поисковое поведение пользователя Яndexа (анализ веблогов) / Н. Бузикашвили // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 95-120.
http://elar.urfu.ru/handle/10995/1392 |
|
Язык |
ru
|
|
Связанные ресурсы |
Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005
|
|
Формат |
518100 bytes
application/pdf |
|
Издатель |
б. и.
|
|