Просмотреть запись

Автоматическое разрешение лексической многозначности на базе тезаурусных знаний

Электронный научный архив УРФУ

Информация об архиве | Просмотр оригинала
 
 
Поле Значение
 
Заглавие Автоматическое разрешение лексической многозначности на базе тезаурусных знаний
Thesaurus-based word sense disambiguation
 
Автор Лукашевич, Н. В.
Чуйко, Д. С.
 
Тематика ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
 
Описание В данной работе мы описываем новый алгоритм для разрешения лексической многозначности на основе Тезауруса русского языка РуТез. Мы оценили точность работы алгоритма для задачи «все слова текста» и задачи разрешения многозначности тематической лексики. Для задачи «все слова текста» точность применяемого метода сравнима с результатами лучших систем на специализированной конференции SENSEVAL-3, при этом мы не применяем семантически размеченные корпуса, которые используются такими системами. Однако полученная точность разрешения многозначности для всех слов текста недостаточна для применения в задачах информационного поиска. Результаты, полученные при разрешении многозначности тематической лексики, значительно выше. Поэтому представляется перспективной разработка гибридных методов информационного поиска, сочетающих пословные методы и методы, основанные на использовании тезаурусных и онтологических ресурсов для конкретных предметных областей.
In the paper we describe a new method for word-sense disambiguation based on the Thesaurus of Russian Language RuThes. We evaluated precision of the algorithm for the «all- words» task and the task of thematic-oriented word-sense disambiguation. For the «all-words» task the precision of our algorithm, which does not use sense-tagged corpora, is comparable with the results of the best systems of the specialized conference SENSEVAL-3. However the level of the precision for the «all-words» task is not enough for the use in information-retrieval applications.
For the task of thematic-oriented word-sense disambiguation the precision is much higher. Therefore it could be perspective to develop hybrid information -retrieval methods combining word-based techniques for all words and concept-based techniques for processing of thematic words and terms based on domain- specific thesauri or ontologies.
 
Дата 2008-11-18T06:16:08Z
2008-11-18T06:16:08Z
2007
 
Тип Article
Journal article (info:eu-repo/semantics/article)
Published version (info:eu-repo/semantics/publishedVersion)
 
Идентификатор Лукашевич, Н. В. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний / Н. В. Лукашевич, Д. С. Чуйко // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 108–117.
978-5-7525-1788-5
http://elar.urfu.ru/handle/10995/1339
 
Язык ru
 
Связанные ресурсы Интернет-математика 2007. — Екатеринбург, 2007
 
Формат 247122 bytes
application/pdf
 
Издатель Изд-во Урал. ун-та