Просмотреть запись

Автоматическое разрешение лексической многозначности на базе тезаурусных знаний

Электронный научный архив УРФУ

Информация об архиве | Просмотр оригинала


Поле	Значение

Заглавие	Автоматическое разрешение лексической многозначности на базе тезаурусных знаний Thesaurus-based word sense disambiguation

Автор	Лукашевич, Н. В. Чуйко, Д. С.

Тематика	ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ СБОРНИКИ СТАТЕЙ

Описание	В данной работе мы описываем новый алгоритм для разрешения лексической многозначности на основе Тезауруса русского языка РуТез. Мы оценили точность работы алгоритма для задачи «все слова текста» и задачи разрешения многозначности тематической лексики. Для задачи «все слова текста» точность применяемого метода сравнима с результатами лучших систем на специализированной конференции SENSEVAL-3, при этом мы не применяем семантически размеченные корпуса, которые используются такими системами. Однако полученная точность разрешения многозначности для всех слов текста недостаточна для применения в задачах информационного поиска. Результаты, полученные при разрешении многозначности тематической лексики, значительно выше. Поэтому представляется перспективной разработка гибридных методов информационного поиска, сочетающих пословные методы и методы, основанные на использовании тезаурусных и онтологических ресурсов для конкретных предметных областей. In the paper we describe a new method for word-sense disambiguation based on the Thesaurus of Russian Language RuThes. We evaluated precision of the algorithm for the «all- words» task and the task of thematic-oriented word-sense disambiguation. For the «all-words» task the precision of our algorithm, which does not use sense-tagged corpora, is comparable with the results of the best systems of the specialized conference SENSEVAL-3. However the level of the precision for the «all-words» task is not enough for the use in information-retrieval applications. For the task of thematic-oriented word-sense disambiguation the precision is much higher. Therefore it could be perspective to develop hybrid information -retrieval methods combining word-based techniques for all words and concept-based techniques for processing of thematic words and terms based on domain- specific thesauri or ontologies.

Дата	2008-11-18T06:16:08Z 2008-11-18T06:16:08Z 2007

Тип	Article Journal article (info:eu-repo/semantics/article) Published version (info:eu-repo/semantics/publishedVersion)

Идентификатор	Лукашевич, Н. В. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний / Н. В. Лукашевич, Д. С. Чуйко // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 108–117. 978-5-7525-1788-5 http://elar.urfu.ru/handle/10995/1339

Язык	ru

Связанные ресурсы	Интернет-математика 2007. — Екатеринбург, 2007

Формат	247122 bytes application/pdf

Издатель	Изд-во Урал. ун-та

Just another harvester

Просмотреть запись

Автоматическое разрешение лексической многозначности на базе тезаурусных знаний

Электронный научный архив УРФУ