Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов
Электронный научный архив УРФУ
Информация об архиве | Просмотр оригиналаПоле | Значение | |
Заглавие |
Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов
|
|
Автор |
Тарасов, С.
|
|
Описание |
Работа посвящена одной из актуальных проблем автоматического реферирования – составлению обзорных рефератов по набору документов. Рассмотрен новый на сегодняшний день алгоритм ранжирования связных структур (Manifold Ranking Algorithm) применительно к автоматическому реферированию новостных сюжетов. Алгоритм позволяет учитывать как зависимости между предложениями внутри одного документа, так и зависимости между всеми предложениями коллекции. Проведен анализ возможности использования алгоритма для русского языка. Построена пробная система автоматического реферирования. Приведены результаты работы системы. Сформулированы основные проблемы реализации системы и возможные методы их решения. Оценка качества работы системы произведена при помощи критерия ROUGE. Произведено сравнение результатов работы построенной системы с результатами в DUC 2003, DUC 2005. This work deals with one of the topical problems of automatic summarization – multi-document summarization in respect to news stories. This paper presents a novel extractive approach based on manifold-ranking of sentences to this summarization task. The manifold-ranking algorithm differentiates the intra-document and inter-document links between sentences with different weights. The possibility of the use the algorithm for Russian language is analyzed. A sample system for automatic summarization is build. This paper represents the sample summaries and describes experiments of summarization evaluation. The main problems of implementation of the system and possible methods of their solutions are formulated. The ROUGE criteria was used for evaluation. The results of work of built system are compared with the results of DUC 2003, DUC 2005. |
|
Дата |
2009-10-09T07:29:36Z
2009-10-08T09:27:54Z 2008 |
|
Тип |
Conference Paper
Conference object (info:eu-repo/semantics/conferenceObject) Published version (info:eu-repo/semantics/publishedVersion) |
|
Идентификатор |
Тарасов С. Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов / С. Тарасов // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 90-100.
http://elar.urfu.ru/handle/10995/2066 978-5-8327-0295-7 |
|
Язык |
ru
|
|
Связанные ресурсы |
RuSSIR 2008
|
|
Формат |
171863 bytes
application/pdf |
|
Издатель |
Изд-во ТТИ ЮФУ
|
|