Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура?
Электронный научный архив УРФУ
Информация об архиве | Просмотр оригиналаПоле | Значение | |
Заглавие |
Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура?
|
|
Автор |
Пустыльникова, О.
Мелер, А. |
|
Описание |
Эта работа представляет алгоритм для автоматической классификации текстовых документов в тематические области. Алгоритм воздействует только на текстовую структуру, игнорируя любую дополнительную информацию. Мы представляем оценку подхода, использующего SUSANNE корпус [1] письменного английского и LUCY корпус, основанный на текстах написанных взрослыми, детьми и подростками [1]. Мы показали, что, используя только небольшое количество особенностей возможно достигнуть хороших результатов классификации.
This paper presents an algorithm to automatically classify text documents into thematic fields. The algorithm operates only on text structure disregarding any content information. We present an evaluation of the approach using the SUSANNE corpus [1] of written English and LUCY, a corpus of adult, child and young adult writing [1]. We show that using only a small number of features it is possible to achieve good classification results. |
|
Дата |
2009-10-08T09:27:54Z
2009-10-08T06:52:37Z 2008 |
|
Тип |
Conference Paper
Conference object (info:eu-repo/semantics/conferenceObject) Published version (info:eu-repo/semantics/publishedVersion) |
|
Идентификатор |
Пустыльникова О. Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура? / О. Пустыльникова, А. Мелер // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 24-32.
978-5-8327-0295-7 http://elar.urfu.ru/handle/10995/2061 |
|
Язык |
ru
|
|
Связанные ресурсы |
RuSSIR 2008
|
|
Формат |
163723 bytes
application/pdf |
|
Издатель |
Изд-во ТТИ ЮФУ
|
|