Просмотреть запись

Оценка релевантности текста для географической диверсификации компании

Электронный архив ТПУ

Информация об архиве | Просмотр оригинала
 
 
Поле Значение
 
Заглавие Оценка релевантности текста для географической диверсификации компании
 
Автор Булыгин, Лев Эдуардович
 
Создатель Семенов, Михаил Евгеньевич
 
Тематика машинное обучение
анализ текста
географическая диверсификация
бинарная классификация
линейный классификатор
градиентный бустинг
TF-IDF
word2vec
doc2vec
оптимизация параметров обучения
Machine learning
text analysis
geographic diversification
binary classification
linear classifier
gradient boosting
TF-IDF
word2vec
doc2vec
optimization of learning parameters
01.03.02
005.591.61
 
Описание Машинное обучение эффективно используется для автоматизации решения интеллектуальных задач, что позволяет снизить издержки, сократить объем рутинных операций. Методы проведения исследования: теоретические (изучение литературы, обзор существующих методов и моделей анализа) и практическое применение методов машинного обучения для построения модели.
Полученные результаты: Сформулированы критерии релевантности: 1) явное указание, 2) контактная информация, 3) логический вывод из текста 4) логический вывод из числовой информации. С применением различных методов обработки текста: а) TF-IDF, б) word2vec, в) doc2vec построены модели на основе классификаторов: 1) наивный байесовский классификатор, 2) логистическая регрессия, 3) градиентный бустинг над решающими деревьями.
Machine learning is effectively used to automate the solution of intellectual tasks, which allows you to reduce costs, reduce the amount of routine operations. Research methods: theoretical (study of literature, review of existing methods and models of analysis) and practical application of machine learning methods for building a model. The obtained results: Relevance criteria are formulated: 1) explicit indication, 2) contact information, 3) logical conclusion from the text 4) logical conclusion from the numerical information. Using different methods of text processing: a) TF-IDF, b) word2vec, c) doc2vec models based on classifiers are constructed: 1) naive Bayesian classifier; 2) logistic regression; 3) gradient boosting over deciding trees.
 
Дата 2017-06-09T17:24:43Z
2017-06-09T17:24:43Z
2017
 
Тип Students work
 
Идентификатор Булыгин Л. Э. Оценка релевантности текста для географической диверсификации компании : бакалаврская работа / Л. Э. Булыгин ; Национальный исследовательский Томский политехнический университет (ТПУ), Физико-технический институт (ФТИ), Кафедра высшей математики и математической физики (ВММФ) ; науч. рук. М. Е. Семенов. — Томск, 2017.
http://earchive.tpu.ru/handle/11683/39819
 
Язык ru
 
Права Open access (info:eu-repo/semantics/openAccess)
 
Формат application/pdf