Просмотреть запись

Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация

Электронный научный архив УРФУ

Информация об архиве | Просмотр оригинала
 
 
Поле Значение
 
Заглавие Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация
Using diffusion models to augment data and improve the quality of image segmentation (using the example of the Stable Diffusion model and the Caltech-UCSD Birds-200-2011 data set)
 
Автор Морий, С. М.
Moriy, S. M.
 
Создатель Ронкин, М. В.
Ronkin, M. V.
УрФУ. Институт радиоэлектроники и информационных технологий-РТФ
Кафедра информационных технологий и систем управления
 
Тематика МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
КОМПЬЮТЕРНОЕ ЗРЕНИЕ
СЕМАНТИЧЕСКАЯ СЕГМЕНТАЦИЯ
АУГМЕНТАЦИЯ ДАННЫХ
СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ
ДИФФУЗИОННЫЕ МОДЕЛИ
MASTER'S THESIS
COMPUTER VISION
SEMANTIC SEGMENTATION
DATA AUGMENTATION
CONVOLUTIONAL NEURAL NETWORKS
DIFFUSION MODELS
 
Описание Объект исследования: процесс аугментации изображений для решения задачи сегментации. Предмет исследования: методы аугментации и машинного обучения, с помощью которых осуществляется сегментация изображений. Цель работы: исследование эффективности генеративной аугментации изображений, выполненной с помощью диффузионной модели Stable Diffusion на примере задачи семантической сегментации. В процессе исследования проводились: рассмотрение основных подходов сегментации изображений и методов аугментации данных, разработка и реализация экспериментов для оценки эффективности генеративной аугментации изображений. В работе продемонстрирована эффективность подхода аугментации изображений, реализованного за счет расширения части исходного датасета путем генерирования новых данных с помощью диффузионной модели. Область практического применения: предложенный подход может быть использован для улучшения качества работы моделей семантической сегментации изображений в условиях ограниченного количества исходных данных, дефицита размеченных данных или дисбаланса данных.
Object of study: the process of image augmentation to solve the segmentation problem. Subject of research: augmentation and machine learning methods used for image segmentation. Purpose of the work: to study the effectiveness of generative image augmentation performed using the Stable Diffusion model using the example of a semantic segmentation task. During the research process, the following was carried out: consideration of the main approaches to image segmentation and data augmentation methods, development and implementation of experiments to evaluate the effectiveness of generative image augmentation. The work demonstrates the effectiveness of the image augmentation approach, implemented by expanding part of the original dataset by generating new data using a diffusion model. Area of practical application: the proposed approach can be used to improve the quality of work of semantic image segmentation models in conditions of a limited amount of source data, a shortage of labeled data, or data imbalance.
 
Дата 2024-01-12T10:58:43Z
2024-01-12T10:58:43Z
2023
 
Тип Master's thesis
Published version (info:eu-repo/semantics/publishedVersion)
Master thesis (info:eu-repo/semantics/masterThesis)
 
Идентификатор Морий, С. М. Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация / С. М. Морий ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2023. — 61 с. — Библиогр.: с. 56-61 (38 назв.).
http://elar.urfu.ru/handle/10995/129161
 
Язык ru
 
Права Предоставлено автором на условиях простой неисключительной лицензии
http://elar.urfu.ru/handle/10995/31613
 
Формат application/pdf