Метод и программный комплекс расширения графических наборов данных при помощи глубокого обучения с подкреплением

Tatyana Sergeevna Evdokimova

Abstract


Аннотация—в статье описан метод расширения графических наборов данных при помощи глубокого обучения с подкреплением, позволяющий подбирать наилучшие преобразования, накладываемые на изображения из обучающего набора данных, что позволяет сократить время обучения и повысить точность распознавания классификатора. Описан каждый из этапов метода: формирование состояния – определение описания изображений посредство цветовых, контурных и текстурных свойств, выбор преобразований (действий) на основании эпсилон-жадной стратегии, обучение нейросетевого классификатора, вычисление вознаграждения агента на основании параметров обучения-точность и функция потерь, сохранение результатов обучения в буфер воспроизведения опыта и обновление модели агента. Также в статье описана структура программного комплекса, позволяющая управлять настройками метода и нейросетевого классификатора, состоящий из трех основных модулей – загрузки данных, настройки параметров и отображение результатов обучения моделей.


Full Text:

PDF (Russian)

References


Т С. Евдокимова Влияние методов расширения наборов данных на качество обучения нейросетевых моделей. Адаптивный подход расширения наборов данных // Инженерный вестник Дона. 2024. № 8(116). С. 282-290.

Nakamura T., Kobayashi M., Motoi N. Path Planning for Mobile Robot Considering Turnabouts on Narrow Road by Deep Q-Network // IEEE Access. 2023. Vol. 11. pp. 19111-19121. – DOI 10.1109/access.2023.3247730.

M. Sewak, Deep q network (dqn), double dqn, and dueling dqn, in DeepReinforcement Learning. Springer, 2019, pp. 95–108.

Черешнев В.О., Фролов С.В., Проскурин С.Г. Построение структурных ОКТ изображений на основе гистограммы распределения интенсивности пикселей// IX Международная конференция по фотонике и информационной оптике: Сборник научных трудов, Москва, 29–31 января 2020 года. – Москва: Национальный исследовательский ядерный университет "МИФИ", 2020. С. 631-632.

Голиков Н.С. Применение локальных бинарных шаблонов в задаче распознавания эмоций // Вестник науки №5 (62) том 4. С. 1191 - 1199. 2023 г.

Ярошевич П.В., Богуш П.Р. Алгоритм классификации изображений парковочных мест автостоянки на основе гистограмм ориентированных градиентов и метода опорных векторов / // Компьютерная оптика. 2017. Т. 41, № 1. С. 110-117. – DOI 10.18287/2412-6179-2017-41-1-110-117.

Чесноков С.Е. Эволюционные стратегии в машинном обучении // Труды Поволжского государственного технологического университета. Серия: Технологическая. 2024. № 12. С. 42-51

Mao A, Mohri M, Zhong Y Cross-entropy loss functions: Theoretical analysis and applications. arXiv preprint arXiv:2304.07288.https://doi.org/10.48550/arXiv.2304.07288

Дубенко, Ю.В. (2022) Метод повторного использования и обмена опытом при коллективном взаимодействии интеллектуальных агентов // Вестник Воронежского государственного технического университета, 1, 62–72, https://doi.org/10.36622/vstu.2022.18.1.007

Schaul T, Quan J, Antonoglou I, Silver D. 2015. Prioritized experience replay. ArXiv DOI 10.48550/arXiv.1511.05952


Refbacks

  • There are currently no refbacks.


Abava  Кибербезопасность ИБП для ЦОД СНЭ

ISSN: 2307-8162