Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №22 (364) май 2021 г.

Дата публикации: 02.06.2021

Статья просмотрена: 248 раз

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 22 (364). — С. 34-37. — URL: https://moluch.ru/archive/364/81704/ (дата обращения: 20.04.2024).



Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении.

Ключевые слова: нейронная сеть, распознавание, изображение, масштабирование.

Системы обнаружения малых беспилотных летательных аппаратов (БПЛА) [1] сейчас становятся важными системами безопасности. В таких системах кроме прочих датчиков могут быть применены видеокамеры и средства обработки видео. Для распознавания класса обнаруженного объекта (самолет/дрон/птица и т. д.) все более успешно применяют искусственные нейронные сети [2]. Однако в доступной литературе недостаточно информации по некоторым вопросам, актуальным для построения системы. Например, очень важно знать минимально допустимый размер объекта на изображении, при котором нейронная сеть еще способна правильно распознать этот объект. Поэтому целью данной работы была оценка минимально допустимого размера изображения объекта.

Исследование проводилось для нейронной сети с архитектурой YOLOv3 [3]. Она считается сейчас одной из самых быстрых и мало требовательных к ресурсам, что может облегчить ее использование во встраиваемых применениях. На сайте библиотеки ImageAI [4] существует ее предварительно обученная свободная реализация. Эта реализация обучена распознаванию 80 классов объектов, в том числе airplane (самолет) и bird (птица). Для экспериментов были выбраны несколько исходных изображений самолетов и созданы их масштабированные (уменьшенные) варианты с различными размерами, по 60 вариантов для каждого из исходных изображений. Для генерации таких наборов данных был создан плагин к графическому редактору GIMP. На рис. 1–3 приведены примеры масштабированных изображений.

Изображения из набора A1 с размерами объекта 190, 95, 48 пикселей

Рис. 1. Изображения из набора A1 с размерами объекта 190, 95, 48 пикселей

Изображения из набора A2 с размерами объекта 128, 64, 32 пикселей

Рис. 2. Изображения из набора A2 с размерами объекта 128, 64, 32 пикселей

Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей

Рис. 3. Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей

Нейронная сеть запускалась в облачной среде Google Colab. Результаты обработки этих наборов данных приведены на рис. 4–6.

Результаты распознавания набора A1

Рис. 4. Результаты распознавания набора A1

Результаты распознавания набора A2

Рис. 5. Результаты распознавания набора A2

Результаты распознавания набора A3

Рис. 6. Результаты распознавания набора A3

Видно, что вероятность правильного распознавания > 0,9 обеспечивается только если размер объекта на изображении превышает некоторое минимально допустимое значение порядка 25...40 пикселей (таблица 1).

Таблица 1

Минимальный размер объекта для нейронной сети ImageAI YOLOv3

Набор изображений

Минимальный размер объекта, пикселей

A1

40

A2

35

A3

25

Отсюда можно сделать вывод, что при разработке структуры системы обнаружения БПЛА нужно добиваться того, чтобы видеокамеры и блоки предварительной обработки передавали только такие изображения на вход нейронной сети, в которых обеспечивается не меньший размер объектов. В развитие данной работы предполагается исследовать влияние поворота изображения объекта.

Литература:

1. Макаренко С. И. Противодействие беспилотным летательным аппаратам. — СПб.: Наукоемкие технологии, 2020. — 204 c.

2. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

3. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

4. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

Основные термины (генерируются автоматически): нейронная сеть, изображение, результат распознавания набора, GIMP, допустимый размер, минимальный размер, набор данных, пиксель, правильное распознавание.


Похожие статьи

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Нейронные сети требовательны к размеру и качеству набора данных, на котором они будут

Нейронная сеть для распознавания изображений, пожалуй, самый популярный способ...

Влияние поворота изображения объекта на распознавание...

Ключевые слова: нейронная сеть, распознавание, поворот изображения. Искусственные нейронные сети в настоящее время применяются в самых различных областях, в том числе в системах обеспечения безопасности для распознавания объектов [1]. Нейронная сеть с...

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов текстовых изображений представлена в таблице 1. Исходя из нее, для нашей работы была выбрана многослойная нейронная сеть с обратным распространением ошибки с обучением с учителем. Таблица 1.

Обзор методов распознавания изображений | Статья в сборнике...

Слой состоит из набора ядер и вычисляет свёртку выходного изображения из предыдущего слоя с

Результат данной операции — сложение и масштабирование входных пикселей, ядра можно

Нейронная сеть — это сеть с конечным числом слоев из однотипных элементов...

Влияние контраста и шума на распознавание изображений...

Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно

Рис. 2. Влияние контраста на вероятность правильного распознавания. Из них видно, что

Были созданы три набора данных по 60 изображений с различным уровнем шума.

Распознавание английского текста сверточной нейронной сетью

Размер каждого изображения составляет пикселя. Каждый пиксель кодируется числом в интервале , где 0

Первый слой использованной нейронной сети – сверточный. Ему на вход подается изображение размером пикселя, к которому применяется свертка размером .

Распознавание объектов на основе видеосигнала, полученного...

Распознавание образов окружающих объектов внешней среды.

При ограниченных вычислительных ресурсах важно выбрать допустимый размер видеоизображения в пикселях, а также для хранения в памяти организовать структуру данных, которая бы обеспечивала...

Нейронная сеть, распознающая рукописные цифры на языке...

Чтобы обучить нейронную сеть используются два файла из базы данных MNIST, которая состоит из заранее подготовленных примеров изображений, на основе которых проводится обучение и тестирование систем. База данных была создана после переработки...

Использование кодеков в подготовке исходных данных для...

Смешение и интеграция данныхнабор техник, позволяющих интегрировать разнородные данные из разнообразных источников для

3 Подготовка исходных данных для машинного обучения. Для получения решения определенной задачи искусственной нейронной сетью ее...

Похожие статьи

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Нейронные сети требовательны к размеру и качеству набора данных, на котором они будут

Нейронная сеть для распознавания изображений, пожалуй, самый популярный способ...

Влияние поворота изображения объекта на распознавание...

Ключевые слова: нейронная сеть, распознавание, поворот изображения. Искусственные нейронные сети в настоящее время применяются в самых различных областях, в том числе в системах обеспечения безопасности для распознавания объектов [1]. Нейронная сеть с...

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов текстовых изображений представлена в таблице 1. Исходя из нее, для нашей работы была выбрана многослойная нейронная сеть с обратным распространением ошибки с обучением с учителем. Таблица 1.

Обзор методов распознавания изображений | Статья в сборнике...

Слой состоит из набора ядер и вычисляет свёртку выходного изображения из предыдущего слоя с

Результат данной операции — сложение и масштабирование входных пикселей, ядра можно

Нейронная сеть — это сеть с конечным числом слоев из однотипных элементов...

Влияние контраста и шума на распознавание изображений...

Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно

Рис. 2. Влияние контраста на вероятность правильного распознавания. Из них видно, что

Были созданы три набора данных по 60 изображений с различным уровнем шума.

Распознавание английского текста сверточной нейронной сетью

Размер каждого изображения составляет пикселя. Каждый пиксель кодируется числом в интервале , где 0

Первый слой использованной нейронной сети – сверточный. Ему на вход подается изображение размером пикселя, к которому применяется свертка размером .

Распознавание объектов на основе видеосигнала, полученного...

Распознавание образов окружающих объектов внешней среды.

При ограниченных вычислительных ресурсах важно выбрать допустимый размер видеоизображения в пикселях, а также для хранения в памяти организовать структуру данных, которая бы обеспечивала...

Нейронная сеть, распознающая рукописные цифры на языке...

Чтобы обучить нейронную сеть используются два файла из базы данных MNIST, которая состоит из заранее подготовленных примеров изображений, на основе которых проводится обучение и тестирование систем. База данных была создана после переработки...

Использование кодеков в подготовке исходных данных для...

Смешение и интеграция данныхнабор техник, позволяющих интегрировать разнородные данные из разнообразных источников для

3 Подготовка исходных данных для машинного обучения. Для получения решения определенной задачи искусственной нейронной сетью ее...

Задать вопрос