Згорткові нейронні мережі для вирішення задач комп’ютерного зору

DOI: 10.31673/2412-4338.2022.020411

  • Зінченко О. В. (Zinchenko O. V.) Державний університет телекомунікацій, м. Київ
  • Звенігородський О. С. (Zvenihorodskyy O. S.) Державний університет телекомунікацій, м. Київ
  • Кисіль Т. М. (Kysil T. M.) Державний університет телекомунікацій, м. Київ

Анотація

В даній статті зроблено огляд основних методів вирішення задач комп’ютерного зору класифікації, сегментації та обробки зображень, які реалізовані в CV-системах. Системи комп’ютерного зору запрограмовані на виконання вузькоспеціалізованих задач, що здатні виявляти об'єкти при ідентифікації, зчитувати серійні номерів, виконувати пошук поверхневих дефектів. При застосуванні методів глибокого навчання в CV-системах значно підвищується їх швидкість обробки на дата-сетах великих розмірів та точність класифікації/сегментації зображень. Системи штучного зору спроможні визначати окремі пікселі за відповідними ознаками при обробці, надають якісний результат по розпізнаванню образів, відновлення зображень, вписування частини зображення. Хоча деякі алгоритми комп’ютерного зору були розроблені для імітації зорове сприйняття, та більша кількість запропонованих методів здатні повноцінно обробляти зображення і визначення на них характерних властивостей.

Область застосування CV-систем надалі буде розширюватися, оскільки потреба в системах штучного інтелекту стрімко зростає. Метою даної статті — наведення структурованого огляд технологій комп'ютерного зору за їх перевагами та недоліками. В роботі узагальнено різновиди CV-систем зі штучним інтелектом за спектром їх застосувань, виділено основні проблематичні напрямки їх дослідження, такі як розпізнавання, ідентифікація та виявлення.

В статті проведено огляд згорткових нейронних мережі (CNN), які успішно застосовуються до аналізу візуальних зображень в глибокому навчанні. Архітектури CNN у деяких випадках перевершують результативність штучних нейронних мереж в задачах класифікації за своєю продуктивністю. На даний час, згорткові нейронні мережі – основний інструмент для класифікації та розпізнавання об'єктів, облич на фотографіях, розпізнавання відео- та аудіо- матеріалів. В даній роботі наведено порівняльний аналіз відомих CNN-моделей: LeNet 5, AlexNet, VGGNet, GoogLeNet, ResNet  та ефективність в CV-системах. Запропоновано підходи до моделювання архітектур згорткових нейронних мереж, які дозволять, в подальшому, вирішити проблему класифікації в задачах для комп'ютерного зору, тим самим підвищуючи їх продуктивність, точність та якість обробки.

Ключові слова: штучний інтелект, комп’ютерний зір, задача класифікації, глибоке навчання, нейронні мережі, згорткові нейронні мережі, розпізнавання образів.

Список використаних джерел

  1. Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks // Communications of the ACM, June 2017,pp.84–90, https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf.
  2. Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich, Going Deeper with Convolutions // Computer Vision Foundation, 2015, https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf 1-9 pages.
  3. Gaudenz Boesch, VGG Very Deep Convolutional Networks (VGGNet) – What you need to know // Read more at: https://viso.ai/deep-learning/vgg-very-deep-convolutional-networks/
  4. Jon Krohn, Gnand Beyleveld, Aglae Bassens // Deep Learning Illustrated: A Visual, Interactive Guide to Artificial Intelligence, Pearson Education, Inc, 2020.
  5. Kaiming He Xiangyu Zhang Shaoqing Ren Jian Sun, Deep Residual Learning for Image Recognition // https://arxiv.org/pdf/1512.03385.pdf 10 Dec 2015.
  6. LeCun Y., Y. Bengio Convolutional Networks for Images, Speech, and Time-Series, in Arbib, M. A. (Eds), The Handbook of Brain Theory and Neural Networks, 1995.
  7. Linda G. Shapiro, George Stockman, Computer Vision // Pearson; 1st edition (February 2, 2001) 608 pages.
  8. Théodore Bluche, São Paulo Deep Neural Networks – Applications in Handwriting Recognition Meetup - 9 Mar. 2017.
  9. Zahra Elhamraoui, Introduction to convolutional neural network, https://medium.com/analytics-vidhya/introduction-to-convolutional-neural-network-6942c189a723, May 28, 2020.
  10. Ковальчук А.М., Марчук Г.В, Марчук Д.К. Застосування згорткової нейронної мережі для розпізнавання рукописних символів // зб. наук. пр. «Вчені записки ТНУ імені В.І. Вернадського». Серія: технічні науки, Том 30 (69) Ч. 1 № 4 2019, с. 68-73.
  11. Тимчишин Р.М., Волков О.Є., Господарчук О.Ю., Богачук Ю.П., Сучасні підходи до розв’язання задач комп’ютерного зору // зб. наук. пр. «Control systems and computers», УСиМ, 2018, № 6, с. 46-73.
Номер
Розділ
Статті