https://oldena.lpnu.ua/handle/ntb/56354
Title: | Методи пошуку та розпізнавання об’єктів у відеозображеннях на мобільній платформі IOS в реальному часі |
Other Titles: | Methods for real-time object searching and recognizing in video images on IOS mobile platform |
Authors: | Кушнір, Д. О. Парамуд, Я. С. Kushnir, D. Paramud, Y. |
Affiliation: | Національний університет “Львівська політехніка” Lviv Polytechnic National University |
Bibliographic description (Ukraine): | Кушнір Д. О. Методи пошуку та розпізнавання об’єктів у відеозображеннях на мобільній платформі IOS в реальному часі / Д. О. Кушнір, Я. С. Парамуд // Комп’ютерні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — Том 1. — № 1. — С. 24–34. |
Bibliographic description (International): | Kushnir D. Methods for real-time object searching and recognizing in video images on IOS mobile platform / D. Kushnir, Y. Paramud // Kompiuterni systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2019. — Vol 1. — No 1. — P. 24–34. |
Is part of: | Комп’ютерні системи та мережі, 1 (1), 2019 |
Journal/Collection: | Комп’ютерні системи та мережі |
Issue: | 1 |
Volume: | 1 |
Issue Date: | 1-Mar-2019 |
Publisher: | Видавництво Львівської політехніки Lviv Politechnic Publishing House |
Place of the edition/event: | Львів Lviv |
UDC: | 004.415.2 |
Keywords: | час пошуку об’єктів час розпізнавання об’єктів відеозображення мобільна платформа згорткова нейронна мережа реальний масштаб часу object search time object recognition time video mobile platform convolutional neural network real time |
Number of pages: | 11 |
Page range: | 24-34 |
Start page: | 24 |
End page: | 34 |
Abstract: | Досліджено особливості найпоширеніших методів і систем пошуку та розпізнавання
об’єктів у відеозображеннях. За результатами дослідження показано доцільність побудови засобів
пошуку та розпізнавання для платформи iOS у реальному часі. Запропоновано метод
функціональної адаптації алгоритму пошуку та розпізнавання об’єктів до особливостей
відеозображень, який полягає в опрацюванні відеозображення згладжуючим та мінімізаційним
фільтрами, що забезпечує зменшення часу пошуку та розпізнавання об’єктів. Розроблено базову
структурну схему таких засобів та алгоритм функціонування. Розроблено алгоритмічнопрограмні
засоби для розв’язання завдання на знаходження та оперативне розпізнавання
об’єктів у режимі реального часу мовою Swift під мобільну платформу iOS. Використано
особливості згорткової нейронної мережі з архітектурою YOLOv3 та фреймворку для роботи з
нейронними мережами під мобільні додатки CoreML. Запропоновано метод поліпшення роботи
такої нейронної мережі, який оснований на квантизації вагових коефіцієнтів нейромережі та
забезпечує мінімізацію розміру моделі та часу пошуку її об’єктів. Досліджено значення частоти
оброблення кадрів зображень із використанням запропонованої моделі YOLOv3-KD та моделей
нейронних мереж типу YOLOv3-tiny та YOLOv3-416. Доведено можливість функціонування
запропонованих засобів у режимі реального часу. The features of the most common methods and systems for searching and recognizing objects in video are explored. The research shows the feasibility of building search and recognition tools for the iOS platform in real time. The method of functional adaptation of the algorithm of search and recognition of objects to features of video is offered, which consists in processing of video image by smoothing and minimization filters, which reduces the time of search and recognition of objects. The block diagram and algorithm of system functioning were designed. Developed a program to solve the problem of finding and quickly recognizing objects in real time in Swift language on the iOS mobile platform. A convolutional neural network with YOLOv3 architecture was used along with framework for working with neural networks for mobile CoreML applications. A method of improving the performance of such a neural network is proposed, which is based on the quantization of the neural network weights and minimizes the model size and search time of its objects. The frequencies of image processing using the proposed means and models of neural networks of the type YOLOv3-tiny, YOLOv3-416 and our own model YOLOv3-KD are investigated. The possibility of functioning of the proposed funds in real time is provided. |
URI: | https://ena.lpnu.ua/handle/ntb/56354 |
ISSN: | 2707-2371 |
Copyright owner: | © Національний університет “Львівська політехніка”, 2019 © Кушнір Д. О., Парамуд Я. С., 2019 |
URL for reference material: | https://en.wikipedia.org/wiki/Binary_classification https://en.wikipedia.org/wiki/Support-vector_machine https://en.wikipedia.org/wiki/Artificial_neural_network https://en.wikipedia.org/wiki/Convolutional_neural_network https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e https://en.wikipedia.org/wiki/Keras https://medium.com/ https://patents.google.com/patent/US948940 https://en.wikipedia.org/wiki/Google_Translate |
References (Ukraine): | 1. Wikipedia. Binary classification [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Binary_classification. 2. Wikipedia. Support-vector machine [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Support-vector_machine. 3. Wikipedia. Artificial neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Artificial_neural_network. 4. Wikipedia. Convolutional neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Convolutional_neural_network. 5. Rohith Gandhi. R-CNN, Fast R-CNN, Faster R-CNN, YOLO. Object Detection Algorithms [Elektronnyj resurs] / San-Francisco 2018 – Rezhym dostupu: https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e. 6. Wikipedia. Keras [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Keras. 7. Hao Gao. Understand Single Shot MultiBox Detector (SSD) and Implement It in Pytorch [Elektronnyj resurs] / San-Francisco 2018. Rezhym dostupu: https://medium.com/@smallfishbigsea/understand-ssd-andimplement-your-own-caa3232cd6ad. 8. Juan Garcia, Reza Bakhshandeh. Methods and systems for object recognition. [Elektronnyjresurs] / MenloPark2016-Rezhym dostupu: https://patents.google.com/patent/US948940. 9. Wikipedia. Google Translate [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Google_Translate |
References (International): | 1. Wikipedia. Binary classification [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Binary_classification. 2. Wikipedia. Support-vector machine [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Support-vector_machine. 3. Wikipedia. Artificial neural network [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Artificial_neural_network. 4. Wikipedia. Convolutional neural network [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Convolutional_neural_network. 5. Rohith Gandhi. R-CNN, Fast R-CNN, Faster R-CNN, YOLO. Object Detection Algorithms [Elektronnyj resurs], San-Francisco 2018 – Rezhym dostupu: https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e. 6. Wikipedia. Keras [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Keras. 7. Hao Gao. Understand Single Shot MultiBox Detector (SSD) and Implement It in Pytorch [Elektronnyj resurs], San-Francisco 2018. Rezhym dostupu: https://medium.com/@smallfishbigsea/understand-ssd-andimplement-your-own-caa3232cd6ad. 8. Juan Garcia, Reza Bakhshandeh. Methods and systems for object recognition. [Elektronnyjresurs], MenloPark2016-Rezhym dostupu: https://patents.google.com/patent/US948940. 9. Wikipedia. Google Translate [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Google_Translate |
Content type: | Article |
Appears in Collections: | Комп'ютерні системи та мережі. – 2019. – Том 1, № 1 |
File | Description | Size | Format | |
---|---|---|---|---|
2019v1n1_Kushnir_D-Methods_for_real_time_object_24-34.pdf | 1.65 MB | Adobe PDF | View/Open | |
2019v1n1_Kushnir_D-Methods_for_real_time_object_24-34__COVER.png | 390.9 kB | image/png | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.