Camelo, Icaro (2024). Convolutional neural network-based object detection with limited embedded computational resources. Mémoire. Gatineau, Université du Québec en Outaouais, Département d'informatique et d'ingénierie, 73 p.
Prévisualisation |
PDF
Télécharger (4MB) | Prévisualisation |
Résumé
Les réseaux de neurones convolutifs ont été largement utilisés dans diverses applications telles que la reconnaissance d’images et de la parole, le traitement du langage naturel et les voitures autonomes. Cependant, le déploiement de modèles CNN vastes et complexes sur des appareils aux ressources limitées tels que les smartphones et les appareils Internet des objets (IoT) n’est pas réalisable en raison de leur mémoire, de leur stockage et de leur puissance de calcul limitées. Les CNN compacts, dont les modèles sont plus petits et nécessitent moins de ressources informatiques, sont apparus comme une solution à ce défi. De plus, les CNN compacts sont moins sujets au surajustement, un problème courant avec les CNN volumineux et complexes lorsque l’on travaille avec de petits ensembles de données, et peuvent améliorer l’interprétabilité des modèles. Les CNN sont particulièrement utiles en vision par ordinateur, un domaine qui étudie comment comprendre et identifier les caractéristiques des images et des vidéos, grâce aux progrès de la conception des algorithmes, à la croissance de la puissance de calcul et à la disponibilité des données. Les CNN sont largement utilisés dans les tâches de vision par ordinateur telles que la classification d’images, la détection d’objets et la segmentation sémantique. Grâce aux améliorations des architectures CNN, elles peuvent entraîner des modèles avec des milliards de paramètres, même dans des appareils aux ressources limitées, ce qui en fait une option solide pour l’utilisation dans les images 2D et 3D. L’objectif de cette recherche est d’implémenter et d’évaluer les performances de différents algorithmes CNN compacts sur la plateforme matérielle NVIDIA Jetson Xavier NX. L’évaluation des algorithmes CNN compacts sera menée à l’aide de mesures telles que la taille du modèle, le coût de calcul, le F-score, la précision et le rappel. Les résultats de cette recherche fourniront une comparaison complète des compromis entre AlexNet, ShuffleNet V2, SqueezeNet, ResNet50 et MobileNet V2. Comme prévu, les modèles pré-entraînés ont obtenu de bons résultats par rapport à ceux entraînés à partir de zéro sur la plateforme Jetson Xavier, en utilisant le modèle x de base entraîné sur ImageNet. Le modèle le plus performant sur l’ensemble de données CIFAR-10 est le ShuffleNet pré-entraîné et l’AlexNet pré-entraîné sur l’ensemble de données STL-10, tous deux entraînés pendant 30 époques. Sur l’ensemble de données OrganMNIST {A,C,S} le AlexNet pré-entraîné et ensuite entraînés pendant 100 époques est le plus performant. Il convient de noter que le Jetson Xavier NX est efficace en termes d’utilisation des ressources, utilisant près de 100% du GPU et de la mémoire RAM. Les principales limitations rencontrées lors de l’entraînement des CNN sur la carte NVIDIA Xavier NX sont dues aux ressources mémoire limitées.
Type de document: | Thèse (Mémoire) |
---|---|
Directeur de mémoire/thèse: | Cretu, Ana-Maria |
Départements et école, unités de recherche et services: | Informatique et ingénierie |
Date de dépôt: | 03 oct. 2024 19:42 |
Dernière modification: | 03 oct. 2024 19:42 |
URI: | https://di.uqo.ca/id/eprint/1683 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |