Dandji, Ayawo Désiré (2025). Descripteurs de textures d'images avec invariance à la rotation et approche multi-échelles pour la recherche d'images par le contenu. Mémoire. Gatineau, Université du Québec en Outouais, Département d'informatique et d'ingénierie, 65 p.
Prévisualisation |
PDF
Télécharger (39MB) | Prévisualisation |
Résumé
À l'ère du numérique, la quantité croissante d'images produites et diffusées engendre des bases de données visuelles de plus en plus volumineuses, rendant nécessaire le développement de méthodes efficaces pour leur gestion et leur exploration. Dans ce contexte, les systèmes de recherche d'images par le contenu (CBIR) reposent sur l'extraction de caractéristiques visuelles pertinentes permettant d'identifier, comparer et retrouver des images similaires. Parmi ces caractéristiques, la texture joue un rôle fondamental, notamment dans les domaines où l'analyse visuelle est primordiale. Toutefois, la robustesse des descripteurs de texture peut être affectée par des variations géométriques des images, notamment les rotations. Ce mémoire propose le développement d'une approche hybride d'extraction de caractéristiques texturales, combinant les motifs binaires locaux (RI-LBP), réputés pour leur invariance à la rotation, avec la transformée en ondelettes stationnaires (SWT), permettant une analyse multi-échelle tout en préservant la structure spatiale des images. Cette combinaison vise à produire des descripteurs compacts, discriminants et robustes à des variations rotationnelles, adaptés aux systèmes CBIR conventionnels. En parallèle, une approche basée sur le transfer learning, exploitant les couches intermédiaires de réseaux de neurones convolutionnels pré-entraînés (VGG16 et ResNet50), a été mise en oeuvre afin d'extraire automatiquement des représentations hiérarchiques à partir d'images soumises à différentes orientations, puis d'appliquer une agrégation multi-angle. Une analyse comparative a été menée entre cette approche profonde et la méthode hybride proposée. Les expérimentations ont été réalisées sur trois bases de données de référence en analyse de textures, VisTex, Outex et Kylberg, en tenant compte de différents formats d'image (niveaux de gris, RGB) et de paramètres clés (nombre de voisins, rayons, niveaux de décomposition, activations, etc.). Les résultats obtenus montrent que l'approche hybride LBP+SWT offre un bon compromis entre performance, compacité et efficacité computationnelle, la rendant particulièrement adaptée aux contextes contraints en ressources. De son côté, l'approche par transfer learning avec agrégation multi-angle atteint des taux de rappel supérieurs, au prix d'un coût en calcul et en mémoire nettement plus élevé. Ces résultats illustrent des compromis méthodologiques importants et ouvrent la voie à des stratégies de fusion ou d'adaptation selon les exigences des applications.
In the digital age, the increasing volume of images being produced and shared is leading to ever-growing visual databases, making it necessary to develop efficient methods for their management and exploration. In this context, Content-Based Image Retrieval (CBIR) systems rely on the extraction of relevant visual features to identify, compare, and retrieve similar images. Among these features, texture plays a fundamental role, particularly in domains where visual analysis is essential. However, the robustness of texture descriptors can be affected by geometric variations in images, notably rotations. This thesis proposes the development of a hybrid approach for texture feature extraction, combining rotation-invariant Local Binary Patterns (RI-LBP), known for their robustness to rotation, with the Stationary Wavelet Transform (SWT), which enables multi-scale analysis while preserving the spatial structure of images. This combination aims to produce compact, discriminative, and rotation-robust descriptors suitable for conventional CBIR systems. In parallel, a transfer leaming-based approach was implemented, leveraging the intermediate layers of pre-trained convolutional neural networks (VGG16 and ResNet50) to automatically extract hierarchical representations from images subjected to different orientations, followed by a multi-angle aggregation strategy. A comparative analysis was conducted between this deep approach and the proposed hybrid method. Experiments were carried out on three benchmark texture databases VisTex, Outex, and Kylberg considering different image formats (grayscale, RGB) and key parameters (number of neighbors, radii, decomposition levels, activations, etc.). The results show that the hybrid LBP+SWT approach offers a good trade-off between performance, compactness, and computational efficiency, making it particularly well-suited for resource-constrained scenarios. On the other hand, the transfer leaming approach with multi-angle aggregation achieves higher recall rates, at the cost of significantly higher computational and memory demands. These results highlight important methodological trade-offs and pave the way for fusion or adaptation strategies depending on application requirements.
| Type de document: | Thèse (Mémoire) |
|---|---|
| Directeur de mémoire/thèse: | Baaziz, Nadia |
| Départements et école, unités de recherche et services: | Informatique et ingénierie |
| Date de dépôt: | 22 déc. 2025 18:51 |
| Dernière modification: | 22 déc. 2025 18:51 |
| URI: | https://di.uqo.ca/id/eprint/1877 |
Gestion Actions (Identification requise)
![]() |
Dernière vérification avant le dépôt |

Statistiques de téléchargement
Statistiques de téléchargement