Dépôt institutionnel de l'UQO
RECHERCHER

Classification de documents multimédias en combinant le texte et l'image : approche par le modèle LDA et l'apprentissage profond

Téléchargements

Téléchargements par mois depuis la dernière année

Plus de statistiques...

Krichen, Sabri (2019). Classification de documents multimédias en combinant le texte et l'image : approche par le modèle LDA et l'apprentissage profond. Mémoire. Gatineau, Université du Québec en Outaouais, Département d'informatique et d'ingénierie, 80 p.

[img]
Prévisualisation
PDF
Télécharger (2MB) | Prévisualisation

Résumé

La classification de documents multimédias (ex. pages Web) a été longtemps basée sur les algorithmes de classification de texte tels que les machines à vecteurs de support et la naïve bayésienne. Bien que ces méthodes aient eu beaucoup de succès, la majorité d'entre elles sont axées sur l'analyse des occurrences de mots sans tenir compte de l'ordre de leur apparition ni du rôle syntaxique qu'ils jouent, ce qui accentue l'écart sémantique. Outre le contenu textuel de documents multimédias, le contenu visuel (ex. images et vidéos) peut fournir également de nombreuses informations précieuses qui peuvent faciliter la classification thématique de documents. Peu sont les travaux qui se concentrent sur la classification automatique de documents en se basant sur les caractéristiques textuelles et visuelles conjointement. Considérant ces limitations, nous proposons une solution basée sur l'apprentissage automatique pour la modélisation conjointe de ces deux modalités (texte et images) pour la classification de documents multimédias. Ainsi, nous exploitons les derniers développements de l'apprentissage profond pour extraire l'information visuelle de haut niveau des images contenu dans les documents. Nous proposons par la suite une approche probabiliste basée sur l'allocation de Dirichlet latente (LDA) pour combiner l'information textuelle et visuelle pour une classification thématique de documents multimédias. Les résultats obtenus par notre méthode ont montré une bonne performance en comparaison à des méthodes de l'état de l'art.

Type de document: Thèse (Mémoire)
Directeur de mémoire/thèse: Allili, Mohand Said
Départements et école, unités de recherche et services: Informatique et ingénierie
Date de dépôt: 10 févr. 2020 15:45
Dernière modification: 10 févr. 2020 15:45
URI: http://di.uqo.ca/id/eprint/1145

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt