Ouyed, Ouiza (2018). Action recognition in videos using geometrical representation and kernel logistic regression with feature relevance. Thèse. Gatineau, Université du Québec en Outaouais, Département d'informatique et d'ingénierie, 137 p.
Prévisualisation |
PDF
Télécharger (3MB) | Prévisualisation |
Résumé
La reconnaissance d’activités humaines en vidéos est un problème très important en vision par ordinateur. Le défi principal dans ce domaine est le développement d’algorithmes capables d’analyser automatiquement les vidéos pour reconnaître et interpréter les activités générées. Récemment, les méthodes statistiques ont montré leur efficacité pour classer et prédire des activités à différents niveaux de complexité (ex. gestes, actions, interactions). Cependant, ces méthodes se basent souvent sur des représentations d’activités utilisant des vecteurs de caractéristiques à très haute dimensions, noyant ainsi dans le bruit l’information utile pour discriminer les activités. Notons également que les bases de données d’activités sont parfois composées de peu de données, ce qui peut entraîner un problème de sur-apprentissage lors de l’entrainement des modèles de classification (c-à-d., capacité de généralisation limitée). Dans cette thèse, nous abordons ces problèmes avec de nouvelles approches statistiques que nous avons appliquées pour la reconnaissance d’actions et les interactions entre personnes. En premier temps, nous avons proposé un nouveau modèle de classification d’actions (FRMKLR), basé sur la régression logistique multinomiale à noyaux et intégrant la pertinence de caractéristiques sous forme de poids dans la fonction du noyau. Ce modèle permet de réduire l’effet des caractéristiques indésirables en inhibant leurs poids durant l’apprentissage. Nous avons appliqué avec succès notre modèle pour la reconnaissance d’actions simples d’individus (ex. marcher, courir, tomber, etc.), en se basant sur une nouvelle description géométrique de ces dernières basée sur la forme contextuelle spatio-temporelles des silhouettes. Dans un second temps, nous avons généralisé notre modèle de classification FR-MKLR en intégrant la pertinence de groupes de caractéristiques. Le nouveau modèle, baptisé GFR-MKLR, permet de rechercher la pertinence de groupes de caractéristiques contribuant comme des facteurs latents à part entière pour la discrimination de classes. La nécessité de développer un tel modèle vient du fait que pour les activités humaines, en particulier les interactions entre deux individus,
plusieurs caractéristiques de mouvement peuvent être regroupées en fonction des parties du corps humain les ayant générées via des gestes (ex. mains, jambes, tête, etc.). Nous avons appliqué avec succès notre modèle pour la reconnaissance d’interations entre deux personnes (ex. saluer, frapper, etc.). Nous avons testé de manière extensive nos approches FR/GFRMKLR sur différents ensembles de données standard d’actions et d’interactions entre individus.
Les résultats obtenus ont démontré les capacités de nos approches et leur performance par rapport aux travaux récents de la littérature.
Type de document: | Thèse (Thèse) |
---|---|
Directeur de mémoire/thèse: | Allili, Mohand Said |
Départements et école, unités de recherche et services: | Informatique et ingénierie |
Date de dépôt: | 07 févr. 2019 20:28 |
Dernière modification: | 07 févr. 2019 20:28 |
URI: | https://di.uqo.ca/id/eprint/1047 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |