Données non structurées

Données non structurées

L’exploitation de jeux de données hétérogènes, ou données non-structurées, représente un défi important de la recherche en traitement de données massives. En effet, différentes données peuvent se présenter sous plus d’une modalité, ce qui nécessite un modèle complexe de fusion de données.

Le CRDM participe activement à des projets de recherche touchant des enjeux importants en données non ou partiellement structurées :

  • Le développement d’un modèle multimodal, un modèle de fusion de données qui permet d’exploiter, par exemple, un jeu de données d’images accompagné d’un jeu de données textuelles, correspondant aux descriptions textuelles de ces images.
  • Les approches utilisant l'apprentissage automatique (Machine Learning, en anglais), notamment l'apprentissage par réseaux profonds qui représentent l’état de l’art en techniques d’apprentissage de données très massives.

Donnees__P