Projects and contracts Modèles d’aide à la prise de décision basés sur l’intelligence artificielle et la théorie de l’information
L’objectif est de développer des modèles basés sur l’intelligence artificielle permettant de construire des représentations pertinentes pour faciliter la tâche d’adressage commercial, représentations dynamiques qui s’adaptent à l’étape de l’adressage commercial et qui prennent en compte, idéalement en temps réel, le retour d’expérience pendant les prospections commerciales. Pour y parvenir, nous allons nous focaliser sur l’extraction de l’information, sur sa sélection et son filtrage, sur la représentation des informations extraites à différents niveaux et ainsi sur la prise en compte du retour des clients, objectifs scientifiques qui sont interconnectés et parfois non disjoints.
Concernant l’extraction d’informations à partir de documents, un premier travail consistera à rechercher des représentations sous-jacentes pertinentes qui permettent une adaptation rapide tout en autorisant un apprentissage de qualité pour intégrer les documents spécifiques aux marchés visés. Par ailleurs, la taille et la complexité de la représentation sont des éléments limitants. C’est pourquoi des représentations selon des graphes de connaissance pourraient se révéler suffisamment souples tout en garantissant une structuration suffisante.
Concernant la sélection des informations pertinentes, une première phase sera de développer des métriques de pertinence en accord avec l’adressage commercial, notamment basées sur la théorie de l’information, en intégrant le requêtage sur les représentations élaborées auparavant. Naturellement, ces métriques doivent être calculables rapidement et avec une précision suffisante, ce qui dépendra du format et de la quantité de données. Plusieurs méthodes novatrices seront testées. Il sera notamment intéressant de faire appel à des modules d’attention à la base des modèles massifs de langage et à des représentations des données contextualisées, en combinant le mécanisme d’attention et la divergence de Kullback Leibler pour des problématiques de codage de l’information dans des systèmes de communication.
Concernant la filtration des informations et la combinaison des métriques développées précédemment, deux approches sont envisagées à ce stade. La première portera sur l’application des théories de Hodge pour les structures en graphes ou en complexes simpliciaux pour les comparaisons par paire, par triplés ou plus. La seconde approche portera sur la décomposition de l’information partielle (PID) qui permet de saisir des synergies entre différents éléments comme cela a été relevé pour l’activité cérébrale.
Concernant la visualisation, différentes interfaces seront testées pour cibler au mieux les besoins. Un effort particulier sera fourni sur les visuels en réseaux ou cartographiques afin de profiter pleinement des capacités de compréhension rapide de l’œil. En plus de la disposition des informations extraites, les différentes caractéristiques visuelles (taille, couleur, forme, …) seront à comparer pour porter les différentes informations pertinentes.