Comment l’IA transforme les études de marché

market research

Depuis le lancement de ChatGPT, en novembre 2022, l’IA générative a pris d’assaut le monde (des insights). C’est le sujet le plus discuté parmi les professionnels des insights : 93 % des chercheurs y voient une opportunité pour le secteur. De l’appui à la recherche documentaire à la génération de questions d’enquête, en passant par la modération d’ insights communities et l’analyse de données complexes, les cas d’utilisation sont infinis et adoptés avec enthousiasme par notre métier. Mais que nous réserve l’avenir ? Dans cet article, Annelies Verhaeghe partage son point de vue sur l’avenir de l’IA dans le secteur des études de marché.

Les données synthétiques sont incontournables

L’essor de l’IA générative s’est également accompagné de celui des données synthétiques. Ces données sont générées artificiellement par des techniques d’apprentissage automatique, au lieu d’être observées et collectées à partir de sources réelles. Un exemple ? Pour créer des personas marketing, les chercheurs entraînent des modèles d’IA en utilisant de nombreuses données Internet ou des données de recherche existantes. Les progrès des outils d’IA générative rendent la génération de données synthétiques plus accessible, au point qu’elle fera partie intégrante de tout projet de recherche. Nous ne sommes pas loin d’un avenir où chaque étude quantitative comprendra un pourcentage de données synthétiques. Cela permettra aux chercheurs de comparer les résultats analytiques entre les données humaines et les données générées synthétiquement, d’en tirer des enseignements et d’améliorer leurs méthodologies.

Travailler avec des données synthétiques présente de nombreux avantages. Il est, avant tout, possible de générer des résultats à faible coût et à très grande vitesse. Vous n’avez pas de frais de panel et, avec les bonnes instructions, vous pouvez obtenir ce que vous voulez du système, souvent en quelques secondes. Deuxièmement, lorsque vous effectuez des recherches autour d’un profil de niche, vous reléguez au passé la tâche ardue de recruter des personnes difficiles à trouver. Vous pouvez, en effet, facilement inclure des profils synthétiques pour compléter votre échantillon, ce qui simplifie considérablement le processus. Enfin, contrairement aux études menées auprès de consommateurs réels, vous n’avez pas à vous préoccuper des questions de confidentialité ou de protection de la propriété intellectuelle.

La qualité des données synthétiques dépend évidemment de la qualité du modèle et des ensembles sous-jacents de données. Des étapes de vérification supplémentaires sont donc nécessaires pour garantir la fiabilité et la validité. Mais s’appuyer sur des données synthétiques présente aussi d’autres risques. Une première question essentielle se pose : peut-on se fier aux données ? Lessources de production de l’IA ne sont pas claires, ce qui soulève des questions sur la propriété des données et sur les opinions représentées. Deuxièmement, si la propriété des données n’est pas claire, à qui incombe la responsabilité finale des décisions prises à partir des données générées par l’IA ? Prenons l’exemple du lancement d’un produit décidé sur la base de données d’IA, mais qui se solde par un échec. Qui en est réellement responsable ? Troisièmement, le manque de données historiques et le fait que les modèles ne tiennent pas compte de l’actualité ou des tendances de consommation parce que leurs données d’entrée sont limitées. Pensez à ChatGPT, qui a longtemps été limité aux données antérieures à septembre 2021. Tout se résume à l’accès à des données d’entraînement de haute qualité et représentant des personnes réelles.

Nous avons besoin de conseils sur la manière de traiter les données synthétiques dans notre secteur. Je pense que ce n’est qu’une question de temps avant que des lignes directrices et des normes claires soient élaborées, par exemple sur le pourcentage de données synthétiques que nous sommes autorisés à utiliser dans notre échantillon. En effet, on n’obtient pas une image complète en s’appuyant à 100 % sur des données générées artificiellement. Nous avons fait le test avec des données qualitatives issues d’une communauté d’insights en ligne où nous avons interrogé les participants sur leur perception de la marque Land Rover. Nous avons fait de même avec des données synthétiques et utilisé un système d’intelligence artificielle pour visualiser les résultats. Dans les deux cas, le système a représenté la marque par un lion, mais avec un positionnement très différent. On peut se demander si les données synthétiques montrent le positionnement de Land Rover tel qu’il est perçu par les consommateurs ou celui souhaité pour la marque.

afb ai in research artikel

Cet exemple montre que la recherche primaire reste essentielle pour compléter les données synthétiques et orienter les décisions commerciales. L’intelligence des modèles d’IA dépend étroitement de la qualité des données dont ils sont alimentés. Étant donné que beaucoup utiliseront des algorithmes formés sur les mêmes données, les données primaires de haute qualité deviendront le véritable facteur de différenciation.

Stimuler l’activation des insights

Aujourd’hui, de nombreux professionnels de l’insight sont bombardés d’une panoplie d’outils d’IA gratuits et sont convaincus que cela accentuera le niveau de banalisation de notre secteur et la capacité de ses acteurs à faire eux-mêmes les choses. Je suis convaincue que la véritable valeur des modèles d’IA réside dans leur rôle d’outils d’activation, qui rapprochent de grands groupes de parties prenantes internes et les personnes qui comptent pour votre marque. Il suffit de penser à la façon dont les modèles peuvent être entraînés à partir de vos propres données primaires pour créer des personas adaptées à votre marque et à votre catégorie. Plutôt que lire de longs rapports, vos parties prenantes peuvent rapidement dialoguer avec l’une des personas pour se plonger dans leur univers et obtenir des réponses à leurs questions les plus brûlantes. 

Entraîner les modèles d’IA sur des données propriétaires

L’entraînement de modèles d’IA sur les données primaires des marques est en passe de devenir l’arme secrète du futur. Ces modèles peuvent être affinés pour répondre aux défis et opportunités spécifiques d’une organisation, ce qui permet d’obtenir des insights beaucoup plus précis et adaptés. Chez Human8, nous expérimentons également l’entraînement de notre propre assistant de recherche IA sur les données des insight communities pour différents cas d’utilisation. Pensez à l’identification des thèmes clés dans les conversations, à l’identification des insights, ainsi qu’à la détection des valeurs aberrantes. Nous attachons, bien sûr, une grande importance à la confidentialité des données, afin que le contenu reste dans les limites d’un projet client.

Un grand pouvoir s’accompagne toutefois d’une responsabilité aussi lourde. L’entraînement de ces modèles induit une grande responsabilité en matière de prise de décision éthique. Sans une certaine discipline, ces systèmes peuvent, par inadvertance, perpétuer les préjugés de la société. Il est donc essentiel de disposer d’ensembles de données diversifiés et représentatifs, ainsi que d’une surveillance continue pour réduire les biais potentiels. Il est important de pouvoir expliquer les décisions que vous prenez et de faire preuve de transparence à leur sujet. Vous pouvez ainsi délibérément choisir de donner plus de poids aux voix des groupes minoritaires lors de l’entraînement de votre modèle d’IA, à condition d’avoir des raisons valables de le faire et de divulguer cette approche. Cette transparence est cruciale et garantit l’intégrité de vos décisions commerciales.

L’IA suscite à juste titre beaucoup d’enthousiasme dans le secteur de la recherche, mais la question que vous devez vous poser n’est pas « Comment puis-je utiliser cette technologie ? », mais « Quel besoin résout-elle ? ». Déployer la technologie pour le plaisir de la technologie n’est pas un modèle d’entreprise ; apporter une réponse aux besoins de vos clients de manière intelligente avec une proposition pertinente l’est.

Data & Technology Content Research & Insights Artificial Intelligence