Les chatbots IA dévorent vos données personnelles : voici les pires contrevenants
Comme beaucoup de gens aujourd'hui, vous pouvez vous tourner vers l'IA pour obtenir des réponses, générer du contenu ou recueillir des informations. Mais comme on dit, rien n'est gratuit. Dans le cas de l'IA, le prix à payer, ce sont vos données personnelles. Une nouvelle étude de Surfshark, un service de VPN et de sécurité, révèle quels types de données les différentes IA collectent et lesquelles en récupèrent le plus.
Pour son rapport, Surfshark a analysé 10 chatbots IA populaires : ChatGPT, Claude AI, DeepSeek, Google Gemini, Grok, Jasper, Meta AI, Microsoft Copilot, Perplexity, Pi et Poe. L'analyse s'est basée sur les détails de confidentialité de chaque application sur l'App Store d'Apple ainsi que sur les politiques de confidentialité de DeepSeek et ChatGPT. L'objectif était de déterminer combien de types de données chaque application collecte, si ces données sont liées à l'utilisateur et si l'application utilise de la publicité tierce.
Surfshark s'est concentré sur 35 types de données différents, notamment les informations de contact, la santé et la forme physique, les informations financières, la localisation, les données sensibles, les contacts, le contenu utilisateur, l'historique, les identifiants, les diagnostics, les données d'utilisation et les achats. Par exemple, les données sensibles incluent l'origine ethnique, l'orientation sexuelle, des informations sur la grossesse, un handicap, des convictions religieuses ou philosophiques, une appartenance syndicale, des opinions politiques, des données génétiques ou biométriques.
Les 10 applications IA analysées collectent toutes des données utilisateur. En moyenne, elles en récupèrent 13 types sur 35. Environ 45 % des applications collectent votre localisation, et près de 30 % suivent vos données pour les relier à des informations tierces afin d'afficher des publicités ciblées ou de les vendre à des courtiers en données.
Selon l'étude, Meta AI est le pire contrevenant, collectant 32 types de données sur 35, soit 90 %. C'est la seule application à récupérer des données financières, de santé ou sensibles. Meta AI et Copilot sont les seules à utiliser des données liées à l'identité de l'utilisateur pour afficher des publicités tierces. Meta peut collecter jusqu'à 24 types de données à cette fin.
Google Gemini arrive en deuxième position, avec 22 types de données collectées, dont la localisation précise, les informations de contact, le contenu utilisateur, les contacts téléphoniques, l'historique de recherche et de navigation. Poe, Claude et Copilot complètent le top 5, collectant respectivement 14, 13 et 12 types de données. Poe et Copilot utilisent l'ID de l'appareil pour suivre l'utilisateur et vendre ses données à des courtiers.
DeepSeek, une IA chinoise, se classe sixième avec 11 types de données collectées, dont l'historique des discussions. Cependant, deux problèmes majeurs se posent : d'une part, les résultats peuvent être censurés en raison des restrictions chinoises, et d'autre part, les données sont envoyées à China Mobile, une entreprise publique chinoise interdite aux États-Unis pour des raisons de sécurité nationale. De plus, DeepSeek conserve les données sur des serveurs en Chine, ce qui pose des risques de fuite, comme en témoigne un piratage ayant exposé plus d'un million d'historiques de discussions.
ChatGPT, avec 10 types de données collectées, offre des options pour limiter l'utilisation des données, comme les discussions temporaires supprimées après 30 jours ou la possibilité de refuser l'utilisation des données pour l'entraînement. Enfin, Grok, Pi et Jasper ferment la marche, collectant respectivement 7, 5 et 5 types de données. Jasper utilise notamment les ID d'appareil pour diffuser des publicités ciblées.
La collecte de données est une pratique courante, mais des moyens existent pour la limiter. Il est essentiel de consulter les politiques de confidentialité et les paramètres des applications IA pour mieux contrôler ses données personnelles.