Toulouse is AI
Focus #3 : Role of Data in AI, la future gouvernance des données

Le Partenariat mondial sur l'IA (GPAI) pour construire une intelligence artificielle éthique et responsable travaille actuellement sur la gouvernance des données. Le rapport « The Role of Data in AI” vient d’être finalisé. Il établit des recommandations pour que l’IA ait des impacts positifs dans les domaines vitaux de la santé, de l’agriculture, de la finance ou des transports. Interview de Bertrand Monthubert, membre du groupe de travail sur la gouvernance des données du GPAI et président d’Occitanie Data.
Comment la question de la gouvernance des données est-elle traitée par le Partenariat mondial sur l'Intelligence Artificielle (IA) ?
Le Partenariat mondial sur l'IA (GPAI) qui est une initiative internationale travaille actuellement sur 4 thématiques : l’utilisation responsable de l’IA, la gouvernance des données, l’avenir du travail et enfin l’innovation et la commercialisation. Le groupe de travail dont je fais partie, « Data Gouvernance », rassemble des expert.es de plus de 15 pays issu.es du monde universitaire et de la recherche, de l’industrie, de la société civile et des gouvernements. Le groupe de recherche ouvert un appel à contribution cet automne et remet aujourd’hui son rapport final. Je précise que le Partenariat mondial sur l’IA a l’objectif de contribuer au développement et à l’utilisation responsables de l’IA, en se fondant sur les droits humains, l’inclusion, la diversité, l’innovation et la croissance économique tout en cherchant à atteindre les objectifs de développement durable des Nations unies. C’est la première initiative mondiale de cette ampleur et il s’agit d’explorer les conséquences de l’intelligence artificielle sans tomber ni dans la fascination ni dans la détestation. Dans ce cadre, la question des données est majeure et les défis sont nombreux puisqu’ils touchent à la fois à la qualité des données, à leur disponibilité et aux impacts sur la société et les droits individuels.
Que contient le rapport final du projet « The Role of Data in AI » ?
Le rapport présente une analyse des défis liés à la disponibilité, à l'accessibilité et à la qualité des données. De la bonne gouvernance des données dépend en effet l’ impact bénéfique que l'intelligence artificielle peut avoir dans des domaines vitaux comme la santé, l’agriculture, la finance et les transports. Le combustible des algorithmes d’intelligence artificielle -en tout cas pour ceux qui sont basés sur les réseaux neuronaux- dépend de la capacité à disposer de grandes quantités de données de bonne qualité. Il s’agit donc d’organiser concrètement toute la fonction data : comment sont récoltées les données ? Qui les détient ? Comment les met-on à disposition ? Comment les structure-t-on afin d’alimenter positivement les algorithmes d’intelligence artificielle ? Dans le rapport du GPAI, trois domaines d’application de l’IA sont en particulier étudiés : l'IA et les technologies du langage humain, l'utilisation de l'IA dans le système judiciaire et enfin l’IA utilisée pour le diagnostic rapide et la découverte de médicaments en situation de pandémie. Dans le cas du Covid-19 on sait que l'IA a été utilisée en analysant les résultats de traitements comme le Remdesivir précédemment utilisés contre le virus Ebola. À l’avenir et en matière de pandémie, le rapport note que les données devront provenir de diverses sources : dossiers médicaux électroniques, données sur les composés chimiques, données cellulaires, données d'essais, etc. Elles devront aussi être interopérables et harmonisées dans des bases de données qui garantissent de pouvoir élaborer plusieurs scénarios de traitements. Or aujourd’hui, les données sont dispersées et comme enfermées en silos dans les laboratoires de recherche, les laboratoires pharmaceutiques, les entreprises, les universités, etc. Le rapport note aussi que l’accès à ces données qui peuvent être d’intérêt général est entravé par des questions juridiques, des intérêts commerciaux et des obstacles administratifs. Le rapport détaille la façon dont on pourrait harmoniser les données pour former une base de données unifiée permettant des approches d'apprentissage automatique. La mission du groupe de travail « Data Gouvernance » va se poursuivre dans les prochains mois et notamment sur la question des data trust, les espaces de confiance pour la data. On voit très clairement désormais qu’il y a une gouvernance des données à organiser et c’est aussi le sujet sur lequel travaille Occitanie Data.
Quels sont les prochains objectifs d’Occitanie Data ?
Occitanie Data se transforme en GIP, groupement d’intérêt public, qui va garantir une structuration plus solide afin d’incarner cette dimension d’intérêt public qui est essentielle pour la création de l’espace de confiance des données. Le 15 décembre prochain, nous présenterons le GIP à nos partenaires et nous ferons un appel à de futurs membres. Cette année, Occitanie Data a aussi développé ses relations au niveau européen avec la Commission Européenne qui a de fortes ambitions en matière numérique et avec un groupe qui s’appelle Big Data Value Association.
L’Europe peut-elle encore faire face à la concurrence des gafa en matière de données ?
Nous sommes bien sûr engagés dans une course contre la montre mais la puissance de ces acteurs les expose aussi à la fragilité et aux erreurs. Les effets négatifs des algorithmes de recommandation, la création de bulles informationnelles et la mauvaise gestion des données provoquent la critique et la défiance. Il me semble que nous avons désormais la capacité d’agir et de proposer un modèle alternatif à la fois aux niveaux local, national, européen et mondial. Au niveau européen, le projet de règlement "Governance data Act" vient d’être publié avec l’objectif de faciliter le partage des données pour un usage non commercial dans l'ensemble de l'Union européenne. Ce projet qui encadre les activités « data altruism » est très prometteur et prend la suite du RGPD dont le retentissement et les effets ont été internationaux. Enfin au niveau mondial, le GPAI construit actuellement les bases d’une régulation internationale et joue le rôle majeur qu’a joué le GIEC en matière d’environnement.
Propos recueillis par Emmanuelle Durand-Rodriguez