Maîtriser la magie : pourquoi la science des données demeure essentielle à l’utilisation et la progression de l’IA
- Risques liés aux solutions d’IA opaques
- L’évolution du rôle de la science des données dans l’IA
- Explicabilité et transparence dans le déploiement des solutions d’IA
- Exemples illustrant la valeur ajoutée apportée par les scientifiques de données à l’IA en constante évolution
- Pourquoi la science des données est plus importante que jamais pour le développement, le déploiement et la mise à l’échelle de l’IA
- L’avenir de la science des données
Dans un monde où il est de plus en plus difficile de distinguer la réalité de la fiction et où les informations proviennent de plus en plus souvent de solutions d’intelligence artificielle (IA) opaques, le rôle de la science des données devient essentiel pour maîtriser la magie, ou plus précisément, pour maîtriser les mathématiques qui permettent aux organisations d’utiliser et de développer l’IA de manière responsable afin d’atteindre leurs objectifs commerciaux.
Si vous parcourez votre fil d’actualité LinkedIn ou suivez d’autres conversations sur les réseaux sociaux axés sur les technologies, vous constaterez chez les utilisateurs une tendance croissante à s’appuyer sur des modèles d’IA générative facilement accessibles pour expliquer le monde qui les entoure. L’expertise en IA étant de plus en plus axée sur la configuration des modèles d’IA plutôt que sur les modèles eux-mêmes, certains pensent que les modèles préconstruits et entraînés rendront la science des données et ses experts obsolètes.
S’il est clair que le rôle de la science des données évolue, il reste essentiel que les experts en science des données garantissent les meilleures pratiques et clarifient les modèles et les données qui sous-tendent les solutions d’IA plus accessibles. Alors que les organisations de tous les secteurs investissent de plus en plus dans l’IA, la science des données reste essentielle pour comprendre comment utiliser et déployer au mieux cette technologie puissante dans toute l’entreprise.
Risques liés aux solutions d’IA opaques
Les meilleures pratiques en matière d’éthique, de données et de gouvernance de l’IA s’appuient sur des principes éthiques issus de la recherche universitaire, qui servent également de fondement à la science des données responsable depuis des décennies. Ces principes incluent la transparence, la fiabilité, l’explicabilité, la confidentialité, la sécurité et l’équité dans la préparation et l’analyse des données.
L’IA opaque implique des modèles d’apprentissage automatique très complexes qui génèrent des résultats à partir d’énormes quantités de données, mais dont le processus décisionnel reste un mystère, même pour leurs développeurs. L’IA opaque ouvre la porte à des informations dont la source ou les modèles de raisonnement ne sont pas clairs, ce qui est préoccupant pour les organisations qui s’appuient de plus en plus sur l’IA générative et les modèles agentiques dans leurs activités opérationnelles. Avec l’IA opaque, les organisations risquent de faire confiance à des systèmes fondés sur la même logique que la saisie automatique, que l’on sait peu fiable, parfois même de manière amusante. Comme nous le montrons ci-dessous, la science des données joue un rôle important dans la réduction des risques liés à l’IA opaque.
L’évolution du rôle de la science des données dans l’IA
Si les progrès réalisés dans le domaine de l’IA générative et de l’IA agentique ont modifié le rôle des experts en science des données dans le développement et la formation d’algorithmes destinés à générer des perspectives à partir des données, il est plus important que jamais de comprendre les principes scientifiques qui sous-tendent le fonctionnement des modèles d’IA. Cela est particulièrement vrai non seulement en raison de l’utilisation croissante de l’IA opaque, mais aussi parce que la possibilité de configurer et d’utiliser des solutions d’IA préentraînées et à faible codage devient plus accessible aux particuliers comme aux organisations.
Le rôle des experts en science des données a évolué. Ils ne se contentent plus de concevoir des modèles d’IA, ils les valident également et veillent à ce que les principes d’IA responsable soient intégrés. Les scientifiques de données nous aident à comprendre ce qui se passe « sous le capot », pour ainsi dire, notamment en ce qui concerne les mathématiques et les mécanismes qui sous-tendent l’IA générative et les algorithmes similaires.
La transparence et l’explicabilité sont également particulièrement importantes à mesure que les cas d’utilisation de l’IA gagnent en complexité. Par exemple, de plus en plus d’entreprises dépassent le stade des projets pilotes et des cas d’utilisation simples de l’IA générative, tels que les assistants virtuels autonomes, pour s’orienter vers l’IA agentique.
À mesure que les organisations cherchent à étendre leur utilisation de l’IA, elles ont besoin d’experts en science des données capables de valider des modèles fiables, de comprendre comment ces modèles ont été entraînés, de mettre en place des balises appropriées et d’aider à gérer ces solutions, en accélérant leur utilisation, en ajustant le cap ou en freinant si nécessaire.
Explicabilité et transparence dans le déploiement des solutions d’IA
Un peu comme à l’école, il ne suffisait pas toujours de trouver la bonne réponse; il était tout aussi essentiel de démontrer le raisonnement qui la justifiait. Sans une bonne compréhension des processus de réflexion, il peut être difficile de bien comprendre une réponse ou de s’y fier. De plus, si les paramètres d’un problème changent, la capacité à adapter les réponses devient cruciale.
Certains dirigeants organisationnels et leurs équipes suggèrent que les experts en science des données jouent un rôle moins important dans le déploiement des solutions d’IA. Si cette observation peut se révéler vraie pour le développement de modèles d’IA (traditionnellement la responsabilité des experts en science des données), des complications peuvent survenir à mesure que les solutions s’étendent, s’intègrent et évoluent parallèlement aux progrès technologiques.
L’accessibilité accrue de l’IA à différents niveaux de compétences est indéniable. Compte tenu de l’explicabilité limitée de l’IA contemporaine, y compris des modèles génératifs et fondamentaux, l’expertise des experts en science des données est plus essentielle que jamais, même si elle est utilisée à différentes étapes du cycle de vie de l’IA.
La tâche d’interpréter les paramètres, les pondérations, les biais et les fonctions mathématiques au sein de modèles comportant des milliards de paramètres présente des défis considérables. La question du contrôle de ces systèmes est encore plus urgente.
Malgré les représentations dans la culture populaire, l’apport humain reste indispensable pour comprendre et gérer l’IA. Fondamentalement, l’IA reste un outil ancré dans les algorithmes et les données, conçu pour générer des perspectives et du contenu à partir des instructions des utilisateurs. Bien que sa complexité ait augmenté, un principe fondamental demeure : sans une surveillance humaine rigoureuse, même les modèles d’IA les plus avancés peuvent s’écarter des résultats escomptés.
Ceux qui ont une compréhension approfondie de ces modèles peuvent concevoir des méthodes pour accroître leur fiabilité et aider à détecter les erreurs dans les modèles ou les résultats. Cela inclut la conception de méthodes de protection contre les risques systémiques tels que l’utilisation de l’IA à des fins illégales et frauduleuses.
Afin de promouvoir l’équité, la transparence et l’alignement sur les valeurs humaines, les organisations doivent s’appuyer sur des techniques statistiques robustes. Les méthodologies de la science des données sous-tendent les efforts d’explicabilité et établissent des critères clairs pour le déploiement ou la mise hors service des modèles en cas de comportement imprévisible ou contraire à l’éthique.
Exemples illustrant la valeur ajoutée apportée par les scientifiques de données à l’IA en constante évolution
De nombreux exemples illustrent le rôle essentiel de la science des données pour garantir la fiabilité des résultats des stratégies et analyses commerciales basées sur l’IA. En voici deux.
- Cas d’utilisation n° 1 – Déploiement d’un modèle d’analyse prédictive
-
Lors du développement d’un modèle d’analyse prédictive destiné à évaluer le taux de désabonnement des clients dans le secteur des jeux en ligne, les experts en science des données de CGI ont mené des audits statistiques approfondis sur les données d’entrée et les résultats du modèle. Ils ont appliqué des techniques telles que l’analyse des impacts disparates, des mesures d’équité (comme la différence d’égalité des chances) et des méthodes d’attribution des caractéristiques (par exemple, les valeurs SHAP). Ces analyses ont révélé des biais involontaires et des schémas d’injustice dans le comportement du modèle, ce qui a conduit à une réévaluation complète, à un affinement et finalement à un redéploiement du système.
Dans le même cas d’utilisation, les équipes de CGI ont également mis en œuvre des algorithmes de détection des dérives statistiques (modèle et données) afin de surveiller le comportement du modèle au fil du temps. Lorsque des signes de dégradation ou de biais du modèle sont apparus, elles ont agi rapidement, lançant une analyse des causes profondes, en réentraînant le modèle et en apportant les ajustements nécessaires afin de maintenir une utilisation fiable et appropriée.
Tous ces mécanismes de contrôle s’appuient sur l’analyse statistique, ce qui souligne le rôle essentiel de la science des données non seulement dans la création de l’IA, mais aussi dans sa gestion responsable. Sans expert en science des données, il serait impossible de savoir ce qu’il faut surveiller, quelles mesures utiliser et comment corriger le comportement du modèle pour obtenir des résultats plus fiables.
- Cas d’utilisation n° 2 – Déterminer quels modèles d’IA déployer dans le domaine de la santé
-
Dans le domaine de la santé, l’apprentissage machine est utilisé depuis des décennies pour faire progresser la détection des maladies, faciliter les diagnostics et tirer parti des systèmes d’aide à la décision et des systèmes spécialisés afin d’améliorer les résultats pour les patients. De plus, la modélisation par IA fournit des informations aux praticiens plus rapidement et directement au point de service.
Si l’IA générative a amélioré la capacité des cliniciens à interroger plus rapidement les données et les données non structurées contenues dans leurs notes cliniques, l’IA traditionnelle reste le meilleur outil pour travailler en concertation avec les agents d’IA générative afin d’identifier, d’accéder et d’évaluer les modèles d’informations afin de fournir de meilleurs conseils et d’améliorer les résultats pour les patients. À mesure que l’intégration de l’IA générative à faible codage et des modèles traditionnels d’IA et d’apprentissage machine devient plus critique dans cet écosystème de soins de santé basé sur l’IA agentique, les scientifiques de données jouent un rôle essentiel dans la compréhension des données, des algorithmes et des résultats requis.
Pour déterminer le meilleur modèle à utiliser pour répondre à une question ou résoudre un problème de manière fiable, il est nécessaire d’avoir une connaissance approfondie de tous les modèles disponibles. Avec l’IA agentique, où les modèles d’IA générative et traditionnelle fonctionnent de concert, les experts en science des données jouent un rôle essentiel dans la conception des interactions. Si les solutions d’IA agentique configurables peuvent avoir une interface axée sur les résultats d’affaires, il est important de comprendre le modèle sous-jacent afin de garantir sa robustesse et son exactitude pour la qualité du traitement et des résultats.
Pourquoi la science des données est plus importante que jamais pour le développement, le déploiement et la mise à l’échelle de l’IA
La science des données a favorisé l’accessibilité de l’IA et de l’innovation en matière d’IA générative grâce à des recherches rigoureuses, et supposer qu’elle n’est plus nécessaire revient à suggérer que nous n’avons plus besoin de comprendre ou de faire évoluer les outils technologiques qui influencent de plus en plus les décisions des entreprises. Dans un monde en rapide évolution et marqué par des déploiements tumultueux de l’IA, les experts en science des données et les ingénieurs de données ont rendu possible l’innovation en matière d’IA, et ce sont également eux qui peuvent appuyer sur le fameux « bouton d’arrêt d’urgence » permettant de contenir l’IA.
Les experts en science des données peuvent s’appuyer sur l’IA traditionnelle et les modèles statistiques pour valider, interpréter et identifier les modèles d’IA appropriés et les données pertinentes afin de fournir des résultats solides et fiables. Ils peuvent garantir des pratiques éthiques, lutter contre les biais dans les données et les algorithmes et s’assurer que les bons modèles sont appliqués aux problèmes commerciaux réels, afin que les résultats soient fiables. Il est essentiel de surveiller chaque étape de la conception, du développement et du fonctionnement des systèmes d’IA afin d’éviter les problèmes imprévus et de garantir la clarté et la compréhensibilité.
En gérant correctement les données et les algorithmes, les experts en sciences des données apportent transparence et fiabilité. Ils aident les entreprises et les individus à faire face à la complexité de notre monde technologique, tout en veillant à ce que les décisions soient étayées par des informations solides et factuelles. En bref, ils garantissent que l’innovation reste sur la bonne voie et fondée sur la vérité.
De nos jours, la mise en œuvre d’un projet d’IA commerciale ne se limite plus à la configuration d’un assistant virtuel à l’aide de plateformes infonuagiques et de modèles prêts à l’emploi. Si l’IA peut sembler aussi simple que la mise en œuvre d’une API, l’obtention de résultats fiables nécessite la collaboration d’ingénieurs de données, d’ingénieurs en IA et de scientifiques des données pour mettre les modèles en production.
L’innovation nécessite de l’expérience, et les dirigeants d’entreprise ont toujours besoin d’analystes pour sélectionner et garantir la pertinence des perspectives, au-delà des mentions telles que « généré par l’IA ». L’IA aide à générer des hypothèses, mais les experts en science des données expérimentés sont indispensables pour concevoir des expériences qui vont au-delà des solutions configurables prêtes à l’emploi. N’oubliez pas que l’IA combine la science des données, l’informatique, les mathématiques, la programmation, l’architecture des données et l’expérience utilisateur.
L’avenir de la science des données
Dans le monde actuel, où la réalité est de plus en plus difficile à cerner, il devient aussi plus complexe de valider ce qui est « vrai » et de distinguer les contenus générés par l’homme de ceux générés par l’IA. À mesure que des outils tels que l’IA générative et les systèmes d’IA autonomes se généralisent, les possibilités de diffusion de fausses informations se multiplient.
Les experts en science des données seront toujours des atouts essentiels pour les équipes chargées de la configuration des infrastructures d’IA, afin d’assurer une surveillance responsable et la validation des systèmes d’IA. Ce sont les experts en science des données qui comprennent les nuances de la qualité des données, l’atténuation des biais, les considérations éthiques et les expérimentations rigoureuses nécessaires pour contrôler l’IA.
Si l’IA peut amplifier les perspectives, accélérer l’innovation et automatiser les tâches routinières, le rôle de l’expert en science des données a évolué. Plutôt que de se contenter de construire des modèles et d’interpréter des données, les experts en science des données doivent désormais déterminer quand, où et comment l’IA doit être exploitée et déployée à grande échelle et, surtout, quand elle doit être arrêtée.
La science des données est loin d’être dépassée; elle est plus essentielle que jamais, agissant à la fois comme un accélérateur et un mécanisme de contrôle critique dans un monde de plus en plus axé sur l’IA. Après tout, quelqu’un doit savoir comment fonctionnent les modèles, tant pour stimuler l’innovation continue que pour savoir quand les désactiver.
Pour discuter davantage à ce sujet, n’hésitez pas à communiquer avec Diane or Parimal. Apprenez-en plus sur les capacités et l’expertise en IAde CGI.
Haut de page