Une aide à la décision par le Machine Learning

Perspectives

© 4X-image-iStock

L’intelligence artificielle, et en particulier le Machine Learning, pourrait être un outil d’aide à la décision en biologie médicale. Une expérimentation a évalué son utilisation dans un système d’aide à la validation biologique. SIL-LAB Experts, avec le laboratoire BIO 86 à Poitiers et la société ISoft, l’ont conduite en janvier 2019.

Aujourd’hui, l’intelligenceartificielle (IA) est l’objet de nombreux discours alarmistes, notamment sous l’angle éthique et les risques qu’elle devienne plus puissante que l’humain. Cette appréhension prend une dimension particulière dans le domaine de la biologie médicale, étant donné le caractère hautement sensible et personnel des données des patients.
Cette appréhension explique sans doute que certaines avancées de l’IA, notamment dans le domaine du Machine Learning (ML), peinent à trouver des applications en biologie médicale. Les apports du ML sont pourtant considérables dans la plupart des autres secteurs d’activité.
Une étude récente, parue dans Nature le 20 août 20191, vient renforcer l’intérêt de l’utilisation des approches ML dans la biologie médicale. En effet, elle a permis d’identifier 14 marqueurs biologiques qui, ont un impact statistique sur l’espérance de vie. Ces biomarqueurs sont plus des indicateurs d’un état de santé général que des marqueurs spécifiques liés au décès en raison d’une pathologie particulière. Ces résultats suggèrent que l’établissement d’un profil de biomarqueurs métaboliques pourrait être utilisé pour orienter les soins des patients, s’il est ensuite validé dans des contextes cliniques pertinents.
L’étude menée par SIL-LAB Experts évalue elle aussi les bénéfices d’un outil de ML pour l’analyse de données biomédicales2.
Pour ce faire, une expérimentation a été menée sur les données réelles d’un laboratoire de biologie médicale (LBM). L’étude propose également un parallèle avec le domaine de la sécurité financière, où les apports de l’IA sont aujourd’hui reconnus.
À l’heure actuelle, les LBM utilisent principalement des systèmes experts appelés systèmes d’aide à la validation biologique (SAVB). Ce sont des logiciels qui, sous certaines conditions et sous le contrôle du biologiste, peuvent fournir eux-mêmes une validation d’analyse. Le biologiste garde, cependant, la responsabilité des résultats émis. Il existe deux types de SAVB.
- Ceux fournis en « boîte noire », et dont les règles, paramétrées par le fournisseur, ne sont pas accessibles aux biologistes.
- Ceux permettant aux biologistes et aux techniciens de paramétrer eux-mêmes leurs algorithmes. Aucune règle n’est fournie par défaut.
Dans les deux cas, le Machine Learning n’est pas utilisé pour paramétrer ces outils et les algorithmes sont complétement
déterministes : quand on prend deux fois les mêmes données, on obtient exactement les mêmes résultats.

Déceler des données invisibles

L’étude a consisté en une expérimentation menée sur les données réelles anonymisées du laboratoire BIO86 qui utilise actuellement un système expert classique. Le but était d’évaluer les apports du ML dans ce contexte. Pour cela, un prototype de ML a été mis en oeuvre.
Dans un premier temps, l’algorithme d’apprentissage a été entraîné sur les données du laboratoire, avec les résultats fournis par le système expert existant. Dans un second temps, il a proposé ses propres résultats sur un nouveau jeu de données tests.
L’étude a permis de tirer les conclusions suivantes.
- Le ML permet d’identifier des relations, entre les données, jamais envisagées parles biologistes.
- Les résultats obtenus par le ML reposent sur des probabilités, et non sur un raisonnement binaire (validation/invalidation). Cela permet, contrairement aux résultats des SAVB, d’avoir une plus grande subtilité dans la validation et d’être plus en adéquation avec la réalité biologique, où l’on sait que toute réponse n’est jamais vraiment binaire.
L’étude approfondit ensuite un parallèle avec le domaine de la fraude bancaire, où les apports de l’IA sont aujourd’hui reconnus et incontestables. Détection d’événements rares, explicabilité et transparence, maîtrise par des utilisateurs métiers non-experts en ML… : les deux domaines partagent de nombreuses spécificités. La transposition des techniques développées dans le secteur bancaire à la biologie médicale semble simple et efficace et pourrait accélérer l’intégration de ML dans le cadre de l’analyse des données biomédicales. Le ML apparaît donc comme une piste prometteuse pour enrichir l’analyse médicale, en décelant dans les données des informations invisibles pour l’analyse humaine. À l’ère de la production massive de données, quel que soit le secteur, la volumétrie ne permet plus une analyse uniquement humaine : c’est dans ce contexte que le ML devient pertinent. Mais, comme le montre cette étude, le ML n’est pas une finalité. Il reste avant tout un outil d’aide à la décision qui va permettre au biologiste d’appliquer des raisonnements de plus en plus poussés dans un temps acceptable cliniquement. Le laboratoire de biologie et le biologiste, en saisissant les opportunités offertes dès aujourd’hui par le ML, peuvent ainsi devenir la pierre angulaire de la médecine préventive et personnalisée de demain.

1. Deelen J et al., Nat Commun. 2019 Aug 20; 10(1):3 346.
2. L’étude complète est disponible sur : www.sil-lab-experts.com/images/SIL-LAB/actualites/IA-et-Biologie-Medicale-Cas-Reel-V4.pdf

Téléchargez le PDF

Serge Payeur

Publicités