La pathologie à l'heure de l'intelligence artificielle : exemple de la pathologie mammaire
- Ces dernières années, les avancées de l'intelligence artificielle (IA) ont permis d'identifier de nouvelles pistes de recherche en travaillant sur les données de manière innovante. Qu'on la considère comme un réel enjeu de civilisation ou comme un engouement passager, on ne peut que constater la place grandissante qu'occupe l'IA dans différentes sphères de nos vies. Ainsi, la médecine est un domaine qui a vu se développer des technologies d'IA à plusieurs niveaux, de manière exponentielle (outils diagnostiques en imagerie, modélisations épidémiologiques, etc.). En pathologie, le défi de l'IA pourrait être de constituer des bases de données de qualité et exhaustives comportant des images annotées, associées à des données cliniques, morphologiques, radiologiques et moléculaires structurées. On peut aisément imaginer que dans un futur proche, l'utilisation d'algorithmes devrait permettre, au-delà d'assister le pathologiste dans ses tâches répétitives et chronophages, de trouver de nouveaux facteurs pronostiques et prédictifs de la réponse aux traitements qui sont les clefs d'une prise en charge personnalisée des cancers, notamment en pathologie mammaire.
Liens d'interêts
G. Bataillon, A. Vincent-Salomon, N. Jouvin et T. Walter déclarent ne pas avoir de liens d’intérêts.
Autres articles sur « Onco-théranostic »
Envoyer à un confrère
Merci de saisir l’e-mail de votre confrère :
Figure 1. Illustration des algorithmes utilisés en pathologie selon Robertson et al. (14) : machine learning versus deep learning. Dans le machine learning, plusieurs étapes nécessitant des connaissances humaines approfondies sont nécessaires pour reconnaître la cellule cancéreuse. Tout d’abord, une segmentation de l’image la divise en parties caractérisées par un pathologiste ou un algorithme d’apprentissage automatique sous forme de vecteur, qu’il utilise pour élaborer un modèle prédictif. En revanche, le deep learning est une approche de bout en bout qui prend des images brutes en entrée et élabore un modèle prédisant le résultat souhaité. Il utilise des réseaux de neurones (d’inspiration biologique) pour représenter les données à travers plusieurs niveaux simples qui transforment la représentation précédente en une représentation supérieure, plus abstraite. L’architecture du réseau permet de former des représentations très complexes et non linéaires, chaque couche constituant une représentation plus abstraite que la précédente. Le résultat fournit un pouvoir discriminatoire potentiellement supérieur à celui du pathologiste.

Figure 2. Illustration des méthodes d’apprentissage supervisée ou non en pathologie. L’apprentissage est supervisé lorsque le programme informatique est entraîné sur un ensemble d’images annotées de cancer, au cours duquel il apprend les types afin de pouvoir déterminer le type de cancer par la suite. On parle d’apprentissage non supervisé lorsque l’entraînement se fait à l’aide d’un ensemble d’images de cancer sans annotation afin de déterminer de manière autonome les détails significatifs dans les images, et de les classer en un nombre de groupes défini.

Figure 3. Fouille textuelle au sein d’une base de données de 10 000 comptes rendus de biopsies mammaires (étude interne réalisée par l’équipe de N. Jouvin). Le corps du texte des comptes rendus de pathologie mammaire a été analysé à l’aide d’un algorithme de fouille de couples de 2 mots consécutifs (bi-gram). La répartition en 4 groupes met en évidence des couples de 2 mots consécutifs correspondant aux lésions bénignes, aux carcinomes mammaires in situ, infiltrants de types non spécifiques et lobulaire. Une étude est en cours afin de combiner les analyses du texte et des images dont le résultat pourrait être celui illustré dans cette figure. L’algorithme fonctionne sur des vignettes de petite taille de l’ordre de 350 × 350 pixels.

Pathologie | Génétique | Radiologie | |
---|---|---|---|
Coût du matériel | Scanner de lame Digipath 80 lames/J (25 k€) Aperio AT2 700 lames/J (200 k€) 0,76-0,86 €/Go |
Séquenceurs (pool possible) MiSeq 8 Go/24 h (99 k€) NovaSeq 6 TB/44 h (990 k€) 0,9-34 €/Go |
IRM (500-1 500 k€) Scanner (500-1 000 k€) |
Coût des consommables | Pas de surcoût | MiSeq 1 000 € NovaSeq 9 000 € |
Pas de surcoût |
Taille des fichiers | Lames digitalisées : 0,5-4 Go/WSI* |
Séquençage complet de l’exome : 2 Go/WES |
0,08 Go/radio 0,1 Go IRM 0,5 Go/scanner |
Coût du stockage | 1-8 000 Go/J 0,01 €/Go/mois Plus la base est importante plus elle a de la valeur |
1-50 GB/J | |
Coût de l’analyse | Visualisation des lames digitalisées Annotation des régions d’intérêt |
Contrôle de qualité Alignement sur génome de référence |
Visualisation Annotation |
Algorithme | Détection des noyaux, mitoses, Degré de pléomorphisme Infiltrat lymphocytaire |
Identification des variants** Annotation fonctionnellle des variants Étude de variabilité du nombre de copies Analyse des microsatellites |
Hiérarchiser les examens Radiomiques (prédiction de la réponse à l’immunothérapie) |
* Whole slide imaging ; ** Délétion, insertion, polymorphisme nucléotidique.