Deep Learning pour l’identification de différences phénotypiques visuelles subtiles entre lignées neuronales, modèles de la maladie de Parkinson - Thèses ENS Accéder directement au contenu
Thèse Année : 2020

Deep Learning for the identification of subtle visual phenotypic differences between neuronal lineages, models of Parkinson's disease

Deep Learning pour l’identification de différences phénotypiques visuelles subtiles entre lignées neuronales, modèles de la maladie de Parkinson

Résumé

High-content screening has experienced a significant growth since the mid-2000s. This technology is of primary interest to the pharmaceutical industry as it allows in principle the discovery of therapeutic molecules for diseases whose molecular pathways are poorly identified. Until now, a measurable cell phenotype must first be identified in order to evaluate the effect of a compound library on it. From an image analysis point of view, treated cells are automatically detected in hundreds of thousands of images and measurements of descriptors allow to finely differentiate effective treatments from a negative control. In collaboration with the companies Ksilink and Sanofi, we have been confronted with a new type of high-content screen to identify compounds effective against Parkinson's disease. This one, presenting images of neurons, made analysis dependent on robust cell segmentation obsolete. In addition, using cell differentiation and genome editing techniques, the controls of the cell model are two neuron cultures, isogenic but for one mutation: the GS2019 mutation that induces the disease. Nevertheless, the heterogeneity of these complex cells and the fine differences between the two isogenic lines do not allow the human eye to identify two distinct phenotypes. In order to allow the automatic detection of differences between phenotypes, we have proposed to use deep learning approaches. This work was mainly divided into two steps. The first step consisted in identifying a network architecture capable of classifying neural images. We learned that neuron cultures show phenotype differences in a very heterogeneous and therefore not systematic way. The second step consisted in proposing methods to explain and interpret subtle differences in phenotype, to ensure that the screening is performed on the basis of a proven difference between phenotypes and not on the basis of a technical bias. Based on the premise that differences between neuronal phenotypes are difficult to visually apprehend between two different images due to the high natural variability of neurons, we propose the idea that transforming the same image from one phenotype to another may represent an interesting approach. Indeed, we show that it is possible to train antagonistic networks to transform an image of a neuron that does not carry the mutation into a neuron that carries it and vice versa. In this way, we have been able to highlight potential assay biases but also what we believe to be true morphological differences related to the pathological mutation that were previously invisible.
Le criblage à haut contenu connaît un essor important depuis le milieu des années 2000. Cette technologie est d’un intérêt primordial pour l’industrie pharmaceutique car elle permet en principe la découverte de molécules à visée thérapeutique pour des maladies dont les voies moléculaires sont mal identifiées. Jusqu’à présent un phénotype cellulaire mesurable doit au préalable être identifié afin d'évaluer l’effet d’une banque de composés sur celui-ci. Du point de vue de l’analyse d’image, les cellules traitées sont détectée automatiquement sur des centaines de milliers d’images et des mesures de descripteurs permettent de différencier finement les traitements effectifs par rapport à un contrôle négatif. En collaboration avec les entreprises Ksilink et Sanofi, nous avons été confrontés à un nouveau type de crible à haut contenu pour identifier des composés efficaces contre la maladie de Parkinson. Celui-ci, présentant des images de neurones, rendait caduque l’analyse dépendant d’une segmentation robuste des cellules. Par ailleurs, grâce à des techniques de différentiation cellulaire et d’édition de génome, les contrôles du modèle cellulaire sont deux cultures de neurones, isogéniques à une mutation près : la mutation GS2019 induisant la maladie. Néanmoins, l’hétérogénéité propre à ces cellules de forme complexe, et les différences fines entre les deux lignées isogéniques ne permettent pas à l’œil humain l’identification de deux phénotypes distincts. Dans le but de permettre la mise en évidence automatique des différences entre phénotypes, nous avons proposé d’employer des approches de deep learning. Ce travail s’est décomposé principalement en deux étapes. La première étape a consisté à identifier une architecture de réseau capable de classifier des images de neurones. Nous avons appris que les cultures de neurones montraient des différences de phénotype de manière très hétérogène et donc pas systématique. La deuxième étape a consisté à proposer des méthodes pour expliquer et interpréter les différences subtiles de phénotype, ceci afin de s’assurer que le crible soit effectué sur la base d’une différence avérée entre phénotypes et non sur la base d’un biais technique. Partant du principe que les différences entre phénotypes neuronaux sont difficiles à appréhender visuellement entre deux images différentes du à la grande variabilité naturelle des neurones, nous proposons l’idée que la transformation d’une même image d’un phénotype à un autre peut représenter une approche intéressante. En effet, nous montrons qu'il est possible d'entraîner des réseaux antagonistes à transformer une image de neurone non porteur de la mutation en neurone porteur et inversement. De cette façon, nous avons pu mettre en évidence des potentiels biais de l’assay mais également ce que nous pensons être de véritables différences morphologiques liés à la mutation pathologique auparavant invisibles.
Fichier principal
Vignette du fichier
Champetier_2020_These.pdf (27.39 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03537532 , version 1 (20-01-2022)

Identifiants

  • HAL Id : tel-03537532 , version 1

Citer

Tiphaine Champetier. Deep Learning pour l’identification de différences phénotypiques visuelles subtiles entre lignées neuronales, modèles de la maladie de Parkinson. Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Paris sciences et lettres, 2020. Français. ⟨NNT : 2020UPSLE037⟩. ⟨tel-03537532⟩
155 Consultations
63 Téléchargements

Partager

Gmail Facebook X LinkedIn More