Quantification de la fibrose hépatique à partir d’images...

52
L.I.S.A. EA4014 C.H.R.U. d’Angers 62, av Notre Dame du Lac Pôle Imagerie 49000 Angers - France 49000 Angers - France Tél. : +33 (0)2.41.22.65.60 Tél : +33 (0)2.41.22.65.00 DEA Signaux et Images en Biologie et Médecine Quantification de la fibrose hépatique à partir d’images histologiques couleur CHAIGNEAU Julien Du 1er février au 31 août 2006 Responsable de stage : Madame Christine Cavaro-Ménard

Transcript of Quantification de la fibrose hépatique à partir d’images...

L.I.S.A. EA4014 C.H.R.U. d’Angers62, av Notre Dame du Lac Pôle Imagerie

49000 Angers - France 49000 Angers - FranceTél. : +33 (0)2.41.22.65.60 Tél : +33 (0)2.41.22.65.00

DEA Signaux et Images en Biologie et Médecine

Quantification de la fibrose hépatique à partir

d’images histologiques couleur

CHAIGNEAU Julien

Du 1er février au 31 août 2006

Responsable de stage : Madame Christine Cavaro-Ménard

Science Science
Université d'Angers
Science Science
Science Science

Remerciements

En préambule de ce rapport, je souhaite adresser mes remerciements à toutes les personnes qui

ont rendu possible le bon déroulement de mon stage.

Je remercie le Professeur Jean-Jacques Le Jeune, chef du service de Médecine Nucléaire, de

m’avoir permis de réaliser ce stage dans ce service et Monsieur Jean-Louis Ferrier, directeur

du LISA de m’avoir accueilli dans son laboratoire.

Je tiens à remercier Madame Christine Cavaro-Ménard, maître de conférences, qui m’a

donné l’opportunité de réaliser ce stage et pour ses conseils, ses explications.

J’adresse aussi un grand merci à toutes les personnes du laboratoire qui m’ont aidé dans la

réalisation de ce stage et aussi pour leur accueil et leur disponibilité.

Merci à mes collègues : Cécile Dostert, Estelle Taupin, Emmanuel Szpiega, Jérôme Soul-

labaille, Aymeric Histace, Xavier Baty et Vincent Roullier.

Sommaire

Introduction 1

1 La fibrose hépatique 31.1 Les mécanismes de la fibrose hépatique . . . . . . . . . . . . . . . . . . . . . . . . 31.2 L’examen anatomopathologique du foie . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Les marqueurs non invasifs de fibrose hépatique . . . . . . . . . . . . . . . . . . . 4

1.3.1 Les paramètres du bilan hépatique, marqueurs indirects de fibrose hépatique 41.3.2 Les marqueurs directs de fibrose hépatique . . . . . . . . . . . . . . . . . . 51.3.3 Les scores de fibrose hépatique . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Les méthodes de classification 82.1 Généralités sur la classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1.1 Méthodologie de la classification . . . . . . . . . . . . . . . . . . . . . . . 82.1.2 Les types de classification . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Etat de l’art des méthodologies de quantification de la fibrose hépatique . . . . . 92.3 Une méthode de classification supervisée pour les images couleur . . . . . . . . . 9

2.3.1 Calcul de distance dans l’espace L*a*b* . . . . . . . . . . . . . . . . . . . 92.4 Les méthodes de classification non supervisées pour les images couleur . . . . . . 12

2.4.1 Maximisation de la ressemblance . . . . . . . . . . . . . . . . . . . . . . . 122.4.2 Méthode des K-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.4.3 Méthode Fuzzy C-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.4.4 Méthode de segmentation des histogrammes 2D . . . . . . . . . . . . . . . 19

3 Résultats 253.1 Première série d’acquisitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2 Deuxième série d’acquisitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.3 Vers un nouveau système d’acquisition . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Optimisation du Fuzzy C-means 334.1 L’étude des espaces couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.1.1 L’espace I1I2I3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.1.2 L’étude des histogrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.2 Orientation de la classification Fuzzy C-means . . . . . . . . . . . . . . . . . . . . 35

Conclusion et perspectives 38

A Présentation du foie humain 39A.1 Anatomie du foie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39A.2 Fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

B Acquisitions de décembre 2005 41B.1 Tableau des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

C Acquisitions de mars 2006 42C.1 Tableau des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

D Tableau récapitulatif des résultats 43

Table des figures

1 Les grandes étapes de mon travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1 Représentation du seuillage réalisé manuellement par l’expert. En déplaçant le curseur, il choisit

en rouge la zone qu’il considère comme représentative de la fibrose . . . . . . . . . . . . . . 7

2.1 Représentation spatiale du modèle L*a*b* . . . . . . . . . . . . . . . . . . . . . . . . . 102.2 Sélection manuelle des classes sur l’image originale couleur . . . . . . . . . . . . . . . . . 112.3 Représentation des 3 composantes RGB et de leur histogramme . . . . . . . . . . . . . . . 122.4 Algorithme de maximisation de la ressemblance . . . . . . . . . . . . . . . . . . . . . . . 132.5 L’espace HLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.6 Histogramme 2D L/S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.7 Histogramme 2D H/S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.8 Application de la LPE sur L/S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.9 Application de la LPE sur H/S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.10 Histogramme de la saturation avec la représentation en rouge des 2 pics n1 et n2 . . . . . . . 232.11 De gauche à droite : partition PLS (3 classes), partition PHS (2 classes) et binarisation de la

saturation : Xs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.12 Résultat après la fusion des partitions PHLS (5 classes). . . . . . . . . . . . . . . . . . . . 24

3.1 Images couleur originales acquises en décembre 2005. . . . . . . . . . . . . . . . . . . . . 253.2 Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour l’acquisition

de décembre 2005. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.3 Images couleur acquises en mars 2006 sur un même échantillon avec des paramètres différents. 273.4 Difficulté du seuillage par l’expert : à gauche, 22.55% de fibrose, à droite, 17.87% de fibrose. . 273.5 Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour l’acquisition

de mars 2006. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283.6 Principe du nouveau système d’acquisition. . . . . . . . . . . . . . . . . . . . . . . . . . 293.7 Image couleur d’une région de la lame . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.8 Image binarisée par l’expert : 32.5% de fibrose . . . . . . . . . . . . . . . . . . . . . . . 303.9 Classe fibrose après classification dans L*a*b* : 31% de fibrose . . . . . . . . . . . . . . . 303.10 Image binarisée par maximisation de la ressemblance : 41.4% de fibrose . . . . . . . . . . . 303.11 Classification K-means avec 3 classes, représentation de la classe fibrose : 37.25% de fibrose . . 313.12 Classification C-means avec 3 classes, représentation de la classe fibrose : 32.25% de fibrose . . 313.13 Méthode de segmentation des histogrammes 2D : en noir 32.9% de fibrose . . . . . . . . . . 313.14 Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour le nouveau

système d’acquisition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.15 Image couleur avec peu de fibrose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.16 Histogramme de l’image avec peu de fibrose : absence de pic de fibrose . . . . . . . . . . . . 32

4.1 Histogramme pour chaque composante dans l’espace L∗

a∗

b∗. . . . . . . . . . . . . . . . . 34

4.2 Histogramme pour chaque composante dans l’espace HLS. . . . . . . . . . . . . . . . . . 344.3 Histogramme pour chaque composante dans l’espace I1I2I3. . . . . . . . . . . . . . . . . 34

4.4 Etapes permettant l’obtention des centroïdes qui orienteront la classification. Sélection des ré-

gions avec beaucoup de tissus sain (1), avec beaucoup de fibrose (2) et beaucoup de stéatose

(3). Recherche des centroïdes sur l’histogramme résultant de la somme des 3 histogrammes de

chaque région. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.5 Pour un cas de faible fibrose, position des centroïdes (en rouge) calculés avec l’algorithme Fuzzy

C-means (à gauche) et avec l’algorithme fuzzy C-means orienté (à droite). . . . . . . . . . . 374.6 Courbes de tendance de la méthode Fuzzy C-means et de la méthode Fuzzy C-means améliorée

en fonction des résultats de l’expert pour le nouveau système d’acquisition. . . . . . . . . . 37

A.1 Représentation de l’anatomie du foie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

D.1 Tableau récapitulatif des résultats obtenus pour le nouveau système . . . . . . . . . . . . . 43

Introduction

La quantification précise de la fibrose hépatique sur des sections de biopsie du foie permetd’une part un diagnostic et une gradation des maladies chroniques du foie (d’origine alcoolique,virale, parasitaire ou métabolique) et d’autre part l’évaluation d’un traitement thérapeutique. Leszones de fibrose peuvent être comparées à un enchevêtrement de segments plus ou moins épais(Fig.1). La fibrose étant dynamique et réversible, il est impératif de la quantifier précisémentet précocément afin d’améliorer le diagnostic et l’évaluation d’un traitement thérapeutique. Laméthode d’analyse des images histologiques, actuellement utilisée, nécessite un seuillage manueldu tissu fibreux, ne permettant pas une bonne reproductibilité inter et intra-observateur.

Nous proposons donc une quantification automatique et fiable de la fibrose hépatique enexploitant la classification couleur. Dans ce rapport, nous présenterons la fibrose hépatique dansle chapitre 1. Nous avons implémenté et testé sur des échantillons acquis selon trois protocolesdifférents, cinq méthodes de classification couleur, développées dans le chapitre 2. Les méthodesimplémentées sont basées sur des principes très différents (méthodes supervisées et non super-visées, utilisant une ou plusieurs composantes couleur de l’espace RGB ou d’un autre espacecouleur) afin d’offrir un panel représentatif et pertinent de méthodes. Le chapitre 3 présenterales résultats obtenus pour chaque méthode implémentée. Compte tenu des résultats, nous pro-posons une optimisation de la méthode de classification non supervisée la plus performante afind’offrir une méthode fiable et robuste au pourcentage de fibrose. Le schéma d’optimisation seraprésenté dans le dernier chapitre.

2

Fig. 1 – Les grandes étapes de mon travail

Julien CHAIGNEAU - 30 août 2006

Chapitre 1

La fibrose hépatique

La fibrose hépatique traduit la formation d’un tissu cicatriciel. C’est la conséquence de toutesles maladies chroniques du foie quelle qu’en soit la cause (alcoolique, virale, parasitaire, métabo-lique). La cirrhose représente le stade évolué de la fibrose et s’accompagne d’une perte progressivedes fonctions hépatiques. Le diagnostic de fibrose repose classiquement sur l’examen anatomo-pathologique d’un fragment de foie recueilli par une biopsie hépatique. Cependant, cet examenest invasif. Dans l’infection chronique par le virus de l’hépatite C, la quantification de la fibrosepermet d’estimer le risque de progression vers la cirrhose et intervient dans la décision théra-peutique. Depuis 1997, plusieurs scores associant différents paramètres directs ou indirects de lafibrose ont été proposés pour augmenter la précision diagnostique d’une fibrose significative oud’une cirrhose.

1.1 Les mécanismes de la fibrose hépatique

La fibrose est caractérisée par l’accumulation de constituants normaux de la matrice ex-tracellulaire (MEC) dans le foie et résulte d’un déséquilibre entre leur synthèse, leur dépôt etleur dégradation. Chez l’homme, la matrice extracellulaire hépatique représente moins de 3% dupoids du foie normal. L’augmentation de la synthèse des composants de la matrices extracellulairevisant à limiter l’extension de la réaction inflammatoire, d’une part, et la faillite des mécanismesde dégradation de cette matrice, d’autre part, expliquent le développement de la fibrose. La fi-brose étant dynamique et réversible, il est impératif de la quantifier précisément et précocémentafin d’améliorer le diagnostic et l’évaluation d’un traitement thérapeutique.

1.2 L’examen anatomopathologique du foie

L’examen anatomopathologique d’un fragment de foie obtenu par biopsie est aujourd’hui unélément essentiel pour le diagnostic et l’évaluation des atteintes chroniques du foie. Les indicationsde la biopsie hépatique ont augmenté ces 20 dernières années. Cela s’explique notamment parl’augmentation de la fréquence des hépatites virales C et de son dépistage. On estime actuellementà environ 16 000 le nombre de biopsies hépatiques réalisées chaque année en France dans le cadred’atteintes hépatiques diffuses.

L’examen anatomopathologique du foie reste actuellement l’examen de référence (gold stan-dard) pour apprécier le degré et la distribution des principales lésions hépatiques. Outre sonapport diagnostique, il permet de préciser le stade d’évolution de la fibrose dont l’importanceest décrite de façon qualitative. De plus, il permet également de mesurer cette évolution par desscores semi-quantitatifs tel que le score Métavir qui est très largement utilisé aujourd’hui dansl’hépatite chronique virale C. Selon le score Métavir, la fibrose est appréciée en 5 stades :

1.3 Les marqueurs non invasifs de fibrose hépatique 4

– 0 : absence de fibrose.– 1 : début de fibrose.– 2 : fibrose peu importante.– 3 : fibrose développée sans cirrhose.– 4 : stade évolué de fibrose : cirrhose.

La biopsie du foie est un geste invasif qui comporte des risques et qui ne peut donc pas êtrerenouvelé facilement. Les complications les plus fréquentes sont la douleur ou le malaise vagalqui ne présentent pas de gravité, sauf en cas de choc vagal. Les complications majeures, plusrares, sont l’hémorragie, la péritonite bilaire, la perforation d’un organe intra abdominal et lepneumothorax. Le risque de décès est faible. Pour le diagnostic de cirrhose, dans environ 20% descas, la fiabilité de l’examen anatomopathologique peut être prise en défaut. L’échantillonnageest principalement responsable de cette proportion élevée de faux négatifs. En effet, un fragmentne représente qu’un échantillon d’environ 1/100 000 de la masse du foie. Cela peut aussi être dûaux écarts liés à l’observateur. Il est admis qu’une biopsie doit être d’une taille minimale de 10mm et doit comporter au moins six espaces portes pour être interprétée.

On peut donc dire que l’examen histopathologique du foie est encore un examen essentielchez la majorité des malades. Il permet de faire le bilan lésionnel et de rechercher des pathologiesassociées. Cependant, la biopsie hépatique étant un examen invasif, il faut à chaque fois considérerle rapport bénéfice/risque. De plus, le score reste peu précis dans le cas d’une étude de l’évolutionde la pathologie et très dépendant des biologistes qui analysent la biopsie.

1.3 Les marqueurs non invasifs de fibrose hépatique

Une évaluation fréquente de la fibrose est nécessaire pour la surveillance de l’évolution deshépatopathies chroniques et le développement de nouveaux traitements possédant une activitéanti-fibrosante. Cela suppose l’utilisation d’outils de mesure non invasifs susceptibles de se sub-stituer à la biopsie hépatique. Certains éléments du bilan hépatique sont des marqueurs indirectsqui apportent des indications sur le développement de la fibrose. Grâce aux progrès dans laconnaissance des mécanismes de la fibrogenèse hépatique, différentes substances d’intérêt poten-tiel en clinique ont pu être identifiées. Ainsi, les dosages sériques de composants de la matriceextracellulaire, de leurs produits de dégradation, ou d’enzymes impliquées dans leur métabolismeont été proposés en tant que tests biologiques directs d’évaluation de la fibrose hépatique. Desétudes récentes ont montré que la combinaison de plusieurs paramètres dont les valeurs évoluentindépendamment avec le developpement de la fibrose, permet d’etablir des scores de fibrose.

1.3.1 Les paramètres du bilan hépatique, marqueurs indirects de fibrose hé-

patique

Certains éléments habituels du bilan hépatique sont des marqueurs indirects de fibrose hépa-tique. On y trouve, par exemple, l’activité des transaminases (ALAT), le taux de prothrombineou le nombre de plaquettes.

L’activite ALAT

L’activite ALAT sérique marqueur de lésion hépatique apporte une information même si lacorrélation avec le score de fibrose reste faible. Cette relation tient au fait que le niveau d’ALATcirculante est non seulement régulé par la cytolyse qui la libère, mais aussi par l’efficacité deson élimination qui est hépatique et diminue avec le developpement de la fibrose. Comparée à labiopsie hépatique, l’activité ALAT n’a qu’un intérêt modeste pour évaluer la fibrose hépatique.

Chapitre 1 La fibrose hépatique Julien CHAIGNEAU - 30 août 2006

1.3 Les marqueurs non invasifs de fibrose hépatique 5

Cependant il faut prendre en consideration que chez la plupart des malades qui présentent uneactivité ALAT normale de manière persistante, il existe moins de fibrose, laquelle se développeplus lentement que chez les malades qui ont une activité ALAT augmentée.

Le nombre de plaquettes

Le nombre de plaquettes, marqueur d’hypertension portale, présente une valeur prédictive dediagnostic de cirrhose. Cependant, les tests sanguins à usage diagnostique ne sont pas conseillésen dépistage de fibrose car ils sont peu sensibles. Ainsi, un cas de cirrhose sur cinq présente unbilan biologique normal avec cette méthode de dépistage.

Le taux de prothrombine

Le taux de prothrombine (TP), et lui seul, est un marqueur de cirrhose ou de fibrose sé-vère, reproductible et peu onéreux. II serait même plus un marqueur de fibrose hépatique qued’insuffisance hépatique. La performance diagnostique du TP a éte évaluée dans une étude pros-pective chez 243 malades ayant une maladie chronique d’origine alcoolique ou virale C [1]. Enanalyse multivariée, le TP est une variable prédictive indépendante du diagnostic de fibrose oude cirrhose, avec une performance diagnostique élevée (86 %) pour le diagnostic de fibrose sévère

(score superieur ou egal à 3 dans la classification de Metavir), et ceci quelque soit la cause. Laconstruction des courbes ROC a permis aux auteurs de sélectionner une valeur seuil de 85 % duTP avec une valeur prédictive négative supérieure à 90 % pour le diagnostic de cirrhose. Cetteperformance est peu influencée par d’autres variables telle qu’une hépatite alcoolique [2], et desresultats analogues ont été retrouvés dans une population de malades alcooliques [3].

1.3.2 Les marqueurs directs de fibrose hépatique

Les dosages sériques de différentes substances qui entrent dans la composition de la matriceextracellulaire ou qui ont un rôle dans sa synthèse ou dans sa dégradation ont été développéset evalués en tant que marqueurs directs de fibrose hépatique. En effet, leur présence est im-portante dans le foie fibrotique et leur concentration sérique est modifiée au cours des maladieshépatiques chroniques. En raison du manque de spécificité de la plupart, seul un petit nombrede ces marqueurs possède un intérêt en pratique clinique.

Le PIIINP

Parmi les composants de la matrice extracellulaire, le PIIINP est le premier à avoir suscitél’intérêt pour les maladies chroniques du foie. Au cours du développement des maladies dufoie qu’elles soient alcooliques, virales ou auto-immunes, sa concentration sérique augmente.Cependant, le PIIINP apparait plus comme un marqueur de fibrogénèse que comme un marqueurdu stade de développement de la fibrose. La corrélation avec le score histologique de fibrose estfaible et le PIIINP sérique est surtout élevé en cas de lésions hépatiques actives.

La laminine, le collagène de type IV ou son fragment 7S

La laminine, le collagène de type IV ou son fragment 7S font partie des composants desmembranes basales et s’accumulent précocement dans l’espace perisinusoidal, notamment dansla maladie alcoolique du foie. Leurs concentrations sériques sont élevées chez les malades cirrho-tiques et il existe une corrélation entre ces marqueurs et les scores histopathologiques de fibrose.Cependant, leur valeur diagnostique est variable en fonction des études et inférieure à celle del’acide hyaluronique.

Chapitre 1 La fibrose hépatique Julien CHAIGNEAU - 30 août 2006

1.3 Les marqueurs non invasifs de fibrose hépatique 6

L’acide hyaluronique

L’acide hyaluronique est considéré aujourd’hui comme le plus fiable des marqueurs directs.L’acide hyaluronique est étudié en tant que marqueur de fibrose parce qu’il est produit par lescellules étoilées du foie, il entre dans la composition de la matrice extracellulaire du foie et estéliminé de la circulation par les cellules endothéliales du foie. Dans le sang, sa demi-vie est brève(2 à 9 min). Sa concentration est comprise entre 10 et 100 µg/L et augmente avec l’âge. Destravaux ont montré que chez les patients atteints de maladie hépatique, les concentrations sériquesd’acide hyaluronique sont plus élevées que chez les sujets en bonne santé, particulièrement en casde cirrhose. Cette augmentation peut s’expliquer par deux mecanismes pathologiques. Ce sont,d’une part, une augmentation de production d’acide hyaluronique par les cellules étoilées du foie,et, d’autre part, une diminution de son élimination hépatique. Des études récentes ont montré unebonne corrélation entre l’acide hyaluronique et les scores histologiques semi quantitatifs de fibroseau cours de différentes hépatopathies chroniques [4]. Alors que jusqu’en 2002, la seule méthodede dosage commercialisée en France nécessitait l’utilisation de radioéléments, il est actuellementpossible de réaliser son dosage, inscrit à la nomenclature des actes de biologie médicale, parune méthode utilisant la liaison à une protéine spécifique et un marquage enzymatique. L’acidehyaluronique donne essentiellement de bons résultats pour des cas de fibrose développée.

1.3.3 Les scores de fibrose hépatique

Les travaux les plus récents évaluent des scores combinant plusieurs paramètres sanguins, afind’améliorer les performances diagnostiques des tests qui, pris individuellement, ont peu de valeurdiagnostique. Ces scores associent des paramètres dont les concentrations sériques augmententà des paramètres dont les concentrations diminuent et pour lesquelles le développement de lafibrose entraine soit une modification de la production, soit une diminution de l’é1iminationhépatique.

Le FIBROTEST

Le FIBROTEST correspond à un index de fibrose qui combine le dosage dans le sang de 5marqueurs indirects de fibrose, avec un ajustement selon l’âge et le sexe de la personne.

Le FIBROTEST peut fluctuer entre 0.00 et 1.00 :

– Pour les scores de fibrose entre 0.00 et 0.10 la probabilité de fibrose significative est in-férieure à 10% et un traitement n’est habituellement pas recommandé en l’absence desymptômes ou de risque de transmission.

– Pour les scores de fibrose entre 0.60 et 1.00 la probabilité de fibrose significative est supé-rieure à 90% et un traitement est habituellement recommandé.

– Pour les scores de fibrose entre 0.10 et 0.60 la biopsie du foie est conseillée pour estimerplus précisément le stade de fibrose.

Autres scores

D’autres scores ont été décrits [5, 6] et eux aussi ont pour objectif de substituer à la biopsiedu foie des examens de biologie courants. En particulier, Forns et all. [6] ont récemment montréla bonne valeur prédictive négative d’un score associant des parametres simples (âge, gammaglutamyl transpeptidase, cholestérol, plaquettes) pour la fibrose cliniquement significative. Celapermettrait de ne pas réaliser de biopsie chez plus du tiers des patients atteints d’hépatitechronique C.

Chapitre 1 La fibrose hépatique Julien CHAIGNEAU - 30 août 2006

1.3 Les marqueurs non invasifs de fibrose hépatique 7

Conclusion

Comme nous venons de le voir, plusieurs techniques existent pour évaluer la fibrose. Néan-moins, la biopsie reste le seul examen précis et fiable pour quantifier une fibrose pouvant entrainerune thérapie. Cette précision joue un rôle très important car elle va permettre un diagnostic pré-coce, notament pour la stéatose. Ainsi, le patient pourra recevoir un traitement adapté à temps.

La quantification de la fibrose sur des lames de biopsie se fait actuellement visuellementen routine clinique. L’expert qualifie alors l’échantillon dans une classe (0 à 4) selon la surfacedu tissu fibreux. Des études très récentes menées par le Professeur CALES (CHU d’Angers)montrent que la distribution du tissu fibreux (basée par exemple sur la dimension fractale) estun bon prédicteur du pourcentage de fibrose. Mais pour ce faire, il est nécessaire de numériserl’image et de classer chaque pixel comme représentatif du tissu fibreux ou non représentatif dutissu fibreux. En effet, il est inenvisageable de demander à l’expert d’évaluer qualitativement ladimension fractale des images par simple visualisation.

L’acquisition des images numériques couleur des zones à étudier sur les lames de biopsie sefait avec un microscope relié à une caméra CCD et un ordinateur. Pour sélectionner ce qui seraconsidéré comme représentatif de fibrose en noir et comme non représentatif de fibrose en blanc(Fig. 1.1), un seuillage manuel est réalisé sur l’image en niveau de gris qui après test est apparueêtre la composante verte de l’image couleur d’origine. Ce seuillage manuel consiste à déplacer surl’histogramme de l’image un curseur représentatif du seuil (Fig. 1.1). Cette méthode entraine unenon reproductibilité du procédé qui est très expert dépendant. Il est donc nécessaire de mettreau point une méthode automatique et fiable qui permet de quantifier la fibrose. La méthode laplus adaptée est la classification qui va permettre de savoir quels sont les pixels représentatifs dela fibrose. La segmentation par détection de contour n’est pas adaptée à ce problème.

Fig. 1.1 – Représentation du seuillage réalisé manuellement par l’expert. En déplaçant le curseur, il choisit enrouge la zone qu’il considère comme représentative de la fibrose

Chapitre 1 La fibrose hépatique Julien CHAIGNEAU - 30 août 2006

Chapitre 2

Les méthodes de classification

2.1 Généralités sur la classification

Les méthodes de classification ont pour objectif de regrouper des objets en groupes ou classesd’objets homogènes. Les objets regroupés ont des caractéristiques communes et sont similaires,mais se distinguent clairement des objets des autres classes. Dans le cas de mon stage, la classi-fication va permettre de qualifier les pixels représentatifs du tissu fibreux.

2.1.1 Méthodologie de la classification

Les procédures de classification automatiques des objets sont constituées de deux phasesfondamentales :

– une phase d’apprentissage dont le but est de déterminer un espace de représentation dessignaux et de rechercher les paramètres discriminants capables de caractériser chaque classed’objets ;

– une phase de reconnaissance au cours de laquelle on attribue à une classe chacun desdifférents objets inconnus dans l’espace de représentation déterminé durant l’apprentissage.

La phase d’apprentissage permet de définir des règles de décision à partir d’un ensembled’objets de référence (ou base d’apprentissage), dont on connaît l’identité a priori (étiquette) etqui sont représentatifs de chaque classe.La phase de classement (ou de reconnaissance) consiste à attribuer les objets que l’on proposede reconnaître à une des classes définies lors de l’apprentissage.

2.1.2 Les types de classification

Il existe deux grands types de méthodes de classification :

– la classification supervisée, qui est aussi appelée méthode discriminante, suppose que l’ondispose d’un ensemble d’échantillons dont on connait la classe d’appartenance. Le nombrede classes des échantillons étiquetés est donc connu. Le but est d’ajuster les paramètres duclassifieur pour classer le plus correctement les échantillons par rapport aux échantillonsde la base d’apprentissage.

– la classification non supervisée (clustering), regroupant des éléments ayant les mêmes pro-priétés statistiques, géométriques ou linguistiques. Elle utilise un critère de regroupementqui peut être basé sur des distances entre objets (K-means, algorithmes sphériques, nuéesdynamiques ...) où sur des appartenances floues (LAMDA, Fuzzy C-means,...)

Dans notre étude, la méthode mise en œuvre sera de préférence non supervisée afin de réduirela dépendance du résultat au choix d’un expert.

2.2 Etat de l’art des méthodologies de quantification de la fibrose hépatique 9

2.2 Etat de l’art des méthodologies de quantification de la fibrose

hépatique

Les méthodes déja mises en œuvre pour la quantification de la fibrose font intervenir différentsprocédés de seuillage (morphologie mathématique [2], seuillage de Kurita [7]), une autre méthodeutilise le logiciel Photoshop pour extraire la zone de fibrose [8]. Cependant :

– les études n’utilisent pas toutes le même colorant pour marquer la fibrose (trichrome deMasson [8],[9], picrosirius rouge [7]).

– les études ne portent pas toutes sur les même cas de fibroses (début de fibrose [10], fibroseavancée [9]...).

De plus, la plupart des études ne se font que sur des images couleur converties en niveaude gris ([2],[7],[11],[12]). La couleur n’est donc pas exploitée. Or, la prise en compte des troiscomposantes couleur permettra a priori une meilleure précision dans la classification.

2.3 Une méthode de classification supervisée pour les images cou-

leur

La classification couleur peut se faire dans différents espaces de couleur (RGB, L*a*b*...)et les techniques sont variées (ligne de partage des eaux, classification floue [13]...). Nous avonssélectionné 5 méthodes de classification couleur ([14],[15],[16],[17],[13],[18]). L’objectif n’était pasd’avoir le plus grand nombre de méthodes à tester mais surtout d’exploiter des techniques biendifférentes de classification.

2.3.1 Calcul de distance dans l’espace L*a*b*

Changement d’espace couleur

Cette méthode inspirée de [19] consiste à travailler dans l’espace L*a*b* qui est un espaceluminance-chrominance, L* étant la luminance, a* et b* représentent la chromaticité liée respec-tivement à l’opposition vert-rouge, et à l’opposition bleu-jaune. Le passage de l’espace RGB versl’espace L*a*b* se fait en deux étape. Tout d’abord, on passe de l’espace RGB vers l’espace XYZqui est un système de primaires. La transformation de RGB vers XYZ est linéaire (Equ. 2.1) etles coefficients de la matrice de passage P sont déterminés par rapport à un blanc de référencequi conditionne les valeurs associées aux primaires X, Y et Z.

X

Y

Z

=

2.7690 1.7518 1.1300

1.0000 4.5907 0.0601

0 0.0565 5.5943

R

G

B

(2.1)

Ensuite, on passe de l’espace XYZ vers l’espace L*a*b*. Dans ce système, l’amplitude per-ceptuelle de la couleur est définie en termes d’échelles de couleurs opposées couvrant l’intégralitédu spectre visible par l’oeil humain. La représentation spatiale de cet espace est donnée par unesphère (Fig.2.1).

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.3 Une méthode de classification supervisée pour les images couleur 10

Fig. 2.1 – Représentation spatiale du modèle L*a*b*

Le passage du modèle XY Z au modèle L*a*b* s’obtient à partir des relations non-linéairesdonnées ci-dessous :

L∗ = 116 ×

(

Y

Y0

) 13

− 16 siY

Y0> 0.008856 (2.2)

L∗ = 903.3Y

Y0sinon

a∗ = 500 ×

(

f

(

X

X0

)

− f

(

Y

Y0

))

a∗ = 300 ×

(

f

(

Y

Y0

)

− f

(

Z

Z0

))

avec f(x) = x13 si x > 0.008856 et f(x) = 7.787x + 16

116 sinon

– L* mesure la luminance et par conséquent l’opposition noir-blanc par une valeur compriseentre 0 (noir) et 100 (blanc).

– a* mesure l’opposition vert-rouge par une valeur comprise entre -100 et +100 (a* estpositif si la couleur contient du rouge, négatif si la couleur contient du vert et nulle si ellene contient aucune des deux).

– b* mesure l’opposition bleu-jaune par une valeur comprise entre -100 et +100 (b* estpositif si la couleur contient du jaune, négatif si la couleur contient du bleu et nulle si ellene contient aucune des deux).

– X0, Y0, Z0 désignent les coordonnées XY Z de l’illuminant, c’est à dire du blanc de réfé-rence.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.3 Une méthode de classification supervisée pour les images couleur 11

Principe de la méthode de classification dans l’espace L*a*b*

Cette méthode est basée sur une étude de corrélation des valeurs L*, a* et b* d’un pixelavec les valeurs L*, a* et b* représentatives d’une classe préalablement définie. Il est doncnécessaire de sélectionner manuellement sur l’image les n zones correspondant aux différentesclasses (Fig.2.2), on calcule les moyennes de a* et b* pour chaque zone (moy_1_a et moy_1_bpour la zone 1, moy_n_a et moy_n_b pour la zone n). On obtient donc un vecteur marqueuravec les moyennes de a* et de b* pour chaque classe.

Fig. 2.2 – Sélection manuelle des classes sur l’image originale couleur

Les valeurs a* et b* de chromaticité de chaque pixel sont alors comparées avec les valeurs desn classes par calcul de la distance euclidienne (équation 2.3). Le pixel étudié est alors associé àla classe la plus proche (distance la plus faible).

dn =√

(a − moy_n_a)2 + (b − moy_n_b)2 (2.3)

Même si ce procédé de calcul de distance euclidienne dans l’espace L*a*b* s’avère être efficace,il reste tout de même opérateur dépendant. Il est donc interressant d’étudier d’autres techniquesnon supervisées.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 12

2.4 Les méthodes de classification non supervisées pour les images

couleur

2.4.1 Maximisation de la ressemblance

Cette méthode simple travaille sur une composante de l’image. En observant l’histogrammede chaque composante couleur (R,G,B) de l’image (Fig.2.3) on s’aperçoit que la composante verteprésente un histogramme avec deux sommets bien distincts séparés par une vallée profonde. Deplus, lorsque les médecins réalisent leur seuillage manuel sur l’image en niveau de gris, cettedernière se trouve être la composante verte de l’image couleur sur le système.

La maximisation de la ressemblance se fait avec deux images, l’image de la composanteverte et l’image binarisée de cette composante. Dans un premier temps on binarise l’image de lacomposante verte avec un seuil, puis on calcule le coefficient d’intercovariance normalisé entre lacomposante verte et l’image binarisée. On réitère l’opération pour tous les seuils compris entre0 et 255. Pour chaque seuil on a donc un coefficient d’intercovariance qui s’y réfère. Le seuiloptimal à utiliser pour la binarisation de notre image est le seuil correspondant au coefficientd’intercovariance maximum. Il ne reste alors plus qu’à comptabiliser le nombre de pixels de fibrosepour établir un pourcentage de fibrose de l’échantillon. Le schéma (Fig.2.4) résume l’algorithmede calcul mis en place pour cette méthode.

Fig. 2.3 – Représentation des 3 composantes RGB et de leur histogramme

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 13

Fig. 2.4 – Algorithme de maximisation de la ressemblance

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 14

2.4.2 Méthode des K-means

Cette méthode non supervisée, souvent considérée comme une référence en classification, apour objectif de regrouper les pixels en k régions distinctes [18], k étant le nombre de classes vouluet fixé par l’utilisateur. L’algorithme se base sur l’intensité des couleurs. On affecte aléatoirementchaque pixel à une région et on itère le processus de classification comme suit :

– Les centres des différents groupes sont recalculés.

– Chaque pixel est affecté à un groupe en fonction du centre le plus proche.

– La convergence est atteinte lorsque les centres sont fixes

Nous pouvons formuler cela de la manière suivante :

Chacun des pixels (x1, x2, ..., xn) est attribué aléatoirement à un groupe k grâce à la fonction :

f : {x1, ..., xn} → {1, ..., k} (2.4)

xi → f(xi)

Le calcul des barycentres Ck de chacun des k groupes se fait par moyennage des points dugroupe f−1(1), ..., f−1(k) :

Ci = card(f−1(i))−1 ×∑

x∈f−1(i)

x (2.5)

La réaffectation de chaque pixel au groupe dont le centre est le plus proche s’exprime ainsi :

f(xi) = argminl∈1,...,k ‖xi − Cl‖ (2.6)

Les étapes représentées par les équations (2.5) et (2.6) sont répétées jusqu’à ce que les bary-centres soient fixes. Cela revient à minimiser l’expression suivante :

J =n

i=1

∥xi − Cf(xi)

2(2.7)

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 15

2.4.3 Méthode Fuzzy C-means

Afin de gérer l’imprécis (qui n’est pas déterminé de façon exacte) et l’incertain (qui est peusûre) [13], nous avons également étudié une méthode de classification floue. La théorie des sous-ensembles flous et les outils de raisonnement qui en découlent, proposent un cadre formel quipermet de modéliser le langage naturel et de gérer l’imprécis et l’incertain.

La classification floue

La logique peut être définie comme une étude mathématique formelle des méthodes, de lastructure, de la validité de déduction et de la preuve mathématique. D’après Hilbert, la logiqueformelle a cherché à concevoir une formulation complète et cohérente des mathématiques. Ainsiles propositions pourraient être formellement déclarées et prouvées en utilisant un petit nombrede symboles avec des sens bien définis.

Une forme très simple de logique se traduit par l’étude de tables de vérité qui sont le fondementdes circuits logiques numériques dans lesquels une sortie dépend d’une combinaison d’élémentsdu circuit (ET, OU, NAND, NI, PAS, XOR, ...) et des valeurs d’entrée. Dans un tel circuit, lesvaleurs à chaque point peuvent prendre les seules valeurs ’vrai’ (1) ou ’faux’ (0). Une premièregénéralisation de ce type simple de logique où les valeurs possibles sont ’vrai’, ’faux’ et ’indécis’est appelée la ’three-valued logic’ ou logique à trois valeurs.

La logique floue quant à elle, interpole la logique classique par une fonction d’appartenancequi prend des valeurs continues entre 0 et 1. En effet, cette logique est fondée sur le fait que leraisonnement humain est basé sur des données imprécises ou incomplètes. Par exemple, si l’onveut déterminer si une personne est de petite ou de grande taille cela s’avère facile pour n’importelequel d’entre nous, sans nécessairement connaître sa taille. En revanche, un ordinateur travaillesur des données exactes. Il doit non seulement connaître la taille exacte de la personne maiségalement posséder un algorithme qui divise immanquablement une population en deux groupesbiens distincts : les grands et les petits. L’idée de la logique floue est de transmettre cette richessedu raisonnement humain à un ordinateur.

Bien que dans l’esprit de tout le monde le mot ’flou’ soit de connotation négative, il n’en estrien en réalité. Dans le monde technologique, le mot ’flou’ est un terme technique représentantl’ambiguïté ou le caractère vague des intuitions humaines plutôt que la probabilité.

Les fonctions d’appartenance

Afin de comprendre ce qu’est un sous ensemble ’flou’, nous allons d’abord présenté la notionde sous ensemble ’net’. Ainsi, un sous ensemble A de X est défini par la fonction caractéristiqueχA. χA est nul si les éléments x de X n’appartiennent pas à A. Sinon, χA vaut 1.

Un sous ensemble ’flou’ A de X est défini par la fonction d’appartenance µA. µA(x) est ledegré d’appartenance de x à A et a une valeur comprise entre 0 et 1.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 16

Le principe du Fuzzy C-means

La méthode Fuzzy C-means (FCM) est une méthode non supervisée de classification quipermet à un ensemble d’objets d’être répartis en un certain nombre de classes [17]. Cette méthodequi a été développée par Dunn en 1973 et approuvée par Bezdek en 1981, est fréquemment utiliséedans la classification. Elle est basée sur la minimisation de la fonction objective suivante :

Jm(U, V, Y ) =c

i=1

n∑

k=1

(µik)md2

ik (2.8)

avec :

– Y : l’image à analyser,

– V = (v1, v2, ..., vc) : les centroïdes (c étant le nombre de classes),

– U =t (µ11, µ21, ..., µc1, µ12, µ22, µc2, ..., µck) : appartenance du pixel yk à la classe i,

– m ≥ 1 : degré de ’fuzzyfication’ fixé (m = 2), + m augmente, + les classes se chevauchent,

– dik : distance euclidienne du pixel yk au centroïde ci.

L’algorithme du Fuzzy C-means

L’algorithme du Fuzzy C-means peut se présenter avec ses différentes étapes de la façonsuivante :

1. Choix du nombre de classe c et de la précision ǫ.

2. Initialisation des centroïdes V et de la matrice d’appartenance U = 0.

3. Calcul des centroïdes V ti (t : numéro de l’itération) avec l’équation suivante :

Vi =

∑nk=1 µikyk

∑nk=1 µik

(2.9)

avec i le numéro de la classe et n le nombre de pixels de l’image.

4. Mise à jour de U avec :

µik =1

∑cj=1

(

dik

djk

)2/(m−1)(2.10)

5. Itération de 3) et 4) jusqu’à quasi-immobilisation des centroïdes :∥

∥V t − V t−1∥

∥ < ǫ

Une fois l’algorithme terminé, il ne reste plus qu’à attribuer à chaque pixel une classe enfonction de son degré d’appartenance calculé.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 17

La classification floue probabiliste considère que pour chaque point k, la somme des degrésd’appartenance doit être égale à 1 (

∑ci=1 µik = 1).

Afin d’alléger l’influence de la contrainte probabiliste, l’algorithme c-Means possibiliste a étéproposé par Krishnapuram [20]. La fonction objective est définie alors comme suit (Eq. 2.11) :

J(U, V ) =n

k=1

c∑

i=1

µmikd

2ik +

c∑

i=1

ηi

n∑

k=1

(1 − µik)m (2.11)

où ηi est un nombre positif. La mise à jour de la fonction d’appartenance est donnée par(Eq. 2.12) :

µik =1

1 +(

d2ik

ηi

)1

m−1

. (2.12)

avec :

ηi = K

∑Nj=1 µm

ij d2ik

∑Nj=1 µm

ij

(2.13)

Comme défini dans [20], nous choisissons K égal à 1. La mise à jour des centroïdes est donnéepar (Eq. 2.14) :

Vi =

∑nk=1 µm

ikyk∑n

k=1 µmik

(2.14)

Pour notre étude nous utilisons une autre fonction ojective proposée par Michel Menard [21]incluant l’information de Tsallis [22]. L’information de Tsallis permet de prendre en compte mêmeles points loins des centroïdes alors que les autres informations classiques (Shannon, Fisher, . . . )considèrent seulement les voisins locaux.

La fonction probabiliste généralisée

Nous devons minimiser la fonction objective suivante (Eq. 2.15) :

J(U, V ; Y ) =

c∑

i=1

n∑

k=1

µmikd

2ik +

1

λ(m − 1)

c∑

i=1

n∑

k=1

µmik −

1

λ

n∑

k=1

γk(

c∑

i=1

µik − 1) (2.15)

Le premier terme représente la moyenne quadratique, equivalent à la fonction objective deBezdek (Eq. 2.8). Le deuxième terme est l’entropie de Tsallis quand

∑ci=1 µik = 1. Le dernier

terme est la contrainte probabiliste. La minimisation de Eq. 2.15 donne la distribution normaliséede Tsallis (Eq. 2.16) :

µik =1

Zm[1 + λ(m − 1)d2

ik]−

1m−1 (2.16)

où Zm =∑c

j=1[1 + λ(m − 1)d2jk]

−1

m−1 .

L’équation de mise à jour des centroïdes est la suivante (Eq. 2.17) :

Vi =

∑nk=1 µm

ikyk∑n

k=1 µmik

(2.17)

L’algorithme généralisé probabiliste est appelé en anglais Probabilistic Generalized c-Means(FGcM).

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 18

La fonction possibiliste généralisée

Le terme probabiliste∑n

k=1 γk(∑c

i=1 µik − 1) est remplacé par le terme de contrainte possi-biliste 1

λ

∑nk=1 µik. Nous obtenons ainsi l’équation suivante (Eq. 2.18) :

J(U, V ; Y ) =c

i=1

n∑

k=1

µmikd

2ik +

1

λ(m − 1)

c∑

i=1

n∑

k=1

[µmik − µik] −

1

λ

c∑

i=1

n∑

k=1

µik. (2.18)

Le deuxième terme est l’entropie de Tsallis. Le dernier terme est la contrainte possibiliste.La mise à jour de la fonction d’appartenance est donnée par (Eq. 2.19) :

µik =1

[1 + λ(m − 1)d2ik]

1m−1

(2.19)

La mise à jour des centroïdes se fait comme suit (Eq. 2.20) :

Vi =

∑nk=1 µm

ikyk∑n

k=1 µmik

(2.20)

L’algorithme généralisé possibiliste est appelé en anglais Possibilistic Generalized c-Means(PGcM).

Dans notre algorithme nous utilisons successivement les algorithmes FGcM et PGcM. D’abord,nous utilisons l’algorithme FGcM car la contrainte probabiliste nous donne des centroïdes avecplus de régularité. Ensuite, nous initialisons l’algorithme PGcM avec les centroïdes précédem-ment calculé. En effet, pour être stable, l’algorithme PGcM a besoin d’être initialisé près desvrais centroïdes.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 19

2.4.4 Méthode de segmentation des histogrammes 2D

Les méthodes non supervisées décrites précédemment n’exploitent généralement qu’une seulecomposante couleur. Afin d’exploiter toutes les composantes couleur nous nous sommes inspirésdes travaux récents de Angulo Lopez [14]. La méthode mise en œuvre consiste a travailler dansl’espace HLS (Hue, Luminosity et Saturation : teinte, luminosité et saturation) et à faire lasegmentation sur les 2 histogrammes bivariables (H/S et L/S) que l’on obtient à partir de l’imagecouleur.

L’espace HLS

En réalité l’espace utilisé est l’espace IHLS qui est une amélioration de l’espace HLS. L’amé-lioration consiste à passer de la version cylindrique de l’espace HLS à la version conique (Fig.2.5),ce qui revient à remplacer la saturation HLS par la semi-norme max−min. Les trois grandeursde l’espace HLS peuvent être définies de la façon suivante :

1. La teinte qui se trouve être la longueur d’onde prédominante (de 0 à 360 ).

2. La saturation correspondant au degré de mélange de la longueur d’onde prédominante avecle blanc et donc au niveau de coloration d’une surface indépendamment de sa luminance(de 0 à 1).

3. La luminance qui est l’intensité de la couleur (de 0 à 1).

Fig. 2.5 – L’espace HLS

L’espace IHLS dont la transformation est issue de l’espace HSL est défini comme suit :

H =g − b

(max(r, g, b) − min(r, g, b))si r = max(r, g, b) (2.21)

H =b − r

(max(r, g, b) − min(r, g, b))+ 2 si g = max(r, g, b)

H =r − g

(max(r, g, b) − min(r, g, b))+ 4 si b = max(r, g, b)

L = 0.213r + 0.715g + 0.071b

S = max(r, g, b) − min(r, g, b)

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 20

Histogrammes bi-variables Luminance/Saturation et Teinte/Saturation

Lorsqu’on travaille avec des images couleur et après le choix d’un espace de représentation,il y a deux alternatives classiques à suivre : soit les trois histogrammes scalaires sont étudiésséparément soit un histogramme 3D est construit, dit habituellement histogramme couleur, enreprésentant les trois composantes couleur dans le même diagramme. Evidemment, les histo-grammes 3D sont beaucoup plus riches et intéressants pour une connaissance globale du contenuspectral d’une image. Cependant, dans les espace de type HLS on tombe très vite sur la difficultéde mettre ensemble les trois coordonnées (forme conique). Nous allons exploiter un chemin in-termédiaire. Nous allons construire deux histogrammes bi-variables. Le premier, en coordonnéescartésiennes, pour mettre ensemble la luminance et la saturation, hLS ou L/S ; et le deuxième, encoordonnées polaires, pour la teinte et la saturation hρ

HS ou H/S. Dans la représentation HLS,les composantes teinte et saturation contiennent toutes les deux l’information chromatique. Pourchacun des pixels, la teinte nous donne le domaine de la couleur tandis que la saturation est dé-finie comme la chromaticité ou pureté de la couleur. C’est à dire que pour une teinte constante,rouge par exemple, des valeurs différentes de la saturation produisent des pixels rouges qui vontdu rouge vif au rouge foncé. Lorsque la saturation est basse, la nature du pixel est principale-ment achromatique (noir, blanc ou gris), selon une intensité de gris donnée par la composanteluminance. Ainsi, la modélisation des histogramme H/S et L/S permet de séparer l’informationachromatique (histogramme L/S) et l’information chromatique (histogramme H/S). D’ores etdéjà, on peut constater la présence de la saturation associée aussi bien à la luminance qu’à lateinte.

Cette représentation comporte un avantage de simplicité dans la manipulation des données,puisqu’il ne s’agit que de deux tableaux bi-dimensionnels. Ceci permet aussi de normaliser lesdeux histogrammes pour les mettre dans deux images numériques. L’interprétation par retourinverse vers l’image couleur d’origine, aide à segmenter cette dernière. Une fois les histogrammescontenus dans une image, on pourra les traiter (filtrer, segmenter ...) comme une image quel-conque.

Nous allons commencer par décrire la méthode d’obtention des images des histogrammes. Soitf une image couleur, ses composantes dans un espace couleur de type HLS sont les trois imagesnumériques (fH ,fL,fS). Nous pouvons donc définir deux histogrammes. L’un qui va associer lacomposante teinte et la composante saturation : hρ

HS . La composante teinte est une magnitudeangulaire (avec des valeurs entre 0 et 360 ) et la saturation est linéaire (entre 0 et 1). Parconséquent, hρ

HS sera défini en coordonnées polaires. L’autre histogramme, hLS , est basé sur unecombinaison de l’information des composantes luminance et saturation (toutes les deux avec unevariation comprise entre 0 et 1). Etant donné que l’on cherche à traiter les histogrammes à l’aidedes opérateurs morphologiques, ceux-ci doivent être normalisés et mis à l’échelle d’une imagenumérique. Pour tous les deux, nous proposons d’utiliser une image de taille 256 × 256 pixelset 256 niveaux de gris (8 bits). D’autre part, pour pouvoir être capable d’identifier facilementles groupements ou "clusters" associés aux régions les plus significatives (les plus grandes), il estrecommandé de choisir une échelle logarithmique.

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 21

En résumé, nous avons :

– hLS : donné par l’image numérique fLS(X), où la luminance est la dimension horizontaleet la saturation la dimension verticale (l’origine est le coin inférieur à gauche) :

fLS(X) =

[

log(hLS(x, y))

max(log(hLS(x, y)))

]

255 (2.22)

où X = (x, y), x = fL ∈ [0, 255], y = fS ∈ [0, 255] et hLS(x, y) est le nombre d’occurencesde la paire (x, y).

Un exemple d’histogramme 2D L/S est donné sur la figure (2.6).

– hρHS : représenté par l’image numérique fHS(X) en plaçant l’origine dans le point (127,127),

avec la teinte comme coordonnée angulaire et la saturation comme coordonnée radiale :

fHS(X) =

[

log(hρHS(x, y))

max(log(hρHS(x, y)))

]

255 (2.23)

où X = (x, y), x = (fS/2)cos(fH) ∈ [−127, 127] ≡ [0, 255], y = (fS/2)sin(fH ∈ [−127, 127] ≡[0, 255] (fS ∈ [0, 255], fH ∈ [0 , 360 ]) et hρ

HS(x, y) est le nombre d’occurences de la paire(x, y).

Un exemple d’histogramme 2D H/S est donné sur la figure (2.7).

Les histogrammes L/S et H/S étant définis, nous allons approfondir maintenant leur étude.

Fig. 2.6 – Histogramme 2D L/S Fig. 2.7 – Histogramme 2D H/S

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 22

Segmentation couleur par "clustering" des histogrammes 2D

Nous avons au départ deux histogrammes et en conséquence, après les avoir segmentés, nousaurons deux partitions. L’idée derrière l’approche de segmentation présentée ci-dessous est demanipuler séparément l’information chromatique et l’information achromatique. Par la suite,nous fusionnerons les deux partitions et de cette manière nous obtiendrons une partition couleurfinale.

Segmentation des histogrammes 2D par LPE

La ligne de partage des eaux (LPE) est l’un des outils les plus puissants pour la segmentationd’images. Soit LPE(f) la LPE de l’image numérique f (le même algorithme est valide pour lesdeux images, donc f est soit fHS soit fLS). On rappelle que la LPE associe un bassin versant àchaque minimum de la fonction [23]. La LPE fournit aussi un "clustering" autour de chacun desminima.

Afin d’enlever le bruit de discrétisation introduit par les équations (2.22) et (2.23), nousdevons commencer par lisser l’image f au moyen d’un filtre Gaussien (taille 3 × 3), g = G(f).Cependant, après le filtrage, g contient beaucoup de maxima non pertinents. Or, nous savonsque l’usage de la LPE sur une fonction sans préparation mène à une sur-segmentation trèsforte, et donc l’image de l’histogramme serait sur-"clustered". Par conséquent, les maxima nonsignificatifs doivent être enlevés. Il est possible de déterminer les maxima les plus significatifsen choisissant ceux qui ont le contraste le plus fort. Suivant [24] et [25], nous proposons deconsidérer les n maxima de plus grande dynamique comme les n modes les plus significatifs.Une érosion permet de supprimer les autres maxima. L’image avec les n maxima est dénotéeh. Puisque la LPE fonctionne à partir des minima, nous devons prendre le négatif (l’inverse del’image histogramme) avant d’appliquer la transformation LPE, w = LPE(h). Chaque bassinversant dans l’image w a une étiquette spécifique.

Cependant, pour améliorer la segmentation de l’histogramme fHS autour de la zone centrale(autour de l’origine du système polaire), il est possible de fixer un seuil de saturation µs. Celaconsiste donc à calculer l’histogramme 2D fHS seulement pour les pixels qui vérifient fS > µS . Lesfigures (2.8) et (2.9) illustrent respectivement l’application de la LPE sur les deux histogrammes2D L/S et H/S.

Fig. 2.8 – Application de la LPE sur L/S Fig. 2.9 – Application de la LPE sur H/S

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 23

La détermination du seuil µS se fait en travaillant sur l’histogramme de la saturation hS [n].Afin d’obtenir automatiquement µS , on emploie une technique de seuillage morphologique quise déroule en trois étapes :

1. Lissage de l’histogramme hS [n]

2. Détemination des 2 maxima de l’histogramme (pics de plus fort contraste (Fig.2.10)) : n1

et n2. Le contraste est la différence de hauteur entre le pic et la vallée qui le sépare du picvoisin le plus élevé.

3. Le critère de variance minimum C permet alors d’obtenir la meilleure partition µS del’histogramme.

CµS=

µS∑

n=nmin

(n − n1)2hS [n] +

nmax∑

n=µS

(n − n2)2hS [n] (2.24)

Fig. 2.10 – Histogramme de la saturation avec la représentation en rouge des 2 pics n1 et n2

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

2.4 Les méthodes de classification non supervisées pour les images couleur 24

Partition des images couleur grâce aux histogrammes segmentésUne fois que les histogrammes ont été segmentés, la segmentation w est employée comme

un tableau de correspondance pour classifier chaque pixel p de l’image couleur initiale. Nousobtenons ainsi deux partitions associées à l’image couleur f : PLS(f) et PHS(f) (Fig. 2.11).

Ensuite, il ne reste plus qu’à savoir comment les deux partitions obtenues peuvent être com-binées. La partition PHS(f) est une bonne représentation des régions chromatiques et PLS(f) estune représentation acceptable des achromatiques. Nous proposons la stratégie suivante. PrenonsfS , la composante saturation, nous pouvons la seuiller par µS (de même valeur que précédement)afin d’obtenir une clé binaire, XS , qui classifie tous les pixels comme chromatique ou achroma-tique. Avec XS (Fig. 2.11), les partitions chromatiques et achromatiques sont fusionnées (Fig.2.12) par la valeur de saturation avec l’équation suivante :

PHLS(f) = (PHS(f) ∧ XS) ∨ (PLS(f) ∧ XS) (2.25)

– ∧ : opérateur logique ET.– ∨ : opérateur logique OU.

Fig. 2.11 – De gauche à droite : partition PLS (3 classes), partition PHS (2 classes) et binarisation de lasaturation : Xs.

Fig. 2.12 – Résultat après la fusion des partitions PHLS (5 classes).

Chapitre 2 Les méthodes de classification Julien CHAIGNEAU - 30 août 2006

Chapitre 3

Résultats

Toutes les méthodes ont été implémentées sous Matlab, exceptée la méthode de classificationdans l’espace L*a*b* qui était disponible dans la Toolbox Matlab [19]. Trois séries d’acquisitionsont été réalisées, montrant certaines lacunes dans le protocole d’acquisition.

3.1 Première série d’acquisitions

Lorsque nous avons commencé à appliquer les différentes méthodes de classification, nousavons d’abord travaillé à partir d’images acquises en décembre 2005 (Fig. 3.1). L’analyseurd’image sur lequel ces images ont été acquises est le Leica Q550 IW.

Afin de comparer les résultats, les trois images acquises en décembre 2005 ont prélablementété seuillées manuellement par un médecin. Un tableau résumant les pourcentages de fibroseobtenus pour chaque méthode est donné en Annexe B. Nous représentons les résultats sousforme de courbes en traçant les résultats obtenus par nos méthodes en fonction des résultats desexperts (Fig. 3.2). Cela permet de connaitre le coefficient de corrélation R (plus R2 est prochede 1 et plus la méthode est bonne).

Fig. 3.1 – Images couleur originales acquises en décembre 2005.

3.2 Deuxième série d’acquisitions 26

Fig. 3.2 – Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour l’acquisition dedécembre 2005.

Nous pouvons constater que toutes les méthodes donnent des résultats en adéquation avecles valeurs manuelles ce qui rend impossible la sélection d’une méthode. Ces bons résultatss’expliquent par le fait que ces images ne présentent que deux classes très distinctes (une defibrose en rouge et de non fibrose en jaune), la stéatose n’est alors plus visible.

3.2 Deuxième série d’acquisitions

Afin d’améliorer la qualité des images lors de l’acquisition, nous avons décidé de refaire unedeuxième série d’acquisitions en mars 2006 au laboratoire de cytologie histologie. L’analyseurd’image étant le même que celui utilisé en décembre 2005. Cette journée très enrichissante nousa permis de souligner certains problèmes.

Tout d’abord, afin de tester la robustesse des méthodes face à l’acquisition, nous avons ac-quis plusieurs images à partir d’un même échantillon en modifiant des paramètres tels que laluminosité et le contraste. Le résultat s’est avéré surprenant puisque les images obtenues varientvraiment en fonction de ces paramètres (Fig. 3.3).

Un autre problème qu’il faut souligner est la difficulté rencontrée par l’expert pour réaliserson seuillage manuellement sur les images. En effet, cela se constate si l’on observe le résultat duseuillage de l’expert pour un même échantillon mais avec des paramètres d’acquisition différents(Fig. 3.4). Si le seuil choisi est trop grand afin de sélectionner toute la zone de fibrose, il se peutque l’on choisisse aussi une zone n’étant pas considérée comme de la fibrose. Et à l’inverse, si onveut éviter de sélectionner des zones de non-fibrose, on risque de ne pas prendre toute la zonede fibrose.

Tout comme pour la première série d’acquisitions, nous avons tracé les résultats de nosméthodes de classification en fonction des résultats de l’expert (Fig. 3.5). Cette fois, on remarquetout de suite que certaines méthodes se détachent des autres et sont plus robustes quelque soitl’image couleur originale. Ainsi, la méthode de classification dans l’espace L*a*b* et la méthodeFuzzy C-means sont les plus efficaces avec un coefficient de corrélation le plus proche de 1.

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.2 Deuxième série d’acquisitions 27

Cependant, il ne faut pas oublier que parmi ces deux méthodes, seule la méthode FuzzyC-means est non supervisée. En Annexe C figure un tableau récapitulatif des résultats obtenuspour cette deuxième série d’acquisitions.

Fig. 3.3 – Images couleur acquises en mars 2006 sur un même échantillon avec des paramètres différents.

Fig. 3.4 – Difficulté du seuillage par l’expert : à gauche, 22.55% de fibrose, à droite, 17.87% de fibrose.

Cette serie d’acquisitions a mis en évidence la dépendance du seuillage manuel avec les pa-ramètres d’acquisition. De plus, les images acquises sont visuellement différentes des imagesobservées dans l’objectif du microscope, images que les experts ont l’habitude de traiter en rou-tine clinique. Lors de leurs premières acquisitions (qu’il faut placer dans le cadre d’une rechercheclinique), les anatomopathologistes n’avaient pas remarqué la dépendance des résultats avec lesparamètres d’acquisition. Compte tenu de l’environnement du système d’acquisition (situé dansle bureau d’un médecin, pièce avec une grande fenêtre ...), il sera difficile de mettre au point unprotocole d’acquisition reproductible.

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.2 Deuxième série d’acquisitions 28

Cependant, le fait de réaliser une série d’acquisition sur un même échantillon avec des pa-ramètres différents nous a permis de tester concrètement la robustesse de chaque méthode. Eneffet, il ne faut pas oublier que notre objectif est de développer une méthode robuste, c’est à direefficace pour tout type d’images couleur.

Fig. 3.5 – Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour l’acquisition demars 2006.

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.3 Vers un nouveau système d’acquisition 29

3.3 Vers un nouveau système d’acquisition

Comme nous pouvons le constater avec les deux premières séries d’acquisition, le systèmeactuel n’est pas encore optimal et doit faire face à plusieurs problèmes :

– le balayage de l’échantillon : le système doit proposer un échantillonage de la biopsie parun procédé automatique de déplacement de la lame sous l’objectif,

– les images obtenues sont différentes de ce que l’on peut voir en réalité au microscope cequi n’aide pas les experts lors de leur seuillage manuel.

Si l’on tient vraiment à obtenir des images correctes cela implique la mise en place d’un proto-cole d’acquisition rigoureux et contraignant pour les médecins (fixer la luminosité, les contrastessur les différentes composantes couleur ...).

Lors d’une réunion en avril 2006, il a été évoqué l’achat d’un nouveau système d’acquisi-tion (ScanScope) plus performant. Le système permet une acquisition complète de l’ensemble dela lame. L’image acquise au format *.svs (Scanscope Virtual Slide) sera alors de grande taille(14000×19000 pixels). Un logiciel de visualisation ImageScope.exe, permet de sélectionner direc-tement sur l’ordinateur la zone voulue pour l’étude. Les acquisitions sont plus réalistes (Fig. 3.6)au niveau des couleurs par rapport aux images acquises par le système précédent. Mais l’achatd’un tel système d’acquisition n’est encore qu’à l’étude car son prix reste élevé (100 K euros).

Fig. 3.6 – Principe du nouveau système d’acquisition.

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.3 Vers un nouveau système d’acquisition 30

Pour tester nos différentes méthodes, nous avons néanmoins disposé d’une image d’une lamede biopsie hépatique présentant de la fibrose et de la stéatose. Pour illustrer les résultats obtenusavec les différentes méthodes, nous présentons tout d’abord l’image couleur (Fig.3.7) d’une régionde la lame. Un anatomopathologiste a réalisé manuellement le seuillage sur cette image. Nousdisposons donc d’une image de référence seuillée par un expert (Fig.3.8). Le pourcentage defibrose (pixels noirs) mesuré manuellement et qui servira de référence est de 32,5%. Les imagesbinaires obtenues après classification sont présentées : figure 3.9 pour la méthode L*a*b*, figure3.10 pour la maximisation de la ressemblance, figure 3.11 pour les K-means, figure 3.12 pour leFuzzy C-means et figure 3.13 pour la méthode de segmentation des histogrammes 2D.

Fig. 3.7 – Image couleur d’une région de la lameFig. 3.8 – Image binarisée par l’expert : 32.5% defibrose

Fig. 3.9 – Classe fibrose après classification dansL*a*b* : 31% de fibrose

Fig. 3.10 – Image binarisée par maximisation dela ressemblance : 41.4% de fibrose

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.3 Vers un nouveau système d’acquisition 31

Fig. 3.11 – Classification K-means avec 3 classes,représentation de la classe fibrose : 37.25% de fibrose

Fig. 3.12 – Classification C-means avec 3 classes,représentation de la classe fibrose : 32.25% de fibrose

Fig. 3.13 – Méthode de segmentation des histogrammes 2D : en noir 32.9% de fibrose

Un tableau en Annexe D récapitule les résultats présentés ci-dessus pour chaque méthodesur la zone étudiée de la lame virtuelle acquise par le nouveau système. Cette analyse a étéitérée sur 10 régions de la lame présentant des pourcentages de fibrose variant de 1% à 60%.Les courbes de corrélation aux pourcentages de fibrose définis par les experts sont présentéesfigure 3.14. Les méthodes C-means et K-means sont appliquées avec trois classes car les imagesétudiées en présentent bien trois : tissu sain, tissu fibreux, stéatose + veine. La maximisationde ressemblance n’est en fait vraiment efficace que si l’histogramme d’une des composantescouleur présente deux pics suffisamment représentatifs de la fibrose et de la non fibrose. Enanalysant les résultats, la classification dans l’espace L*a*b*, les K-means, le Fuzzy C-meansainsi que la méthode de segmentation des histogrammes 2D apparaissent comme les méthodesles plus efficaces. En effet, ce sont ces méthodes qui permettent d’obtenir la meilleure corrélation.Cependant, la classification dans l’espace L*a*b* est supervisée et la méthode de segmentationdes histogrammes 2D semble moins robuste en fonction de la qualité de l’image. Ainsi, les K-means et le Fuzzy C-means paraissent être les algorithmes les plus performants.

Cependant, il apparait nettement que les résultats ne sont pas satisfaisant dans le cas oùla fibrose est peu importante (Fig.3.15). En effet, l’histogramme ne contient alors aucun pic defibrose (Fig.3.16) et il devient alors impossible de trouver la classe correspondante. Ceci explique

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

3.3 Vers un nouveau système d’acquisition 32

le taux de corrélation (0,7) de la méthode C-means alors que le résultat présenté figure 3.12était très satisfaisant. D’ailleurs, le taux de corrélation monte à 0.99 pour le C-means si lespourcentages de fibrose inférieurs à 25% ne sont pas pris en compte alors que pour les K-meansce taux ne monte pas. C’est pourquoi, nous avons cherché a améliorer notre classification pourles cas de faible fibrose.

Fig. 3.14 – Courbes de tendance de chaque méthode en fonction des résultats de l’expert pour le nouveausystème d’acquisition.

Fig. 3.15 – Image couleur avec peu de fibroseFig. 3.16 – Histogramme de l’image avec peu defibrose : absence de pic de fibrose

Chapitre 3 Résultats Julien CHAIGNEAU - 30 août 2006

Chapitre 4

Optimisation du Fuzzy C-means

Les améliorations proposées ont pour but de rendre la classification Fuzzy C-means efficacemême pour de faible taux de fibrose. Après avoir exploité, sans succès, différents espaces couleur,nous proposons une version "orientée" de la classification Fuzzy C-means qui peut rendre laméthode robuste aux faibles taux de fibrose.

4.1 L’étude des espaces couleur

De nombreux autres espaces couleurs existent et chacun a sa particularité. Nous pouvons lesclasser dans différentes catégories :

– les systémes de primaires : RGB, XY Z, CMY ...,– les espaces luminance chrominance : AC1C2, Y Ch1Ch2, Y UV , Y IQ, L∗a∗b∗ ...,– les systèmes perceptuels : L∗C∗H∗, HLS, IHLS ...,– les systèmes d’axes indépendants : I1I2I3.

Nous avons voulu étudier si, le fait de changer d’espace couleur pouvait améliorer la classifi-cation notament en cas de faible fibrose. Certains espaces n’ont pas été étudiés car ils sont le plussouvent utilisés pour la vidéo (Y UV , Y IQ). De plus, certains espaces présentent des similaritésavec d’autres d’un même système. Nous avons donc sélectionné trois espaces appartenant à dessystèmes différents : soit les espaces L∗a∗b∗, HLS et I1I2I3. Les transformations pour obtenirles espaces L∗a∗b∗ et HLS ont été évoquées dans le chapitre 2.

4.1.1 L’espace I1I2I3

Le principal inconvénient du système RGB est que ses trois composantes sont fortementcorrélées. Chaque composante possède une information de luminance. Des auteurs ont donccherché à développer des systèmes de représentation où chacune des composantes serait décorréléeet pourrait être traitée indépendamment. Le passage du système RGB au système I1I2I3 s’effectuepar les équations suivantes.

I1

I2

I3

=

1/3 1/3 1/3

1/2 0 −1/2

−1/4 1/2 −1/4

R

G

B

(4.1)

4.1.2 L’étude des histogrammes

Pour chaque espace nous avons étudié les histogrammes des différentes composantes afin devoir si il y avait la possibilité de faire ressortir la classe de fibrose (Fig.4.1, Fig.4.2, Fig.4.3). Ons’aperçoit que même le changement d’espace ne permet pas d’obtenir un pic pour la fibrose.

4.1 L’étude des espaces couleur 34

La composante verte de l’espace RGB reste donc la composante la plus interressante. Il adonc fallu orienter nos recherches dans une autre direction que les espaces couleur pour réglernotre problème.

Fig. 4.1 – Histogramme pour chaque composante dans l’espace L∗

a∗

b∗.

Fig. 4.2 – Histogramme pour chaque composante dans l’espace HLS.

Fig. 4.3 – Histogramme pour chaque composante dans l’espace I1I2I3.

Chapitre 4 Optimisation du Fuzzy C-means Julien CHAIGNEAU - 30 août 2006

4.2 Orientation de la classification Fuzzy C-means 35

4.2 Orientation de la classification Fuzzy C-means

Le problème qui intervient lorsqu’il y a très peu de fibrose est que l’histogramme ne présenteplus de pic pour cette classe. Ainsi, l’algorithme ne parvient pas a trouver le centroïde de cetteclasse. C’est pourquoi nous avons pensé orienter la classification afin d’avoir de bons résultatsquelque soit la proportion de fibrose dans l’image étudiée. Pour orienter la classification, il faut aupréalable positionner les centroïdes à des valeurs proches de la réalité. Ensuite il suffit d’appliquerl’algorithme Fuzzy C-means.

Afin d’orienter notre classification nous proposons de selectionner trois régions sur notrelame : une région contenant beaucoup de fibrose, une autre avec beaucoup de tissu sain et enfinune avec beaucoup de stéatose (Fig.4.4). Les histogrammes de chacune de ces images présententalors un pic correspondant à la classe majoritaire. La somme de ces trois histogrammes nousdonne alors un histogramme comportant trois pics bien distincts représentant chaque région denotre lame. L’application de notre algorithme Fuzzy C-means sur cette histogramme nous donnela position des 3 centroïdes. Nous allons les utiliser pour orienter la classification. Ensuite, pourclassifier n’importe quelle zone de notre lame, il suffit d’initialiser la position de nos centroïdesaux valeurs trouvées précédemment, puis d’appliquer l’algorithme Fuzzy C-means possibiliste(PGcM). Un schéma (Fig.4.4) résume les étapes décrites précédemment.

La figure 4.5 compare pour un histogramme correspondant à un cas de faible fibrose laposition des centroïdes calculés sans orienter la classification et en orientant la classification .Lorsque la classification n’est pas orientée, on constate tout de suite que le centroïde pour laclasse de fibrose n’est pas correctement placé et par conséquent le résultat de la classification nesera pas exact.

Les résultats obtenus par nos deux méthodes (sans orienter et en orientant la classificationFuzzy) en fonction des résultats des experts sont présentés sur la figure 4.6. Le fait d’orienter laclassification permet à l’algorithme d’être efficace quelque soit le pourcentage de fibrose présentdans l’image étudiée.

Chapitre 4 Optimisation du Fuzzy C-means Julien CHAIGNEAU - 30 août 2006

4.2 Orientation de la classification Fuzzy C-means 36

Fig. 4.4 – Etapes permettant l’obtention des centroïdes qui orienteront la classification. Sélection des régionsavec beaucoup de tissus sain (1), avec beaucoup de fibrose (2) et beaucoup de stéatose (3). Recherche des centroïdessur l’histogramme résultant de la somme des 3 histogrammes de chaque région.

Chapitre 4 Optimisation du Fuzzy C-means Julien CHAIGNEAU - 30 août 2006

4.2 Orientation de la classification Fuzzy C-means 37

Fig. 4.5 – Pour un cas de faible fibrose, position des centroïdes (en rouge) calculés avec l’algorithme FuzzyC-means (à gauche) et avec l’algorithme fuzzy C-means orienté (à droite).

Fig. 4.6 – Courbes de tendance de la méthode Fuzzy C-means et de la méthode Fuzzy C-means améliorée enfonction des résultats de l’expert pour le nouveau système d’acquisition.

Nous proposons donc ici une méthode C-means "orientée" demandant une intervention simplede l’expert et résolvant les problèmes de détection des zones présentant peu de fibrose.

Chapitre 4 Optimisation du Fuzzy C-means Julien CHAIGNEAU - 30 août 2006

Conclusion et perspectives

Nous avons implémenté et testé cinq méthodes de classification dont chacune exploite unalgorithme différent. Nous avons ainsi pu comparer l’efficacité de l’ensemble de ces méthodes.Nous constatons alors que la méthode Fuzzy C-means se rapproche le plus des résultats obtenuspar les experts et cela quelque soit la qualité de l’image acquise. De plus cette méthode nonsupervisée donne des résultats équivalents à une méthode supervisée. Ce projet a nécessité denombreuses recherches bibliographiques sur la quantification de la fibrose hépatique et sur laclassification d’images couleur.

Les résultats obtenus pendant ce stage ont permis de bien progresser et les résultats semblentconcluant. Cependant, la partie évaluation doit encore être plus précise. En effet, l’évaluationd’une méthode ne se fait que par comparaison des taux de fibrose calculés et définis par l’expert.Cela permet seulement une évaluation quantitative. Une vérification plus précise demande uneétude de la répartition spatiale de cette fibrose. En effet, un pourcentage identique ne signifiepas forcément que ce sont les bons pixels qui ont été mis dans la classe de fibrose. De plus, ilpourrait être interressant de mettre en place une classe d’ambiguïté pour les pixels dont on n’estpas vraiment certain s’ils font parti de la classe fibrose ou non. Ainsi, l’expert pourrait insérerl’information spatiale (voisinage spatial) pour classer définitivement les pixels de cette classed’ambiguïté.

J’ai apprécié d’avoir à travailler en relation direct avec le domaine médical et j’ai été trèsinterressé par mon sujet de stage. J’ai également pu me rendre compte des différents problèmesrencontrés par les experts lors de leur quantification manuelle de la fibrose.

Cette expérience a été très enrichissante et a confirmé mon envie de travailler dans ce domaine.

Annexe A

Présentation du foie humain

Le foie est un organe très important, aussi bien par sa taille que par le rôle qu’il assure auniveau physiologique. Concernant sa couleur, le foie est rouge brun. Il a une consistance assezferme et cependant il est friable et fragile. Son poids est d’environ 1.5 kg sur le cadavre. Chezle vivant, le foie contient en plus 800 à 900 grammes de sang. C’est l’organe le plus volumineuxde l’organisme. Il mesure en moyenne 28 cm dans le sens transversal, 16 cm de haut et 8 cmd’épaisseur, dans la région la plus volumineuse du lobe droit.

A.1 Anatomie du foie

Le foie est un organe thoraco-abdominal. La majeure partie de cette glande est logée sous latrès profonde coupole diaphragmatique droite qui sépare le foie du poumon droit et d’une partiedu coeur. Il surplombe la partie droite des viscères abdominaux auxquels le relient d’une partdes vaisseaux (veine porte et artère hépatique qui apportent le sang ; veines sus-hépatiques quien assurent le drainage) et d’autre part les voies biliaires qui permettent l’évacuation de la bilevers l’intestin (Fig.A.1).

Fig. A.1 – Représentation de l’anatomie du foie

Le foie peut être visualisé suivant trois faces, une antérieure (en rapport avec le diaphragme),une inférieure (en rapport avec les viscères abdominaux) et une postérieure (en rapport avec lerachis et la veine cave inférieure).

A.2 Fonctions 40

Le foie est constitué de lobules hépatiques qui sont les unités fonctionnelles de l’organe. Leshépatocytes, qui sont les cellules du foie, sont rangées dans ces lobules en travées rayonnantesautour de la veine centro-lobulaire (VCL). Des espaces portes ou espaces de Kierman séparentces lobules. Dans ces espaces circulent des canalicules bilaires et des vaisseaux sanguins.

A.2 Fonctions

Le foie accomplit des fonctions indispensables à la vie. En effet, étant placé sur le trajet ducourant sanguin qui provient de l’intestin, il peut contrôler tout l’apport alimentaire. Le foiepermet de maintenir le taux de glucose constant dans le sang circulant. Cela permet de fournirà l’organisme un courant incessant de matériaux susceptibles d’être transformés en énergie. Lesrecherches physiologiques ont également mis en évidence la grande polyvalence métabolique dutissu hépatique :

– fonction glycogénique, réglant le taux de glucose sanguin,– fonction de synthèse des protéines,– fonction de synthèse et de dégradation des graisses (lipides),– fonction de détoxication (transformation de poisons),– fonction uréogénétique (élimination, sous forme d’urée, de substances produites par la

dégradation des acides aminés),– fonction bilaire.

Chapitre A Présentation du foie humain Julien CHAIGNEAU - 30 août 2006

Annexe B

Acquisitions de décembre 2005

B.1 Tableau des résultats

Annexe C

Acquisitions de mars 2006

C.1 Tableau des résultats

Annexe D

Tableau récapitulatif des résultats

Fig. D.1 – Tableau récapitulatif des résultats obtenus pour le nouveau système

Bibliographie

[1] Oberti F., Valsesia E., Pilette C., and al. Non invasive diagnosis of hepatic fibrosis orcirrhosis. Gastroenterology 113 1609-1616, 1997.

[2] Pilette C., Rousselet M.C., Bedossa P., and al. Histopathological evaluation of liver fibro-sis : quantitative image analysis versus semiquantitative scores. comparaison with serummarkers. J. Hepatol.28 439-446, 1998.

[3] Tran A., Hastier P., Barjoan E.M, and al. Non invasive prediction of severe fibrosis in patientwith alcoholic liver disease. Gastroenterol. Clin. Biol. 24 626-630, 2000.

[4] Guéchot J., Laudat A., Loria A., Serfaty L., Poupon R., and Giboudeau J. Diagnosticaccuracy of hyaluronan and type III procollagen aminoterminal peptide serum assays asmarkers of liver fibrosis in chronic viral hepatitis c evaluated by roc analysis. Clin. Chem.

42 558-563, 1996.

[5] Forns X., Ampurdanes S., Llovet J.M., and al. Identification of chronic hepatitis c patientswithout hepatic fibrosis by a simple predictive model. Hepatology 36 986-992, 2002.

[6] Kaul V., Friedenberg F.K, Braitman L.E, and al. Development and validation of a modelto diagnose cirrhosis in patients with hepatitis c. J. Gastroenterol 97 20623-2628, 2002.

[7] Marco Masseroli, Trinidad Caballero, Francisco O’Valle, Raimundo M.G. Del Moral, Alejan-dro Pérez-Milena, and Raimundo G. Del Moral. Automatic quantification of liver fibrosis :design and validation of a new image analysis method : comparison with semi quantitativeindexes of fibrosis. J. Hepatology, 2000.

[8] Gamal M. Dahab, Mohamed M. Kheriza, Hussien M El-Beltagi, Abdel-Motaal M. Fouda,and Osama A Sharaf El-Din. Digital quantification of fibrosis in liver biopsy sections :description of a new method by photoshop software. J. Gastroenterology and Hepatology,2004.

[9] Friedenberg MA, Miller L, Chung CY, Fleszler F, Banson FL, Thomas R, Swartz KP, andFriedenberg FK. Simplified method of hepatic fibrosis quantification : design of a newmorphometric analysis application. Liver International, 2005.

[10] Lazzarini AL, Levine RA, Ploutz-Snyder RJ, and Sanderson SO. Advances in digital quanti-fication technique enhance discrimination between mild and advanced liver fibrosis in chronichepatitis c. Liver International, 2005.

[11] Trinidad Caballero, Alejandro Pérez-Milena, Marco Masseroli, Francisco O’Valle, Fran-cisco J. Salméron, Raimundo M.G. Del Moral, and Guillermo Sanchez-Salgado. Liver fibrosisassessment with semi quantitative indexes and image analysis quantification in sustained-responder and non-responder interferon-treated patients with chronic hepatitis c. J. Hepa-

tology, 2001.

[12] Wright M, Thursz M, Pullen R, Thomas H, and Goldin R. Quantitative versus morphologicalassessment of liver fibrosis : semi quantitative scores are more robust than digital imagefibrosis area estimation. Liver International, 2002.

[13] Jean-Charles ATINE. Méthode d’apprentissage floue : application à la segmentationd’images biologiques. Thèse doctorale, Systèmes Informatiques, Laboratoire d’analyse et

d’architecture des systèmes du CNRS, Toulouse, 7 novembre 2005.

BIBLIOGRAPHIE 45

[14] Jésus ANGULO LOPEZ. Morphologie mathématique et indexation d’images couleur. ap-plication à la microscopie en biomédecine. Thèse doctorale, Centre de Morphologie Mathé-

matique, Ecole des Mines, Paris, Décembre 2003.

[15] Alain CLEMENT. Algorithmes et outils informatiques pour l’analyse d’images couleur.application à l’étude de coupes histologiques de baies de raisin en microscopie optique.Thèse doctorale, Traitement des Images et du Signal, Ecole doctorale d’Angers, 5 juillet2002.

[16] Cyril MEURIE. Segmentation d’images couleur par classification pixellaire et hierarchie departitions. Thèse doctorale, Informatique, Ecole doctorale SIMEM, Caen, 25 avril 2002.

[17] Michel Ménard, Vincent Courboulay, and Pierre-André Dardignac. Possibilistic fuzzy clus-tering : unification within the framework of the non-extensive thermostatistics. Pattern

Recognition, 2002.

[18] K means clustering, 2006. http://www.elet.polimi.it/upload/matteucc/Clustering/

tutorial_html/kmeans.html.

[19] Toolbox Matlab : Image Processing. Color Based Segmentation using the L*a*b* colorspace.

[20] R. Krishnapuram. A possibilistic approach to clustering. IEEE Trans. Fuzzy Systems, 1993.

[21] Michel Ménard and Michel Eboueya. Extreme physical information and objective functionsin fuzzy clustering. Fuzzy Sets and Systems, 2001.

[22] C. Tsallis. Entropic nonextensivity : a possible measure of complexity. Fractal, 2000.

[23] Beucher S. and Meyer F. The morphological approach to segmentation : The watershedtransformation. Mathematical Morphology in Image Processing, 1992.

[24] Soilles P. Morphological partitioning of multispectral image. Journal of Electro,ic Imaging,

5, 1996.

[25] Grimaud M. A new measure of contrast : the dynamics. Image Algebra and Morphological

Image Processing III, SPIE Vol.1769, 292-305, 1992.

BIBLIOGRAPHIE Julien CHAIGNEAU - 30 août 2006

Synthèse

La fibrose hépatique, caractérisée par la formation dans le foie d’un tissu cicatriciel en fila-ment, a pour origine les maladies chroniques du foie (métaboliques, virales, parasitaires et/oualcooliques). La fibrose étant dynamique et réversible, il est impératif de la quantifier précisémentet précocément afin d’améliorer le diagnostic et l’évaluation d’un traitement thérapeutique.

De nombreuses méthodes existent pour quantifier cette fibrose mais en routine clinique, labiopsie reste l’examen de référence. L’expert quantifie visuellement la fibrose et la classe enfonction de son degré sur une échelle de 0 (non fibrose) à 4 (stade évolué de fibrose : la cirrhose).Cette méthode d’analyse visuelle des images histologiques nécessite un seuillage manuel du tissufibreux entrainant une mauvaise reproductibilité inter et intra-observateur.

Ce travail présente une quantification automatique et fiable de la fibrose hépatique enexploitant la couleur. Les techniques de classification, applicables aux images couleur, vont per-mettre de sélectionner les pixels représentant la fibrose hépatique. Différentes méthodes ont ététestées et les résultats ont été comparés à ceux définis par les experts.

Parmi les méthodes testées, la méthode du Fuzzy C-means faisant intervenir la notion declassification floue se distingue des autres de par sa robustesse et sa fiabilité. Cependant, pourles zones contenant peu de fibrose, les résultats ne sont pas optimaux ce qui impose d’orienter laclassification. Ainsi, la méthode C-means a été améliorée en une méthode C-means "orientée",demandant une intervention simple de l’expert et résolvant les problèmes de détection des zonesprésentant peu de fibrose.