Gustave Roussy

Data Challenge
JFR 2018

Plusieurs équipes pluridisciplinaires travaillant au développement d'algorithmes d'IA lors des Journées Francophones de Radiologie

COMPUTER VISION
IA
SANTÉ

Contexte

Pour la 1re année, les Journées Francophones de Radiologie en partenariat avec l’Institut Gustave Roussy, accueillent un Forum IA et ont mis en place une démarche unique au niveau national au travers de ce data challenge.

Nous avons travaillé, en collaboration avec des radiologues, sur la détection de lésions méniscales à partir d’IRM du genou.

Nous avons atteint une performance de 84,6% sur une métrique hybride de détection de la présence de lésion, son orientation et sa localisation.

SOLUTION

Filtre de Sobel, augmentation et modèle convolutionnel.

Pré-traitements des images

• Enrichissement des données avec un filtre de Sobel :
Nous avons généré pour toutes les
images une donnée enrichie qui contient les contours

• Normalisation des images : image par image (samplewise)

• Augmentation des données : pour augmenter le nombre d’images et permettre une
meilleure généralisation, nous avons appliqué quelques processus d’augmentation :
o Rotation aléatoire de l’image (au maximum +/- 45 degrés)
o Translation aléatoire horizontale (entre +/- 20% de la longueur).
o Translation aléatoire verticale (entre +/- 20% de la longueur)

.

Modèle et entraînement

Après de multiples entraînements avec des modèles variés (Transfer Learning, Autoencoder, etc.), nous avons finalement choisi l’architecture
suivante :

  • • 3 modèles distincts de classification binaire, entraînés séparément sur les 3 tâches
  • • 3 ou 4 couches convolutionnelles entraînées « from scratch » (kernel : 7, 5, 3, 3 ; filtres : 64, 32, 16, 8)
  • • 3 couches dense : 32, 16, 1
  • • drop-out, léger pour les couches convolutionnelles

L’entraînement est mené avec des paramètres classiques : optimizer=Adam, lr=0.001 (réduite sur les plateaux), batch_size=32, epochs<=200, loss=binary_cross_entropy

Inférence

Le processus de prédiction des images diffère du processus d’entraînement simplement par la
configuration de l’augmentation. Les images sont augmentées par le même processus, mais
avec des valeurs plus faibles pour la rotation (+/- 20 degrés), afin de rester proche de l’image
brute. Nous avons observé empiriquement que cette intuition permettait de meilleures
prédictions. 5 nouvelles images sont ainsi générées, et les prédictions sur les 6 points (image
brute + 5 images générées) sont moyennées pour la prédiction finale.

Bénéfices

Une première participation à une compétition d’imagerie médicale.

Experience

Forts de nos compétences en computer vision, cette compétition nous a permis de nous confronter à un haut niveau à un nouveau sujet : l’imagerie médicale, et par la même occasion d’étendre notre bibliothèque interne de machine learning.

Compétition

Ayant fini 2e au classement (2 équipes premières ex-aequo) sur 11 équipes sans avoir eu l’aide nécessaire à la segmentation des images, un modèle plus simple nous a tout de même permis d’être à seulement 6% de la meilleure équipe (90,6%). Nous avons hâte de participer au prochain challenge !

FOCUS

Quelques visuels de notre démarche.