L’Usine Digitale : L’Institut Curie a reçu l’autorisation de la Commission nationale de l’informatique et des libertés (Cnil) pour constituer son entrepôt de données de santé (EDS) en mars 2024. Pourriez-vous nous faire un état des lieux ?
Julien Guérin : Il faut savoir que c’est le premier EDS d’établissement qui répertorie les données de l’ensemble des patients pris en charge par l’Institut Curie, autour de 600 000 patients. Depuis l’autorisation, nous sommes entrés dans une phase dite de mise en conformité, c’est-à-dire que nous devons nous conformer au référentiel EDS.
Il y a un important volet de cette mise en conformité qui concerne la mise en sécurité, à savoir créer des environnements techniques qui soient vraiment hermétiques, soit permettre d’assurer l’exploitation des données dans des cadres tout à fait sécurisés. Cela permet également d’offrir des environnements de travail à nos chercheurs, nos médecins et tous nos partenaires académiques et industriels pour créer des conditions favorables au développement de l’intelligence artificielle. Cet EDS est vraiment l’outil au coeur de notre stratégie.
Est-ce qu’il y a une équipe dédiée à la gestion de cet EDS au sein de l’Institut Curie ?
Tout à fait. Le pilotage de l’entrepôt est assuré par la direction des données. Elle est composée à la fois de data engineers, qui construisent les flux de données qui alimentent l’EDS, et une équipe plus métier, qui accompagne les projets et gère les aspects réglementaires. Le pilotage de l’EDS est également pris en charge par une équipe IT, au sein de la direction des systèmes d’information. Autour de ces équipes, il y a aussi la direction juridique ainsi que certains départements de l’ensemble hospitalier.
Où est stocké cet entrepôt ?
Pour le moment, nous avons fait le choix historique d’héberger l’EDS sur des data centers maintenus à l’Institut Curie. Ce sont des infrastructures redondées, c’est-à-dire qu’il a plusieurs réplicas existants sur les différents sites, ce qui permet en cas de problématique matérielle de ne pas avoir d’interruption de service. Mais la réflexion autour de l’usage du cloud existe.
[…]