Publicité en cours de chargement...

Publicité en cours de chargement...

Publicité en cours de chargement...

Entrepôts de données de santé : la question de la sécurisation

19 juin 2018 - 11:42,
Tribune - Cédric Cartau
Un article(1) récent qui traite de la mise en place de l’entrepôt de données de santé (EDS) à l’AP-HP et rapporte les propos du Pr Lechat lors du 10e Colloque « Données de santé en vie réelle » du 7 juin dernier. Un certain nombre de difficultés et d’enjeux sont évoqués, parmi lesquels la constitution des EDS qui représente sans nul doute la prochaine révolution dans le monde médical et qui transformera autant la pratique dans ce domaine que l’ont changée l’apparition de l’anesthésie, de l’imagerie médicale ou des antibiotiques.  

La mise en œuvre des EDS n’est cependant ni simple sur le plan technique, ni triviale sur le plan de la sécurisation de l’accès aux données. Le Pr Lechat rappelle que ces entrepôts sont nécessaires dans la mesure où il n’est pas envisageable de lancer des requêtes de masse sur une base de données de production tel un DPI ou une base de résultats de biologie – la moindre requête pouvant faire écrouler la base et ses performances. L’une des difficultés concerne la masse des données qu’il faut agréger : en effet, les données seules du DPI n’y suffisent pas – il faut aussi alimenter l’EDS avec les données de biologie, les comptes rendus d’imagerie, etc. Dans un CHU de grande taille, on imagine sans peine la masse de données que cela peut représenter.

La deuxième difficulté est de nature organisationnelle. Devant une telle masse de données et les possibilités qui en résultent, il convient en effet de poser des règles d’accès : même s’il est possible d’anonymiser le résultat de certaines requêtes, dans tous les cas, les données contenues et la plupart des résultats de recherche seront suffisamment identifiants pour qu’il faille cadrer les accès. Il y a plusieurs solutions à ce problème : passage des demandes d’accès et de recherche par un comité de validation, restriction des accès à une équipe réduite qui est seule habilitée à passer sur demande – préalablement qualifiée et validée – des requêtes sur la base, intervenants extérieurs, etc.

Quoi qu’il en soit, les enjeux sont de taille : traçabilité totale des accès à la base – ce qui suppose des accès strictement nominatifs –, formation préalable des personnels habilités (personnellement, je trouve que le Mooc de l’ANSSI(2) constitue un excellent point de départ), formalisation contractuelle des extractions de données (quand un jeu de données sortira de l’EDS, un minimum de garanties sur son devenir devra être prévu), etc. La problématique n’est pas nouvelle : tous les établissements publics ou privés réalisent déjà du « big data » ou du requêtage interne sur des bases RH, mais dans ces conditions, les données et les moulinettes sont à usage strictement interne à la DRH et n’agrègent pas des sources de données diverses ou hétérogènes. La demande de protéger spécifiquement les accès aux données médicales des patients qui sont en même temps des agents de l’établissement est un exemple classique de corrélation : il serait alors nécessaire d’interconnecter la base RH et le DPI, ce qui est bien entendu à proscrire totalement compte tenu des dérives qui pourraient en découler.

Enfin, il y a la question de la conformité au RGPD. Dans un article précédent(3), je proposais une analyse de la position du Dr Laurent Alexandre selon lequel le RGPD allait inexorablement freiner l’innovation, en entraînant une fuite massive des bases, des recherches et des cerveaux, ce qui est bien entendu archifaux, au même titre que la réglementation sur les routes en Europe (une des plus contraignantes au monde) n’a pas entravé l’innovation dans le secteur de l’automobile. Il n’empêche, dans l’esprit du RGPD, on ne peut plus faire n’importe quoi avec les données des gens sans se poser un minimum de questions et, surtout, le principe de minimisation – très sain en général – s’applique à plein pour les EDS. Le DPO va donc être fortement sollicité sur ce sujet, ce que, en tant que citoyen, je ne peux qu’apprécier. Pour l’avoir pratiquée, la minimisation – démontrez-moi que la totalité des champs collectés est strictement indispensable au traitement – est d’une redoutable efficacité, et pas seulement pour les EDS.

Le champ général des requêtes et des évaluations (dans le domaine RH, dans le domaine du soin, dans le domaine financier) est un cas à part dans la cartographie des traitements : par exemple, côté RH, il y a quasiment un traitement par requête, ce qui peut complexifier singulièrement la tâche du DPO, mais certaines des mesures susnommées sont indispensables. Et surtout, le RGPD arrive à point nommé dans le début de la constitution des EDS. Pour une fois, la sécurité n’arrivera pas après la bataille.


(1) http://www.ticsante.com/Premieres-negociations-en-cours-avec-des-industriels-pour-l-acces-aux-donnees-de-l-AP-HP-NS_4100.html 

(2) https://secnumacademie.gouv.fr/ 

(3) /article/2825/le-rgpd-et-l-ia.html  

Avez-vous apprécié ce contenu ?

A lire également.

Illustration L’Occident se fracasse sur Seedance – la cyber face au paradigme de Robin des Bois

L’Occident se fracasse sur Seedance – la cyber face au paradigme de Robin des Bois

24 fév. 2026 - 08:18,

Tribune

-
Cédric Cartau

Impossible de le rater si on s’intéresse un minimum aux évolutions de l’IA : le logiciel Seedance(1), IA spécialisée dans la génération de vidéo d’un réalisme époustouflant, déclenche la colère des Majors américaines : Warner, Disney, Netflix, etc.

Illustration L’approche Calimero de la filière logicielle : quand un responsable passe à côté des enjeux industriels et regarde le doigt plutôt que la lune

L’approche Calimero de la filière logicielle : quand un responsable passe à côté des enjeux industriels et regarde le doigt plutôt que la lune

10 fév. 2026 - 08:14,

Tribune

-
Cédric Cartau

Je suis tombé sur une interview [1] de très bon niveau sur BFM Business : celle de Michel Paulin, président de la filière Logiciels et solutions numériques de confiance, ancien patron d’OVHcloud et de SFR, sur les rapports entre la souveraineté numérique, le rôle de l’État et de la commande publique...

Illustration Pourquoi le parcours patient n’existe pas (encore)

Pourquoi le parcours patient n’existe pas (encore)

02 fév. 2026 - 21:08,

Tribune

-
Félix Mamoudy

Le parcours patient est devenu un mot-clé, presque un slogan. Il est omniprésent dans les discours stratégiques, les projets d’établissement et les feuilles de route numériques. Pourtant, dans les hôpitaux, il reste largement invisible. Les patients ressentent des ruptures, des lenteurs, des incohér...

Illustration 2026 : la fin de l’Espace, du Temps et de la Vie privée

2026 : la fin de l’Espace, du Temps et de la Vie privée

27 jan. 2026 - 08:37,

Tribune

-
Cédric Cartau

Cédric Cartau analyse comment le Fichier national automatisé des empreintes génétiques (Fnaeg), initialement conçu pour lutter contre la criminalité sexuelle, est devenu en moins de 30 ans un outil de fichage de masse. En s’appuyant sur l’essor de la recherche par parentèle, il interroge les conséqu...

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

Inscrivez-vous à notre lettre d’information hebdomadaire.