Entrepôts de données de santé : la question de la sécurisation

19 juin 2018 - 11:42,
Tribune - Cédric Cartau
Un article(1) récent qui traite de la mise en place de l’entrepôt de données de santé (EDS) à l’AP-HP et rapporte les propos du Pr Lechat lors du 10e Colloque « Données de santé en vie réelle » du 7 juin dernier. Un certain nombre de difficultés et d’enjeux sont évoqués, parmi lesquels la constitution des EDS qui représente sans nul doute la prochaine révolution dans le monde médical et qui transformera autant la pratique dans ce domaine que l’ont changée l’apparition de l’anesthésie, de l’imagerie médicale ou des antibiotiques.  

La mise en œuvre des EDS n’est cependant ni simple sur le plan technique, ni triviale sur le plan de la sécurisation de l’accès aux données. Le Pr Lechat rappelle que ces entrepôts sont nécessaires dans la mesure où il n’est pas envisageable de lancer des requêtes de masse sur une base de données de production tel un DPI ou une base de résultats de biologie – la moindre requête pouvant faire écrouler la base et ses performances. L’une des difficultés concerne la masse des données qu’il faut agréger : en effet, les données seules du DPI n’y suffisent pas – il faut aussi alimenter l’EDS avec les données de biologie, les comptes rendus d’imagerie, etc. Dans un CHU de grande taille, on imagine sans peine la masse de données que cela peut représenter.

La deuxième difficulté est de nature organisationnelle. Devant une telle masse de données et les possibilités qui en résultent, il convient en effet de poser des règles d’accès : même s’il est possible d’anonymiser le résultat de certaines requêtes, dans tous les cas, les données contenues et la plupart des résultats de recherche seront suffisamment identifiants pour qu’il faille cadrer les accès. Il y a plusieurs solutions à ce problème : passage des demandes d’accès et de recherche par un comité de validation, restriction des accès à une équipe réduite qui est seule habilitée à passer sur demande – préalablement qualifiée et validée – des requêtes sur la base, intervenants extérieurs, etc.

Quoi qu’il en soit, les enjeux sont de taille : traçabilité totale des accès à la base – ce qui suppose des accès strictement nominatifs –, formation préalable des personnels habilités (personnellement, je trouve que le Mooc de l’ANSSI(2) constitue un excellent point de départ), formalisation contractuelle des extractions de données (quand un jeu de données sortira de l’EDS, un minimum de garanties sur son devenir devra être prévu), etc. La problématique n’est pas nouvelle : tous les établissements publics ou privés réalisent déjà du « big data » ou du requêtage interne sur des bases RH, mais dans ces conditions, les données et les moulinettes sont à usage strictement interne à la DRH et n’agrègent pas des sources de données diverses ou hétérogènes. La demande de protéger spécifiquement les accès aux données médicales des patients qui sont en même temps des agents de l’établissement est un exemple classique de corrélation : il serait alors nécessaire d’interconnecter la base RH et le DPI, ce qui est bien entendu à proscrire totalement compte tenu des dérives qui pourraient en découler.

Enfin, il y a la question de la conformité au RGPD. Dans un article précédent(3), je proposais une analyse de la position du Dr Laurent Alexandre selon lequel le RGPD allait inexorablement freiner l’innovation, en entraînant une fuite massive des bases, des recherches et des cerveaux, ce qui est bien entendu archifaux, au même titre que la réglementation sur les routes en Europe (une des plus contraignantes au monde) n’a pas entravé l’innovation dans le secteur de l’automobile. Il n’empêche, dans l’esprit du RGPD, on ne peut plus faire n’importe quoi avec les données des gens sans se poser un minimum de questions et, surtout, le principe de minimisation – très sain en général – s’applique à plein pour les EDS. Le DPO va donc être fortement sollicité sur ce sujet, ce que, en tant que citoyen, je ne peux qu’apprécier. Pour l’avoir pratiquée, la minimisation – démontrez-moi que la totalité des champs collectés est strictement indispensable au traitement – est d’une redoutable efficacité, et pas seulement pour les EDS.

Le champ général des requêtes et des évaluations (dans le domaine RH, dans le domaine du soin, dans le domaine financier) est un cas à part dans la cartographie des traitements : par exemple, côté RH, il y a quasiment un traitement par requête, ce qui peut complexifier singulièrement la tâche du DPO, mais certaines des mesures susnommées sont indispensables. Et surtout, le RGPD arrive à point nommé dans le début de la constitution des EDS. Pour une fois, la sécurité n’arrivera pas après la bataille.


(1) http://www.ticsante.com/Premieres-negociations-en-cours-avec-des-industriels-pour-l-acces-aux-donnees-de-l-AP-HP-NS_4100.html 

(2) https://secnumacademie.gouv.fr/ 

(3) /article/2825/le-rgpd-et-l-ia.html  

Avez-vous apprécié ce contenu ?

A lire également.

Illustration Partenariats : comment la cyber-résilience devient un critère de sélection stratégique

Partenariats : comment la cyber-résilience devient un critère de sélection stratégique

02 fév. 2026 - 21:53,

Tribune

-
Nicolas Schneider

En 2024, 749 incidents cyber ont été signalés au CERT Santé (+29 % vs 2023), dont 230 ayant entraîné un mode dégradé ou une interruption de prise en charge, avec des niveaux de gravité et de durée variables selon les contextes. Dans le même temps, les sanctions CNIL atteignent désormais jusqu’à 800 ...

Illustration Pourquoi le parcours patient n’existe pas (encore)

Pourquoi le parcours patient n’existe pas (encore)

02 fév. 2026 - 21:08,

Tribune

-
Félix Mamoudy

Le parcours patient est devenu un mot-clé, presque un slogan. Il est omniprésent dans les discours stratégiques, les projets d’établissement et les feuilles de route numériques. Pourtant, dans les hôpitaux, il reste largement invisible. Les patients ressentent des ruptures, des lenteurs, des incohér...

Illustration D4Evolution 2026 : l’IA pour planifier et le Command Center pour piloter, quand l’efficience hospitalière devient une discipline à part entière

D4Evolution 2026 : l’IA pour planifier et le Command Center pour piloter, quand l’efficience hospitalière devient une discipline à part entière

02 fév. 2026 - 10:55,

Actualité

- Par Pauline Nicolas

Dans un environnement hospitalier caractérisé par d’importantes tensions sur les équipes et une accélération de la transformation numérique, la seconde conférence plénière de l’évènement annuel de Dedalus France a permis de présenter des solutions concrètes pour améliorer l’efficience hospitalière. ...

Illustration Le CHU de Montpellier mobilise 14,9 M€ pour structurer un projet d’intelligence artificielle hospitalière

Le CHU de Montpellier mobilise 14,9 M€ pour structurer un projet d’intelligence artificielle hospitalière

29 jan. 2026 - 13:01,

Actualité

- Rédaction, DSIH

Le CHU de Montpellier a fait état de la mobilisation d’un financement de 14,9 millions d’euros dans le cadre du programme France 2030 pour développer un projet d’intelligence artificielle hospitalière, baptisé Alliance Santé IA. L’initiative vise à structurer des usages d’intelligence artificielle à...

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

Inscrivez-vous à notre lettre d’information hebdomadaire.