Publicité en cours de chargement...
Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

Le développement d’outils d’IA appliqués aux comptes rendus médicaux s’inscrit dans un cadre fortement structurant et protecteur. La réglementation encadre strictement l’accès aux données cliniques, afin d’en garantir l’usage sécurisé, tout en limitant la disponibilité de corpus ouverts et de jeux d’évaluation pour les modèles. Par ailleurs, les systèmes entraînés sur des données cliniques réelles peuvent mémoriser des informations issues de leurs jeux d’entraînement, ce qui rend les modèles eux‑mêmes sensibles et complique leur partage, contribuant à un écosystème fragmenté.
Pour dépasser ces contraintes, un appel a été lancé auprès des associations d’internes et des centres hospitalo‑universitaires partenaires dans le cadre de PARTAGES, démarré en avril 2025. Il a permis de constituer un panel de 120 médecins représentatif de la diversité des spécialités médicales et des territoires, chargé de rédiger un corpus de comptes rendus de patients fictifs. Ce travail collectif aboutit aujourd’hui à un corpus de plus de 6 000 comptes rendus médicaux fictifs, rédigés par ces praticiens à partir de situations cliniques entièrement imaginées. Aucune donnée issue de patients réels n’y figure, ce qui permet un usage libre, sans contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique.
Par son ampleur et la rigueur de sa méthodologie, ce corpus constitue une ressource inédite en France pour l’entraînement, l’évaluation et la comparaison de modèles d’IA au service de l’innovation et des professionnels de santé. Sa publication a été officiellement annoncée le 25 mars lors du comité stratégique de mi‑parcours du projet PARTAGES. Ce livrable résulte d’un travail conjoint de la Plateforme des données de santé et de plusieurs partenaires du projet, dont l’AP‑HP, le LISN et le LIMICS, et fait l’objet d’une publication scientifique : « PARHAF, a human-authored corpus of clinical reports for fictitious patients in French ».
PARTAGES : un projet national au service des communs numériques
Lauréat de l’appel à projets « Communs numériques pour l’intelligence artificielle générative », PARTAGES bénéficie d’un soutien de l’État dans le cadre du plan France 2030 opéré par Bpifrance. Doté d’un budget total de 9,4 millions d’euros sur deux ans (2025‑2027), le projet rassemble un consortium inédit de 32 partenaires : équipes de recherche, groupements d’établissements de santé publics et privés, acteurs deeptech spécialisés en IA. Son ambition est de structurer des ressources ouvertes pour favoriser l’émergence de solutions d’IA générative en santé, au bénéfice des écosystèmes académique, hospitalier et industriel.
Au‑delà du corpus de comptes rendus médicaux fictifs, PARTAGES met à disposition plusieurs autres livrables :
-
un guide méthodologique encadrant la production et la relecture des comptes rendus ;
-
des sous‑ensembles annotés du corpus ;
-
quatre guides d’annotation dédiés aux cas d’usage du projet ;
-
un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) utilisé pour l’entraînement de modèles de fondation.
Cap sur 2027 : modèles spécialisés et évaluation en conditions réelles
D’ici 2027, le consortium PARTAGES développera sept modèles d’IA spécialisés pour des cas d’usage à fort impact : codage des informations médicales, résumé automatique de comptes rendus, détection automatique en infectiologie, analyse de la réponse aux traitements en oncologie, entre autres. Les premiers modèles entraînés, ainsi que leurs protocoles d’évaluation, seront prochainement publiés sur le site de la Plateforme des données de santé. En parallèle, une plateforme nationale d’évaluation fédérée est en cours de développement. Déployée dans 20 hôpitaux et entrepôts de données de santé hospitaliers, elle permettra d’évaluer des algorithmes sur des données réelles dans un cadre réglementaire sécurisé.
Source : communiqué de presse « Publication d’un corpus inédit de comptes-rendus médicaux de patients fictifs en open data pour accélérer l’IA en santé », Plateforme des données de santé (Health Data Hub), 25 mars 2026.
Avez-vous apprécié ce contenu ?
A lire également.

Health Data Hub et Microsoft : un cadre juridique clarifié, une souveraineté à construire
23 mars 2026 - 09:58,
Actualité
- Rédaction, DSIHEn validant l’autorisation donnée au Health Data Hub pour traiter des données de santé hébergées par Microsoft en France, le Conseil d’État consolide le cadre posé par la CNIL dans sa décision du 20 mars 2026, relative à l’autorisation CNIL 2025‑013 (délibération n° 2025‑013 du 13 février 2025, proj...

Imprivata lance Agentic Identity Management pour sécuriser et gouverner les agents IA dans le secteur de la santé
11 mars 2026 - 09:52,
Communiqué
- ImprivataImprivata, fournisseur leader de solutions de gestion des identités et des accès pour le secteur de la santé et les industries critiques, vient de dévoiler Agentic Identity Management, de nouvelles capacités conçues pour sécuriser et gouverner les agents IA dans les environnements de soins de santé ...

Un projet de guide sur l’IA en santé soumis à consultation par la HAS et la CNIL
09 mars 2026 - 09:23,
Actualité
- Rédaction, DSIHIssu d’un travail pluridisciplinaire, le projet de guide intitulé « IA en contexte de soins » vise à apporter des éclairages aux professionnels de santé concernant leurs obligations et les bonnes pratiques à adopter. Le document est soumis à consultation publique jusqu’au 16 avril 2026.
La cyber, les bras et le chocolat
09 mars 2026 - 09:00,
Tribune
-S’il est un truc dont l’écosystème cyber ne manque pas (l’écosystème IT aussi, du reste), ce sont les consultants encravatés qui vous expliquent, avec force schémas bien léchés et PowerPoint tout enluminés, qu’il faut aborder la cyber par là, puis par là, avec moult comités Théodule et méthodes perl...
