Publicité en cours de chargement...

Publicité en cours de chargement...

Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

26 mars 2026 - 19:08,
Actualité - Rédaction, DSIH
Illustration Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé
Dans un contexte réglementaire européen exigeant, qui garantit un accès et un partage sécurisés des données de santé, le projet PARTAGES apporte une réponse opérationnelle aux défis posés à l’IA en santé. Coordonné par la Plateforme des données de santé (Health Data Hub) et réunissant 32 partenaires français, PARTAGES publie en open data un corpus inédit de plus de 6 000 comptes rendus médicaux de patients fictifs, rédigés et validés par des médecins. Ces documents constituent une ressource stratégique pour entraîner et évaluer des outils d’intelligence artificielle au service des professionnels de santé.

Le développement d’outils d’IA appliqués aux comptes rendus médicaux s’inscrit dans un cadre fortement structurant et protecteur. La réglementation encadre strictement l’accès aux données cliniques, afin d’en garantir l’usage sécurisé, tout en limitant la disponibilité de corpus ouverts et de jeux d’évaluation pour les modèles. Par ailleurs, les systèmes entraînés sur des données cliniques réelles peuvent mémoriser des informations issues de leurs jeux d’entraînement, ce qui rend les modèles eux‑mêmes sensibles et complique leur partage, contribuant à un écosystème fragmenté.

Pour dépasser ces contraintes, un appel a été lancé auprès des associations d’internes et des centres hospitalo‑universitaires partenaires dans le cadre de PARTAGES, démarré en avril 2025. Il a permis de constituer un panel de 120 médecins représentatif de la diversité des spécialités médicales et des territoires, chargé de rédiger un corpus de comptes rendus de patients fictifs. Ce travail collectif aboutit aujourd’hui à un corpus de plus de 6 000 comptes rendus médicaux fictifs, rédigés par ces praticiens à partir de situations cliniques entièrement imaginées. Aucune donnée issue de patients réels n’y figure, ce qui permet un usage libre, sans contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique.

Par son ampleur et la rigueur de sa méthodologie, ce corpus constitue une ressource inédite en France pour l’entraînement, l’évaluation et la comparaison de modèles d’IA au service de l’innovation et des professionnels de santé. Sa publication a été officiellement annoncée le 25 mars lors du comité stratégique de mi‑parcours du projet PARTAGES. Ce livrable résulte d’un travail conjoint de la Plateforme des données de santé et de plusieurs partenaires du projet, dont l’AP‑HP, le LISN et le LIMICS, et fait l’objet d’une publication scientifique : « PARHAF, a human-authored corpus of clinical reports for fictitious patients in French ».

PARTAGES : un projet national au service des communs numériques

Lauréat de l’appel à projets « Communs numériques pour l’intelligence artificielle générative », PARTAGES bénéficie d’un soutien de l’État dans le cadre du plan France 2030 opéré par Bpifrance. Doté d’un budget total de 9,4 millions d’euros sur deux ans (2025‑2027), le projet rassemble un consortium inédit de 32 partenaires : équipes de recherche, groupements d’établissements de santé publics et privés, acteurs deeptech spécialisés en IA. Son ambition est de structurer des ressources ouvertes pour favoriser l’émergence de solutions d’IA générative en santé, au bénéfice des écosystèmes académique, hospitalier et industriel.

Au‑delà du corpus de comptes rendus médicaux fictifs, PARTAGES met à disposition plusieurs autres livrables :

  • un guide méthodologique encadrant la production et la relecture des comptes rendus ;

  • des sous‑ensembles annotés du corpus ;

  • quatre guides d’annotation dédiés aux cas d’usage du projet ;

  • un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) utilisé pour l’entraînement de modèles de fondation.

Cap sur 2027 : modèles spécialisés et évaluation en conditions réelles

D’ici 2027, le consortium PARTAGES développera sept modèles d’IA spécialisés pour des cas d’usage à fort impact : codage des informations médicales, résumé automatique de comptes rendus, détection automatique en infectiologie, analyse de la réponse aux traitements en oncologie, entre autres. Les premiers modèles entraînés, ainsi que leurs protocoles d’évaluation, seront prochainement publiés sur le site de la Plateforme des données de santé. En parallèle, une plateforme nationale d’évaluation fédérée est en cours de développement. Déployée dans 20 hôpitaux et entrepôts de données de santé hospitaliers, elle permettra d’évaluer des algorithmes sur des données réelles dans un cadre réglementaire sécurisé.


Source : communiqué de presse « Publication d’un corpus inédit de comptes-rendus médicaux de patients fictifs en open data pour accélérer l’IA en santé », Plateforme des données de santé (Health Data Hub), 25 mars 2026.

Avez-vous apprécié ce contenu ?

A lire également.

Illustration Interopérabilité opérationnelle : un marché en plein essor

Interopérabilité opérationnelle : un marché en plein essor

14 avril 2026 - 08:53,

Actualité

- Rédaction, DSIH

Après une année 2025 marquée par la reprise du circuit de distribution de l’EAI Infor Cloverleaf dans le secteur de la santé, Health-Comm France aborde 2026 avec une ambition claire : consolider sa place dans un marché où l’interopérabilité, la sécurisation des flux, la structuration des données et ...

Illustration Lancement d’un appel à projets Achats innovants

Lancement d’un appel à projets Achats innovants

14 avril 2026 - 08:34,

Actualité

- Damien, Dubois

Le 10 avril, le ministère de la Santé a annoncé le lancement d’un appel à projets pour accélérer l'adoption d’innovations matures dans les établissements de santé via la commande publique en partenariat entre l’AIS, l’ANAP et la DGOS.

Illustration Speech Processing Solutions dévoile Philips SpeechLive Health, un nouvel assistant IA conçu pour la documentation clinique moderne

Speech Processing Solutions dévoile Philips SpeechLive Health, un nouvel assistant IA conçu pour la documentation clinique moderne

25 mars 2026 - 14:46,

Communiqué

- Speech Processing Solutions

Speech Processing Solutions, leader mondial des solutions professionnelles de dictée et de traitement de la parole commercialisées sous la marque Philips, annonce le lancement de Philips SpeechLive Health, un assistant de documentation clinique basé sur l’IA conçu pour les professionnels de santé. C...

Illustration OSE 2050, un programme pour anticiper le futur de la santé

OSE 2050, un programme pour anticiper le futur de la santé

31 mars 2026 - 08:20,

Actualité

- Damien Dubois, DSIH

Le 23 mars, les HCL, la DGOS et l’AIS ont lancé OSE 2050, un programme de prospective pour imaginer le futur de la santé en associant des experts, des professionnels de santé et des citoyens.

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

Inscrivez-vous à notre lettre d’information hebdomadaire.