
Publicité en cours de chargement...
Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

Le développement d’outils d’IA appliqués aux comptes rendus médicaux s’inscrit dans un cadre fortement structurant et protecteur. La réglementation encadre strictement l’accès aux données cliniques, afin d’en garantir l’usage sécurisé, tout en limitant la disponibilité de corpus ouverts et de jeux d’évaluation pour les modèles. Par ailleurs, les systèmes entraînés sur des données cliniques réelles peuvent mémoriser des informations issues de leurs jeux d’entraînement, ce qui rend les modèles eux‑mêmes sensibles et complique leur partage, contribuant à un écosystème fragmenté.
Pour dépasser ces contraintes, un appel a été lancé auprès des associations d’internes et des centres hospitalo‑universitaires partenaires dans le cadre de PARTAGES, démarré en avril 2025. Il a permis de constituer un panel de 120 médecins représentatif de la diversité des spécialités médicales et des territoires, chargé de rédiger un corpus de comptes rendus de patients fictifs. Ce travail collectif aboutit aujourd’hui à un corpus de plus de 6 000 comptes rendus médicaux fictifs, rédigés par ces praticiens à partir de situations cliniques entièrement imaginées. Aucune donnée issue de patients réels n’y figure, ce qui permet un usage libre, sans contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique.
Par son ampleur et la rigueur de sa méthodologie, ce corpus constitue une ressource inédite en France pour l’entraînement, l’évaluation et la comparaison de modèles d’IA au service de l’innovation et des professionnels de santé. Sa publication a été officiellement annoncée le 25 mars lors du comité stratégique de mi‑parcours du projet PARTAGES. Ce livrable résulte d’un travail conjoint de la Plateforme des données de santé et de plusieurs partenaires du projet, dont l’AP‑HP, le LISN et le LIMICS, et fait l’objet d’une publication scientifique : « PARHAF, a human-authored corpus of clinical reports for fictitious patients in French ».
PARTAGES : un projet national au service des communs numériques
Lauréat de l’appel à projets « Communs numériques pour l’intelligence artificielle générative », PARTAGES bénéficie d’un soutien de l’État dans le cadre du plan France 2030 opéré par Bpifrance. Doté d’un budget total de 9,4 millions d’euros sur deux ans (2025‑2027), le projet rassemble un consortium inédit de 32 partenaires : équipes de recherche, groupements d’établissements de santé publics et privés, acteurs deeptech spécialisés en IA. Son ambition est de structurer des ressources ouvertes pour favoriser l’émergence de solutions d’IA générative en santé, au bénéfice des écosystèmes académique, hospitalier et industriel.
Au‑delà du corpus de comptes rendus médicaux fictifs, PARTAGES met à disposition plusieurs autres livrables :
-
un guide méthodologique encadrant la production et la relecture des comptes rendus ;
-
des sous‑ensembles annotés du corpus ;
-
quatre guides d’annotation dédiés aux cas d’usage du projet ;
-
un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) utilisé pour l’entraînement de modèles de fondation.
Cap sur 2027 : modèles spécialisés et évaluation en conditions réelles
D’ici 2027, le consortium PARTAGES développera sept modèles d’IA spécialisés pour des cas d’usage à fort impact : codage des informations médicales, résumé automatique de comptes rendus, détection automatique en infectiologie, analyse de la réponse aux traitements en oncologie, entre autres. Les premiers modèles entraînés, ainsi que leurs protocoles d’évaluation, seront prochainement publiés sur le site de la Plateforme des données de santé. En parallèle, une plateforme nationale d’évaluation fédérée est en cours de développement. Déployée dans 20 hôpitaux et entrepôts de données de santé hospitaliers, elle permettra d’évaluer des algorithmes sur des données réelles dans un cadre réglementaire sécurisé.
Source : communiqué de presse « Publication d’un corpus inédit de comptes-rendus médicaux de patients fictifs en open data pour accélérer l’IA en santé », Plateforme des données de santé (Health Data Hub), 25 mars 2026.
Avez-vous apprécié ce contenu ?
A lire également.

Le CHU de Montpellier mobilise 14,9 M€ pour structurer un projet d’intelligence artificielle hospitalière
29 jan. 2026 - 13:01,
Actualité
- Rédaction, DSIHLe CHU de Montpellier a fait état de la mobilisation d’un financement de 14,9 millions d’euros dans le cadre du programme France 2030 pour développer un projet d’intelligence artificielle hospitalière, baptisé Alliance Santé IA. L’initiative vise à structurer des usages d’intelligence artificielle à...

France 2030 : l’appel à projets “Pionniers de l’IA” ouvre de nouvelles perspectives pour les hôpitaux
29 sept. 2025 - 13:08,
Communiqué
- Ministère de l'Enseignement supérieur et de la RechercheLe programme France 2030 continue de stimuler l’innovation en France. Le ministère de l’Enseignement supérieur et de la Recherche a récemment lancé l’appel à projets “Pionniers de l’intelligence artificielle”, destiné à soutenir des technologies d’IA de rupture dans des secteurs stratégiques, dont l...

L’Académie de l’IA en santé de la FEHAP
26 mai 2025 - 11:27,
Actualité
- Damien Dubois, DSIHLe 21 mai 2025, lors de SantExpo, la FEHAP a annoncé le déploiement opérationnel de son plan d’actions pour son Académie de l’IA en santé.

SantExpo 2025 | En avant-première : la nouvelle solution de transcription de consultation par l'IA souveraine et éthique signée La Poste Santé & Autonomie
20 mai 2025 - 16:30,
Actualité
- Par Pauline Nicolas, DSIHRemettre l’échange entre le patient et le médecin au centre de la prise en charge. Telle est l’ambition de DALVIA Vox, la nouvelle solution souveraine de reconnaissance vocale et de retranscription basée sur l’IA signée La Poste Santé & Autonomie. Présentation, en direct de cette 59ème édition de Sa...


