Publicité en cours de chargement...

Publicité en cours de chargement...

Publicité en cours de chargement...

Continuum soins-recherche : construire des cohortes de patients grâce aux big data

31 mai 2016 - 11:14,
Actualité - DSIH, DD
Le projet Consore d’Unicancer est un moteur de recherche des données des patients à des fins de recherche. Un an après sa présentation au Congrès Big data Paris 2015[i], il commence à se déployer dans les centres de lutte contre les cancers.  

Consore (Continuum soins-recherche) a pour objectif de construire des cohortes de patients pour les maladies rares en se basant sur la richesse des données accumulées dans les dossiers patients des différents centres de lutte contre les cancers.

Agrégation de données multisources

Le moteur de recherche est devenu un outil de data mining permettant de trouver facilement des données textuelles ou structurées dans l’ensemble du système d’information hospitalier (administratif, PMSI, fiches tumeurs, dossier patient, centre de ressources biologiques, Chimio). Consore agrège des données provenant de différentes sources afin de modéliser l’histoire néoplasique du patient. Cette solution devra aider les médecins et les chercheurs à identifier des pathologies ou des situations particulières en vue d’améliorer leur prise en charge ultérieure ou de valider des hypothèses de recherche. Le médecin peut ainsi identifier des patients correspondant à des critères de recherche évolués, consulter l’ensemble des documents de ces patients et rechercher une donnée particulière (toxicité, anomalie moléculaire…) parmi l’ensemble des dossiers patients. De son côté, le chercheur peut constituer une cohorte de patients en vue de la préparation d’un essai clinique en effectuant une comptabilisation des patients atteints d’une pathologie rare ou dont les prélèvements tumoraux ou sanguins révèlent des particularités et valider des hypothèses de recherche.

Un outil développé avec les DSI des centres

Les travaux préalables de préparation avec les DSI ont abouti à un interfaçage entre Consore et le SI de l’établissement pour l’extraction et le traitement des données, mais aussi à la mise au point du processus d’installation grâce à l’implication de binômes médecins/DSI. Consore est développé par la communauté des centres en partenariat avec Intel, Sword et Cisco. Cette première version est vouée à s’enrichir de multiples fonctionnalités. Elle sera installée dans les centres en plusieurs vagues : Bordeaux, Lyon, Marseille en 2016, puis les autres en 2017.

Normalisation des données

L’efficacité d’un tel projet repose notamment sur la définition d’un modèle unifié et l’utilisation de référentiels standards (CDA R2, IHE PAM) qui facilitent le déploiement dans les établissements. Une grande partie de l’information n’existe que sous forme non structurée. Consore s’appuie donc sur les données structurées et les données extraites des documents via les outils de Traitement automatique du langage naturel (Taln). Il détecte ainsi différents types de concepts : Tumeurs, Métastases, Récidives, Formes négatives, Antécédents familiaux et personnels.

Les informations patients sont structurées par des règles de raisonnement qui construisent le parcours néoplasique du patient, en commençant par la détection de l’information, puis hiérarchisées en fonction de la fiabilité de la source. Par exemple, les données PMSI sont plus fiables que celles, non structurées, du dossier patient.

Open Source et adaptabilité

L’architecture applicative est construite majoritairement sur des briques Open Sources comme Apache Camel pour la chaîne de traitement ou ElasticSearch pour le moteur de recherche. L’infrastructure se déploie par ailleurs sur un cluster de serveurs avec une haute disponibilité, adaptable à la charge.

Cette solution permet aussi bien l’interrogation instantanée de millions de documents avec une recherche locale sur 10 millions de documents qu’une recherche fédérée pouvant atteindre 5 millions de patients et plus de 100 millions de documents. Enfin, évolutive par essence, elle pourra notamment être diffusée vers d’autres types d’établissements (CHU/cliniques), intégrer de nouvelles sources (données omiques, imagerie, biologie) et s’étendre à d’autres spécialités médicales que la cancérologie.


[i] Voir DSIH n° 15, mai 2015, page 32.

Avez-vous apprécié ce contenu ?

A lire également.

Illustration Les enjeux de la médecine du futur autour de la data – les multiples ruptures de paradigmes

Les enjeux de la médecine du futur autour de la data – les multiples ruptures de paradigmes

16 fév. 2026 - 23:02,

Tribune

-
Cédric Cartau

Pas de médecine sans donnée : dès lors que le praticien échange avec son patient, dès lors qu’un prélèvement est analysé, des données sont collectées de façon formelle et/ou tracée, qui lui sont indispensables pour la prise en charge. La médecine des prochaines décennies peut être vue et analysée au...

Illustration Données de santé et prévention : comment Dell et Infor abordent le passage à l’échelle

Données de santé et prévention : comment Dell et Infor abordent le passage à l’échelle

16 fév. 2026 - 22:26,

Actualité

- Rédaction, DSIH

Lors de la conférence Prevention & Longévité organisée le 5 février, une table ronde consacrée aux bilans de prévention et aux données de santé a réuni Dell Technologies, Infor et H.B.T Group France autour d’une question centrale : comment structurer l’accès et l’exploitation des données pour permet...

Illustration Quand la prévention devient pilotable : ce que les chercheurs disent vraiment de la médecine de la longévité

Quand la prévention devient pilotable : ce que les chercheurs disent vraiment de la médecine de la longévité

16 fév. 2026 - 22:08,

Actualité

- Rédaction, DSIH

Organisée à l’initiative d’Hicham Temsamani, fondateur de H.B.T Group France, et portée par un conseil scientifique présidé par le Pr Fabrice Denis, la conférence Prevention & Longévité du 5 février a donné la parole à des cliniciens et chercheurs engagés dans un même chantier : transformer la préve...

Illustration Tech&Fest 2026 : la Healthtech à l’honneur

Tech&Fest 2026 : la Healthtech à l’honneur

10 fév. 2026 - 07:17,

Actualité

- Fabrice Deblock, DSIH

À Grenoble, le salon Tech&Fest a consacré une large place aux technologies de santé, entre démonstrations industrielles, levées de fonds et débats sur la gouvernance des données. Start-ups, industriels et acteurs publics y ont présenté des solutions mêlant robotique médicale, dispositifs connectés e...

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

Inscrivez-vous à notre lettre d’information hebdomadaire.