Publicité en cours de chargement...
Roadmap Produit 2022 du Health Data Hub
26 avril 2022 - 11:57,
Actualité
- DSIHLe Health Data Hub (HDH) met à disposition les données nécessaires aux projets visant l’intérêt public de manière sécurisée et rapide tout en optimisant leur traitement via un panel d’outils à l’état de l’art et, dans la mesure du possible, Open Source. Le Hub a présenté mi-avril une roadmap de ces nouveaux outils et systèmes.
L’espace projet du HDH
Le HDH a ainsi créé un espace projet pour recevoir, stocker, traiter et visualiser les données de santé nécessaires aux projets d’études en toute sécurité.
Cet espace projet est isolé et dédié uniquement à un projet, sans possibilité de transfert des données sur le poste local. Le Health Data Hub garde la maîtrise du poste de travail manipulé à distance par les utilisateurs habilités. En effet, pour le HDH, la sensibilité des données qui y sont manipulées, même si elles sont pseudonymisées, requiert la plus grande attention.
Dans cet espace, des outils permettent de réaliser la préparation, l’annotation, l’analyse et la visualisation des données, mais également de faciliter la collaboration entre les membres d’une même équipe.
Les chantiers 2022
Dans le cadre de la construction progressive de son offre, le HDH a identifié cinq grands chantiers pour 2022, à commencer par l’élargissement du panel d’outils à destination des utilisateurs. Les formats d’imagerie Dicom et JSON, régulièrement utilisés en recherche médicale, pourront être utilisés dans la plateforme technologique du HDH et un viewer Dicom sera mis à disposition. Par ailleurs, Spark, outil de traitement parallélisé des données, sera installé pour faciliter la gestion de la volumétrie des données, qui peut parfois atteindre plusieurs milliards de lignes avec untraitement ou un requêtage sur des heures, voire des journées entières.
L’expérience utilisateur sera améliorée avec le gestionnaire de paquets (Python, R…) nécessaire au projet. Plus de 700 paquets sont actuellement installés. La gestion des demandes, la validation et l’installation des paquets requièrent beaucoup d’actions manuelles. Le HDH mettra à disposition un outil dédié, automatisant ces processus et offrant plus de flexibilité aux projets dans le choix et l’installation de leurs paquets.
Par ailleurs, un portail d’authentification unique sera mis en place afin de permettre aux utilisateurs de se connecter une fois et d’accéder ensuite à toutes les applications. Il sera d’autre part désormais possible d’utiliser R dans JupyterLab.
Autre chantier, la simplification du prétraitement des données pour faciliter leur mise à disposition et pouvoir créer des sous-produits de données, réutilisables, indépendamment d’un projet. Un nouvel espace de préparation non spécifique à un projet sera mis à disposition des référents données du HDH.
La mise en œuvre du RGPD sera facilitée par l’industrialisation de l’exercice des droits relatifs aux données personnelles avec mise en place d’un système de recueil et de traitement des demandes, à travers un formulaire Web accessible aux individus qui souhaitent exercer leurs droits relatifs aux données personnelles.
Enfin, la simplification de l’opérabilité de la plateforme. En effet, chaque projet est réalisé dans un espace dédié. Le HDH industrialise les déploiements et les mises à jour des espaces utilisateurs avec des solutions d’automatisation.