Inondations : Les données aussi
Au secours, ça déborde !!
L’époque où le stockage des données bureautiques posait problème est largement dépassée. Les millions de fichiers Excel, Word ou Powerpoint sont des petits joueurs face aux images médicales, aux enregistrements audio, vidéo ou « électro » produits quotidiennement par les professionnels de nos hôpitaux. Qu’ils soient radiologues, généticiens, biologistes, chercheurs ou simplement responsables de la sécurité, leurs spécialités génèrent annuellement des dizaines voire des centaines de tera-octets de données qu’il faut stocker, sécuriser et surtout conserver. C’est là que les problèmes commencent.
Et si on faisait le ménage
Pas si simple. Qui a eu l’occasion de migrer une application métier historique vers une nouvelle application le sait bien. Aucun utilisateur, aucune Maîtrise d’Ouvrage n’est prête à renoncer à une reprise intégrale de ses anciennes données. Et quand les problèmes de transcription sémantique rendent impossible le transport des données d’un système vers l’autre on finit par conserver l’ancienne application « en lecture seule », au cas où ….
Evidemment, on se dit qu’on pourrait fixer une date limite : moins de 10 ans, 20 ans, 30 ans ?
Pas si simple
Archiver une base de données ou un fichier indéfiniment, finalement, ça ne pose pas vraiment de problème, en tout cas techniquement, mais surtout parce que les coûts ne sont pas assumés par les demandeurs mais par la DSI. On a beau expliquer que pour relire dans 50 ans un fichier ou une base de données il faudra archiver aussi l’application, ses licences (perpétuelles bien sûr), l’OS dans la bonne version et pour faire tourner tout ça, disposer d’une machine « vintage » en état de marche, rien n’y fait. On peut proposer d’archiver les données dans un format pérenne type PDF-A mais là encore cela nécessite des choix et des arbitrages que les métiers ne sont pas toujours prêt à faire, faute de temps.
Si vous pensez vous en sortir avec la réglementation, ce n’est pas gagné non plus. Je ne vois décemment pas un DSI dire à ses clients internes : la loi dit 10 ans donc moi j’efface tout après 10 ans et un jour !
La valeur de la donnée
L’informaticien basique que je suis se disait donc encore récemment que tout cela était du gâchis car en dehors de quelques cas spécifiques, très peu de données auraient encore de la valeur dans 30 ou 50 ans. C’était compter sans le Big Data !! Toutes ces masses de données qui finissent par s’empiler sans dessus-dessous dans nos baies de stockages, une fois leurs utilisateurs partis en retraite, pourront connaître une nouvelle vie à l’occasion d’un traitement qui détectera des signaux faibles dans cette masse gigantesque d’octets apparemment sans intérêt. Certes on ne sait pas encore faire cela sur des images ou des fichiers audio mais les méthodes d’apprentissage profond développées par les chercheurs en IA le feront certainement prochainement.
Pauvre planète
Du coup je ne vois pas comment sauver la planète de ces flots de données qui nécessitent de plus en plus de matières premières et d’énergie. Y aura-t-il un Noë pour nous construire une arche ? Peut-être… Le RGPD a prévu la fonction de DPO : Data Protection Officer. Pourquoi ne pas créer un DAO : Data Archiving Officer dont la mission serait de déterminer la valeur intrinsèque des données et la pérennité dans le temps de cette valeur. Dure mission certes, surtout qu’après lui…le déluge !
L'auteur :
Thierry Dumoulin est responsable du département Infrastructures numériques et services de proximité au CHU de Nantes. Ingénieur diplômé de l’École centrale de Nantes, où il intervient dans le cursus informatique, il a débuté sa carrière chez un grand constructeur avant de rejoindre les hôpitaux en 1997. Ses différentes missions (direction de projets, démarche qualité…) l’ont conduit à aborder un très large éventail de problématiques dans le domaine du numérique : aspects applicatifs, technologiques, méthodologiques et organisationnels, sécurité des SI.
Avez-vous apprécié ce contenu ?
A lire également.

Comment quantifier un risque
31 mars 2026 - 08:06,
Tribune
-Après avoir expliqué qu’une PSSI et une appréciation des risques ne servaient à rien (ici 1) -mais un peu quand même -, intéressons-nous à un autre sujet brûlant qui déchaîne les passions, pire que JR (2) et la fin du Prisonnier (3) : la quantification du risque.

Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé
26 mars 2026 - 19:08,
Actualité
- Rédaction, DSIHDans un contexte réglementaire européen exigeant, qui garantit un accès et un partage sécurisés des données de santé, le projet PARTAGES apporte une réponse opérationnelle aux défis posés à l’IA en santé. Coordonné par la Plateforme des données de santé (Health Data Hub) et réunissant 32 partenaires...

Health Data Hub et Microsoft : un cadre juridique clarifié, une souveraineté à construire
23 mars 2026 - 09:58,
Actualité
- Rédaction, DSIHEn validant l’autorisation donnée au Health Data Hub pour traiter des données de santé hébergées par Microsoft en France, le Conseil d’État consolide le cadre posé par la CNIL dans sa décision du 20 mars 2026, relative à l’autorisation CNIL 2025‑013 (délibération n° 2025‑013 du 13 février 2025, proj...

Imprivata lance Agentic Identity Management pour sécuriser et gouverner les agents IA dans le secteur de la santé
11 mars 2026 - 09:52,
Communiqué
- ImprivataImprivata, fournisseur leader de solutions de gestion des identités et des accès pour le secteur de la santé et les industries critiques, vient de dévoiler Agentic Identity Management, de nouvelles capacités conçues pour sécuriser et gouverner les agents IA dans les environnements de soins de santé ...
