Article de Katrin Crameri dans MIRACUM Journal #3, mars 2020 (traduction du texte original allemand).
Dans le système de santé numérique et d'apprentissage de demain, les soins de santé et la recherche doivent aller de pair. Afin de répondre à cette aspiration, les projets nationaux actuels visent également l'harmonisation et l'interopérabilité au niveau international.
Les efforts sont énormes, mais il n'y a pas d'alternative si l'on veut que la collecte et l'utilisation des données de santé se fassent dans le respect des valeurs européennes. Il n'est pas surprenant qu'il y ait actuellement (enfin) une poussée dans l'informatique médicale européenne. Il est encore temps, même si cela devient plus rare, de positionner et d'équiper les dépôts de recherche nationaux de telle sorte que les citoyens n'aient pas à craindre une fuite en avant.
Permettre la recherche basée sur les données
Dans un environnement où de grandes entreprises et des pays entiers prennent position, la demande de la population pour que leurs données soient ou seront utiles augmente également. Compte tenu de la grande quantité de données sanitaires disponibles aujourd'hui, les décisions en matière de santé ne devraient plus être basées sur des moyennes de population, mais devraient tenir compte des caractéristiques individuelles des patients. Toutefois, seule l'analyse d'une grande quantité de données de patients provenant des soins de routine et d'autres sources est susceptible de susciter des changements pertinents en médecine. Nous parlons ici, par exemple, d'une prévention plus efficace, de soins plus performants et de la possibilité de nouvelles thérapies personnalisées grâce à la recherche fondée sur les données.
En Suisse, le Parlement a alloué un total de 68 millions de francs suisses pour améliorer l'utilisation des données de santé pour la recherche. Dans le cadre du "Swiss Personalized Health Network", une initiative nationale d'infrastructure de recherche (durée : 2017-2020) - similaire à l'initiative d'informatique médicale en Allemagne - nous travaillons depuis trois ans, entre autres, à rendre interopérables les données cliniques de routine, les données d'images et les données issues des examens moléculaires et génomiques de nos cinq hôpitaux universitaires. Une deuxième période de financement jusqu'en 2024 suivra.
Même si la consolidation des données dans la Suisse fédérale est en soi un défi, nous poursuivons également une stratégie d'interopérabilité sémantique uniforme avec l'initiative SPHN. En effet, les points de données ne peuvent que être compris par des humains (c'est-à-dire dans notre cas par des chercheurs issus de disciplines très diverses), mais aussi par les machines s'ils sont formulés avec précision. En ce qui concerne la structuration et la comparabilité (et donc la combinabilité) des données, la terminologie et l'accord sur les normes jouent un rôle important, en particulier pour la recherche - et dans le monde d'aujourd'hui, cela se fait idéalement dans le cadre des efforts internationaux d'harmonisation.
"La numérisation est plus que la simple conversion de l'analogique au numérique. Son objectif devrait être d'obtenir une valeur ajoutée et des avantages pour les soins de santé, en coordination avec les initiatives de normalisation nationales et internationales".
L'avenir appartient à l'interopérabilité durable
Pour le transport et le stockage des données, il faut une solution technique flexible qui permette de transporter les données sans affecter la signification sémantique et qui permette une flexibilité maximale dans la réutilisation des données. Idéalement, le format de transport est indépendant du modèle de données, puisque le choix d'un tel modèle (tel que OMOP, i2b2 ou CDISC) dépend fortement des exigences et des besoins de l'utilisation des données et devrait donc être déterminé par le destinataire plutôt que par le fournisseur de données. Pour y parvenir, le SPHN évalue actuellement le cadre de description des ressources (RDF), une approche couramment utilisée et développée pour répondre à un défi similaire sur le Web.
Une tâche collective herculéenne
La définition de lignes directrices sémantiques est une tâche (collective !) herculéenne, car elle devrait couvrir au mieux tous les domaines et toutes les indications. Pour les chercheurs qui attendent que les données de leurs projets de recherche leur soient fournies par les hôpitaux - l'échange de données au sein du SPHN a toujours lieu dans le respect de toutes les réglementations en matière de protection des données et des normes éthiques - il suffirait en principe que les données soient interopérables au sein de leur projet. Cependant, si nous nous efforçons d'assurer une interopérabilité durable - entre les projets, entre les systèmes, entre les frontières nationales et dans le temps - les solutions de compromis ou les gains rapides ne nous mèneront pas très loin.
Au début de l'initiative suisse, nous avons supposé que nos projets pilotes (Driver projects), qui nous aident à développer et à valider les infrastructures, utiliseraient principalement les données déjà disponibles dans les hôpitaux pour leurs projets de recherche. Cependant, nous avons rapidement constaté que la plupart des projets adoptaient une approche prospective et définissaient, pour chaque projet, les données à partir desquelles ils souhaitaient inclure des groupes de patients afin de répondre à leurs questions. Cela pose en effet des problèmes supplémentaires aux systèmes, car dans certains endroits, les données souhaitées ne sont pas du tout collectées dans le cadre des soins de routine, ou du moins pas de la manière souhaitée, ce qui équivaut à ne pas être disponibles pour la recherche.
Les retards dans la cartographie peuvent entraîner des erreurs
Un autre défi est que la normalisation recherchée n'entre en jeu qu'à la toute fin de la chaîne de traitement des données. Cela signifie que les données sont enregistrées dans les différents systèmes sources des cliniques - non pas sous la forme optimale pour la recherche (aussi structurée et normalisée que possible), mais de la manière habituelle pour les soins, à savoir en grande partie sous forme de texte libre et sans l'utilisation de normes uniformes. Dans les hôpitaux universitaires, les données structurées et non structurées sont généralement transférées dans un "lac de données" (data lake), c'est-à-dire un grand dépôt commun. Ce n'est que lorsque les données requises pour la recherche sont extraites de ce lac ou directement des systèmes primaires et traitées que les spécifications d'interopérabilité recommandées par le SPHN entrent en jeu. Si les données ne sont pas disponibles aux endroits respectifs dans les normes ou la terminologie convenues, une cartographie supplémentaire est nécessaire. Cela est possible si les données primaires sont disponibles dans une granularité suffisamment fine et si des dictionnaires de données sont fournis. Comme ces conditions préalables ne sont souvent pas remplies, une cartographie "tardive" peut entraîner beaucoup de travail et présente un certain potentiel d'erreur.
Les exigences relatives aux données que nous avons du point de vue de la recherche, en termes de structuration et de normalisation, mais aussi de leur qualité, c'est-à-dire leur exhaustivité, leur cohérence, leur validité et leur précision, sont également pertinentes pour l'utilisation dans l'analyse de grandes quantités de données et dans l'intelligence artificielle pour l'acquisition directe de connaissances dans les soins aux patients. Le système a donc un intérêt certain, au-delà de la recherche, à optimiser les processus entourant l'acquisition de données au premier plan.
La numérisation est plus que la simple conversion de l'analogique au numérique, et ne doit pas être utilisée pour elle-même, mais dans le but d'obtenir une valeur ajoutée et des avantages pour les soins de santé, en coordination avec les initiatives de normalisation nationales et internationales. À cet égard, nous avons beaucoup de retard à rattraper, tant en Suisse qu'en Allemagne.