QUESTIONS FRÉQUENTES
Lac de données
Qu’est-ce qu’un lac de données?
Un lac de données (data lake) est une méthode d’entreposage impliquant une conservation massive des données brutes dans leur format original ou avec une très faible transformation de celles-ci. Les données sont donc extraites directement des systèmes sources du CHUM et déposées directement dans le lac. À la différence d’un entrepôt de données (data warehouse), le lac de données apporte une flexibilité supplémentaire en permettant de traiter plus d’un type de données.
Le lac de données de CITADEL permet d’intégrer les données des différents systèmes cliniques (laboratoires, dossier clinique, imagerie, signes vitaux, etc.).
Comment fonctionne le lac de données CITADEL?
CITADEL intègre des données clinico-administratives, des données de recherche, de même que des données qui proviennent des différents systèmes d’information du Centre hospitalier de l’Université de Montréal (CHUM) dans son lac de données.
En plus de l’entreposage, le mandat de CITADEL offre un service d’extraction et d’analyse des données adapté aux projets soumis. Concrètement, un utilisateur peut faire une demande d’accès à certaines de ces données. Elles seront extraites du lac, transformées dans un format pertinent, et déposées dans un espace sécurisé du CHUM réservé au projet pour permettre l’analyse de ces données en fonction des besoins.
Les utilisateurs peuvent avoir accès à ces données, en respectant certains critères réglementaires stricts, éthiques et légaux préétablis et doivent respecter le cadre de gestion CITADEL. (voir le cadre de gestion).
Une fois les données extraites, quelle est l’étape suivante?
Lorsque les données sont extraites, l’équipe de recherche qui le désire peut analyser ces données dans un espace sécurisé pour répondre à leurs questions de recherche. Si des analyses plus poussées sont nécessaires, CITADEL offre aussi un service de consultation et d’analyse par une équipe spécialisée dans l’analyse de données en santé.
Quels sont les objectifs de CITADEL?
- Rassembler les expertises en manipulation de données (data wrangling) et en analyse de données : épidémiologie, méthodologie, biostatistiques, mathématiques, apprentissage machine.
- Fournir un accès simple, sécuritaire et rapide aux données clinico-administratives afin d’améliorer et faciliter l’innovation et la recherche.
Quelles sont les données pouvant être accessibles grâce au lac de données de CITADEL?
Des données agrégées, par exemple :
- Nombre de visites à l’urgence.
- Nombre de patients hospitalisés pour un diagnostic précis dans une période donnée.
- Nombre de patients à l’unité néonatale à un moment précis.
Des demandes d’accès à un ensemble de données (data request), par exemple :
- Résultats de laboratoires et radiologie en lien avec la fonction hépatique pour tous les patients ayant reçus une transplantation du foie.
- Rapports d’IRM dé-identifiés et liste de médications pour toutes les patientes ayant un traitement actuel pour un cancer du sein triple négatif.
- Extractions de données cliniques et de laboratoires pour tous les receveurs d’une transfusion de
sang O-.
En plus de restreindre l’accès aux données aux individus ayant droit (par les autorisations réglementaires, éthiques et légales requises), celles-ci sont anonymisées ou dé-identifiées d’emblée. Des limitations supplémentaires peuvent également être appliquées selon la nature des demandes.
Sécurité
Où sont conservées les données?
Les données sont conservées dans l’enceinte sécurisée du CHUM.
Qui a accès aux données?
L’accès aux données est possible aux individus possédant les autorisations réglementaires et légales requises. Les accès par les membres d’une équipe de recherche doivent être endossés par le chercheur responsable du projet au niveau institutionnel.
Comment l’accès aux données est-il possible?
L’accès aux données via CITADEL est possible via une structure de gouvernance robuste et un suivi réglementaire strict. Le cadre de gestion de CITADEL décrit le cadre légal et réglementaire sur lequel l’accès aux données s’appuie, la gouvernance ainsi que les modalités d’accès aux données.
Comment la confidentialité des données est-elle assurée?
En plus de restreindre l’accès aux données aux individus ayant droit (par les autorisations réglementaires, éthiques et légales requises), celles-ci sont anonymisées ou dé-identifiées d’emblée. Des limitations supplémentaires peuvent également être appliquées selon la nature des demandes.
Biostatistique
Quels sont les services offerts par CITADEL au niveau statistique?
L’équipe d’experts en biostatistique de CITADEL peut vous aider à plusieurs niveau dans vos travaux de recherche :
- Révision de la méthodologie d’une étude
- Révision de protocoles de recherche
- Rédaction de la section statistique d’un article scientifique
- Relecture et révision de la section d’un article pré-publication et/ou en réponse aux commentaires des réviseurs
- Calcul de taille d’échantillon
- Analyses statistiques diverses, en totalité ou en partie, incluant mais non limité à : statistiques descriptives, analyses univariées et multivariées, régressions linéaires, analyses longitudinales, analyses bayesiennes, méta-analyses, etc.
Tarification
Les services de CITADEL sont-ils gratuits?
Les services offerts par CITADEL suivent les grilles de tarification des plateformes scientifiques du CRCHUM.
Quels sont les coûts?
Les coûts associés à un projet dépendent de la nature et de la complexité du projet. Lors de l’évaluation initiale d’un projet, une soumission est soumise à l’utilisateur. Le projet débutera lorsque CITADEL et l’utilisateur s’entendent sur les coûts associés. En cours de projet, si le mandat de CITADEL change (à la hausse ou à la baisse), l’utilisateur sera avisé et aucune dépense ne sera encourue sans l’autorisation explicite de la personne responsable du projet.