Gestion des données

Sur cette page

Aperçu

La gestion de données représente une tâche continue dans le cadre d’une enquête sur une éclosion. Les enjeux relatifs à la gestion de données comprennent la collecte, le stockage et la sécurité de l’information. Une attention aux détails de la collecte de données, ce qui comprend la création d’outils et la saisie de données à proprement parler, facilite la création de résultats valides et fiables sur lesquels il est possible de baser des conclusions et des recommandations. Le fait d’établir un plan de gestion des données facilitera la communication et la coordination  tout au long de l’enquête, et il s’agit d’une composante essentielle faisant à la fois partie des études descriptives  et des études analytiques.

Retour vers le haut de la page

Options de logiciels

Il existe un vaste éventail d’options de logiciels pour la gestion de données. Le tableau suivant résume les programmes logiciels les plus communs et la façon dont ils assurent l’exécution des trois fonctions clés :

  1. Saisie de données
  2. Analyse de données de base
  3. Analyse avancée de données
Plateforme Saisie de données Analyse de données de base Analyse avancée de données
MS Excel Problématique Oui Non
MS Access Oui (utilisateurs multiples) Limitée Non
Epi Data (anglais seulement) Oui Oui Oui (limitée)
Epi Info 7 (anglais seulement) Oui Oui (limitée) Oui (limitée)
SAS-EG N.D. Oui Oui
Stata (anglais seulement) N.D. Oui Oui
SPSS N.D. Oui Oui
Plateformes de sondages en ligne (p. ex. FluidSurveys) (anglais seulement) Oui (utilisateurs multiples) Oui Non

Points supplémentaires à considérer

  • Coût
  • Capacités graphiques
  • Vitesse du réseau (le cas échéant)
  • Capacité de modification
  • Niveau de compétence actuel des employés
  • Soutien à l’utilisateur 

Retour vers le haut de la page

Lignes directrices et considérations générales

Planification

  • Concevoir des outils de collecte de données (p. ex. questionnaires) qui comprennent des plans de gestion des données et d’analyse des données.
  • Tenir à jour un registre papier ou électronique de toutes les décisions de gestion de données prises durant l’enquête.
  • Créer un plan de communication et de diffusion de renseignements à l’avance en vue de faciliter l’échange et le flux de l’information dans des conditions d’éclosion.

Facteurs de conception

  • Le format de l’outil de collecte de données ou du questionnaire (formulaire papier par opposition à un formulaire de saisie électronique) et les questions elles-mêmes (questions ouvertes par opposition à des questions avec choix limité de réponses) touchent, voire limitent, les types d’analyses qui peuvent être effectuées et les conclusions qui peuvent être tirées.
  • Soyez conscient de la façon dont certains types de données, notamment des rangées et des colonnes vides, des valeurs manquantes, des en-têtes de colonnes ou des noms de variables, sont traités lors du déplacement de données entre des produits de logiciel pour maintenir l’intégrité des données (p. ex. champs de dates).
  • Assurez-vous que chaque variable mesure, quantifie ou qualifie une seule chose précise (par opposition à diverses choses).
  • Précisez combien de caractères et quels caractères sont permis pour des noms variables et tous les champs des produits de logiciel que vous utilisez.
  • Nommez les variables dans les outils de collecte de données avec des noms courts et descriptifs qui sont logiques selon vous et qui sont plus susceptibles d’être logiques aux yeux des autres (p. ex. identité, sexe, date d’apparition et sérotype et non VAR1, VAR2, VAR3 et VAR4, respectivement).
  • Réservez de l’espace pour un numéro d’identification de questionnaire unique ou assignez à l’avance des numéros d’identification.

Améliorer la qualité des données

  • Avant de recueillir des données, mettez à l’essai les outils de collecte de données pour préciser et garantir que les données appropriées sont recueillies à l’aide des variables utilisées.
  • Il faut former les enquêteurs sur chaque questionnaire. Les enquêteurs doivent comprendre toutes les questions.
  • Veillez à inclure un endroit permettant d’identifier les enquêteurs sur le questionnaire, de sorte que le personnel chargé de la saisie de données puisse assurer un suivi, au besoin (p. ex. questions non répondues, écriture illisible, réponses illogiques).
  • Durant l’analyse des données, consignez dans le registre toutes les variables reprogrammées et nouvellement créées.
  • Faites attention aux alertes qui découlent des analyses; si vous n’êtes pas certain de la signification d’une alerte, obtenez des précisions pour éviter une mauvaise interprétation des résultats.

Contrôle des versions

  • Nommez les fichiers en utilisant des identificateurs uniques qui comprennent la date (p. ex. Données sur la salmonelle 2Fév2011.xxx; Liste détaillée pour la salmonelle 4Fév2012.xxx).
  • Sauvegardez les fichiers souvent lorsque vous créez des documents (p. ex. liste des cas, questionnaires, courbe épidémique , rapports), saisissez des données et déployez d’autres activités liées à une éclosion.
  • Assurez une sauvegarde périodique de vos fichiers sur un disque dur sécuritaire (préférablement un disque de réseau sécuritaire qui effectue des sauvegardes de secours) et sur un appareil de mémoire externe (p. ex. clé USB). Assurez la sécurité de tous les appareils de mémoire (p. ex. mots de passe sur des ordinateurs et des appareils de mémoire externes; verrouillage des appareils de mémoire externes dans des armoires et entreposage de tout le matériel informatique dans des salles verrouillées). 

Retour vers le haut de la page

Dictionnaires de données

Un dictionnaire de données fournit une liste descriptive de noms, de définitions et d’attributs des éléments de données d’un ensemble de données ou d’une base de données (p. ex. listes des cas , base de données qui comprend des réponses à un questionnaires, etc.). Pour chaque élément, des renseignements tels que le nom descriptif, le type de données, les valeurs permises, les unités et la description de texte doivent être consignés et décrits. L’élaboration et l’utilisation d’un ensemble uniforme d’éléments de données et de formats qui permettent la documentation du contenu de la base de données de cette façon aident à assurer l’uniformité, la normalisation, l’exactitude et la fiabilité des données, ce qui facilite donc également la comparabilité, les déclarations et les enquêtes sur les éclosions.

Le tableau ci-dessous fournit une description d’attributs communément utilisés dans un dictionnaire de données. Ces attributs sont fournis à titre de référence seulement, puisque chaque base de données est unique; il existe donc une certaine variabilité parmi les dictionnaires de données.

Tableau : Description de caractéristiques communes de dictionnaires de données

Caractéristique Description
Nom Nom d’élément de donnée communément convenu et unique
Nom du champ Nom utilisé pour l’élément de données dans des programmes informatiques et des schémas de bases de données
Définition Description de la signification de l’élément de données
Unité de mesure Unité scientifique ou autre unité de mesure qui s’applique à la valeur de la donnée
Valeur Valeur déclarée
Type de données Type de données (texte, numérique, date, oui/non, etc.)
Taille Longueur maximale du champ (en caractères ou en nombre de places décimales)
Contraintes du champ Requis/conditionnel/nul
Codage/valeurs Explication du codage pour les valeurs acceptables et les règles de validation
Source de données Brève description de la source de données; comprend les règles utilisées dans les calculs visant à produire la valeur de l’élément de données
Éléments de données connexes Noms d’éléments de données étroitement liés lorsqu’une relation est importante
Masque de saisie Présentation requise des données (p. ex. aaaa-mm-jj)
Références historiques Date à laquelle l’élément de données a été défini dans le présent formulaire, des définitions précédentes, etc.
Commentaires Pour fournir des détails supplémentaires liés à un élément de données 

Retour vers le haut de la page

Outils

Liste des cas et dictionnaire de données

  • Cet outil, en format Microsoft Excel, est conçu pour être utilisé comme modèle de liste des cas dans le cadre des enquêtes sur l’éclosion d’une maladie d’origine alimentaire. Une fois que les données sont saisies, les statistiques descriptives se calculent automatiquement. Le dictionnaire de données décrivant chaque champ de données dans le tableau synoptique est fourni au dernier onglet.

Base de données pour la gestion des éclosions

  • Cette base de données Microsoft Access suivra la disposition et la structure des questionnaires exploratoires sur les maladies entériques utilisés par l’ASPC. Les utilisateurs pourront saisir les données, exporter les champs sélectionnés dans un tableau synoptique en format Microsoft Excel, générer automatiquement des tableaux récapitulatifs sur l’exposition aux aliments et au risque et effectuer des interrogations personnalisées dans la base de données. Cet outil devrait être terminé d’ici la fin de 2015.

Logiciel EpiData  (anglais seulement)

  • Le logiciel Epidata est un logiciel libre et gratuit, créé par des épidémiologistes, qui comporte deux composantes : EpiData Entry et EpiData Analysis. EpiData Entry est surtout utilisée pour la saisie de données simples et la documentation de données. EpiData Analysis fait des analyses statistiques de base, des graphiques et la gestion complète des données.

Epi Info (anglais seulement)

  • Epi Info™ est une suite d’outils logiciels grand public destinée aux praticiens de la santé publique et aux chercheurs. Elle permet de créer des formulaires de saisie de données et des bases de données, et d’analyser les données à l’aide de statistiques épidémiologiques, de cartes et de graphiques, et s’adresse aux professionnels de la santé publique qui n’ont pas nécessairement de formation en technologie de l’information.

Retour vers le haut de la page

Références

Gregg, M.B (ed.). 2002. Field Epidemiology, 2nd Edition. Oxford University Press, Oxford, England.

Retour vers le haut de la page