Corps de l’article

Introduction

Avec le vieillissement de la population canadienne, les maladies chroniques exercent une pression grandissante sur le système de santé (Romanov, 2002) et la prise en charge de ces maladies est devenue une préoccupation majeure des décideurs tout autant que des cliniciens (Wagner, 2001 ; Broemeling et al., 2008). L’apport d’information empirique basée sur des données en contexte est essentiel à la planification du système de santé et à l’allocation optimale des ressources en fonction de la réalité du terrain. Cependant, la plupart des connaissances empiriques disponibles proviennent de recherches cliniques où l’environnement expérimental fortement contrôlé en limite la généralisation, particulièrement auprès des populations marginales. Or, c’est justement dans ces populations qu’on observe les plus grands écarts de santé en termes d’incidence/prévalence, de traitements et d’impact de ces traitements sur la santé (ASPC, 2008).

Par sa capacité d’intégrer des informations de sources différentes et de formats disparates, la géomatique offre aux décideurs un moyen d’avoir accès à des informations empiriques sur des populations réelles, incluant les plus marginalisées, pour une prise de décisions éclairées. L’Office québécois de la langue française définit la géomatique comme une «discipline ayant pour objet la gestion des données à référence spatiale et qui fait appel aux sciences et aux technologies reliées à leur acquisition, leur stockage, leur traitement et leur diffusion». Par exemple, la géomatique permet de superposer plusieurs couches d’informations à référence spatiale pour l’étude d’une maladie et de son impact dans une population définie. Elle est particulièrement utile pour la prise de décision sur des questions de santé publique telles que la planification des ressources humaines, des installations et des services, ainsi que la prévention, le traitement et le suivi des maladies (Gatrell et Löytönen, 1998 ; Meade et Earickson, 2000 ; Cromley et McLafferty, 2002 ; Boulos, 2003 ; Maheswaran et Craglia, 2004).

Depuis quelques années, plusieurs atlas sur la santé ont été mis en ligne. Parmi ceux créés en Amérique du Nord, on compte : l’Atlas de la santé et des services sociaux du Québec [1] élaboré par le ministère de la Santé et des Services sociaux [2] ; l’Atlas Santé Montréal développé par l’Agence de santé et des services sociaux de Montréal ; l’Infobase des maladies chroniques [3], créé en 2010 par l’Agence de la santé publique du Canada et The Pennsylvania Cancer Atlas [4], développé par Penn State Hershey Medical Center en Pennsylvanie, pour en nommer quelques-uns. Bien que ces atlas offrent nombre d’avantages, ou bien les types de découpages géographiques sont restreints (découpage administratif seulement), ou alors le choix des indicateurs de santé visés est minimal. Ainsi, le développement d’un atlas interactif en ligne présentant un vaste choix d’indicateurs liés à plusieurs maladies avec un choix varié de découpages sociogéographiques s’avère supérieurement intéressant et avantageux pour une meilleure prise de décision.

Le groupe de recherche interdisciplinaire en géomatique de la santé PRIMUS [5] s’intéresse depuis plusieurs années aux applications de la géomatique dans le domaine de la santé des populations. Les projets réalisés portent essentiellement sur l’étude spatiale et temporelle des épisodes de soins et des traitements médicaux liés à plusieurs maladies chroniques et problèmes de santé mentale : infarctus du myocarde, diabète, fractures ostéoporotiques, douleurs chroniques, schizophrénie, troubles de l’humeur.

L’Atlas interactif sur les inégalités de santé (AIIS) est un système d’information géographique en ligne permettant d’interroger des données médicoadministratives agrégées (sous forme de datacubes ou cubes de données), selon des découpages géographiques ou des attributs populationnels, et d’obtenir les résultats en quelques secondes sous forme de cartes, de tableaux et de graphiques. Basé sur une analyse de besoins auprès des utilisateurs potentiels, l’AIIS a été élaboré de façon à structurer et produire de l’information utile en se servant des données disponibles, à partir d’une interface conviviale.

Méthode

Le développement de l’Atlas a débuté par une analyse des besoins, sur laquelle s’est basée l’élaboration des modèles conceptuels et logiques spécifiques aux maladies sélectionnées. Ces modèles ont guidé l’ensemble de la programmation nécessaire pour remplir les cubes de données et pour le déploiement de l’Atlas en ligne.

Analyse des besoins

L’élaboration de l’Atlas s’appuie sur des études des besoins des utilisateurs potentiels. Les personnes invitées à participer faisaient partie d’organisations gouvernementales comme le ministère de la Santé et des Services sociaux (MSSS), l’Institut national de santé publique du Québec (INSPQ) et les agences régionales de la santé et des services sociaux (ARSSS). Ces utilisateurs potentiels incluent des décideurs ainsi que des professionnels en soutien. Les participants aux études des besoins ont également été recrutés dans des organismes non gouvernementaux, comme la Fondation des maladies du coeur, l’industrie pharmaceutique ou des organismes communautaires qui n’ont pas les moyens ou l’expertise pour réaliser le type d’analyse que peut produire l’Atlas. La cueillette des données s’est réalisée à l’aide d’entretiens semi dirigés ou de groupes de discussion, et l’information portait, d’une part, sur les besoins tels qu’exprimés par les utilisateurs potentiels et, d’autre part, sur les commentaires des fonctionnalités d’un prototype présenté (Groupe PRIMUS, 2006 ; Bissonnette et Lapointe, 2009 ; Bissonnette et al., 2010). Il ressortait également de l’analyse des besoins que les utilisateurs désiraient un système facile à utiliser pour des non-initiés, soit une interface simple et conviviale, centrée sur les résultats et ne nécessitant aucune programmation.

Modèles conceptuel et logique

Pour développer les modèles conceptuel et logique qui guideront l’ensemble de la programmation, des analyses complètes et détaillées ont permis de préciser les concepts à inclure dans l’Atlas selon les six dimensions du cube de données, telles qu’identifiées par l’analyse des besoins. Ces concepts ont par la suite été traduits en variables opérationnelles pour guider la programmation du système.

Dimensions d’analyse de l’AIIS

L’analyse des besoins a permis de définir six dimensions d’analyse : les indicateurs de santé, les territoires géographiques, les périodes temporelles, le sexe, l’âge et le type de mesures. Ces paramètres constituent les six dimensions du cube de données de l’Atlas, et chacune de ces dimensions inclut un certain nombre de concepts. La dimension des indicateurs de santé regroupe l’incidence ou la prévalence, l’utilisation des services de santé, les consultations médicales, les traitements pharmacologiques et le pronostic (morbidité/mortalité) spécifiques à la maladie sélectionnée. Le tableau 1 présente les différents indicateurs de santé en fonction des maladies sélectionnées. Pour cette dimension, l’événement index fait référence à l’apparition du diagnostic de la maladie dans la base de données de santé, alors que les différentes périodes de suivi ont été définies par rapport à l’événement index (par exemple un an après l’événement index).

La deuxième dimension du cube s’articule autour des territoires géographiques. Ces territoires sont définis à l’aide du territoire CLSC ou de l’aire de diffusion du lieu de résidence des individus. Cette dimension permet à l’utilisateur d’explorer les inégalités observables en regard des indicateurs de santé définis plus haut. On retrouve plusieurs concepts dans cette dimension :

  • Les territoires administratifs (MSSS, 2011) : Chaque patient réside à l’intérieur d’un des 166 territoires CLSC qui, eux-mêmes, sont imbriqués à l’intérieur de 95 réseaux locaux de santé (RLS) qui, à leur tour, sont imbriqués à l’intérieur de 18 régions sociosanitaires (RSS). Les Réseaux universitaires intégrés de santé (RUIS) sont de nouveaux territoires de référence au MSSS et sont respectivement rattachés aux universités Laval, McGill, de Montréal et de Sherbrooke. Les RSS ont également été classifiées selon leur influence universitaire : régions médicales universitaires (RSS 03, 05, 06) ; régions médicales périphériques (RSS 12, 13, 16) ; régions médicales intermédiaires (RSS 04, 07, 14, 15) ; régions médicales éloignées (RSS 01, 02, 08, 09, 11) ; et régions médicales isolées (RSS 10, 17, 18).

  • La défavorisation sociale et matérielle : Dans cette étude, les conditions socio- économiques attribuées aux individus sont mesurées à un niveau écologique par un indice de défavorisation mis au point au Québec (Pampalon et Raymond 2000 et 2003 ; Martinez et al., 2003 ; Philibert et al., 2007 ; Pampalon et al., 2008). Cet indice est basé sur la plus petite unité statistique du recensement canadien, l’aire de diffusion (AD). Il est calculé pour chaque AD et incorpore six indicateurs liés aux dimensions matérielle et sociale de la défavorisation. La dimension matérielle reflète les variations dans la proportion de personnes sans diplôme d’études secondaires, dans le ratio emploi/population et dans le revenu moyen, alors que la dimension sociale reflète les variations dans la proportion de personnes séparées, veuves ou divorcées, dans la proportion de personnes vivant seules et dans la proportion de familles monoparentales. Pour chaque dimension, les AD sont divisées en quintiles de population, du moins défavorisé (quintile 1) au plus défavorisé (quintile 5). Ainsi, à chaque patient d’une même AD est attribué le même quintile de défavorisation.

  • La ruralité : La classification des secteurs statistiques (CSS) est une des définitions de la ruralité établies par Statistique Canada. Les unités de base sont les subdivisions de recensement (SDR) ou municipalités. C’est la seule définition qui fait intervenir la notion de taux de navettage. Ce taux représente le pourcentage des résidants d’une municipalité qui voyagent quotidiennement vers un centre urbain pour le travail et reflète le degré d’interrelation entre des régions. Ainsi, plus la proportion de navetteurs quotidiens en provenance d’une région donnée sera élevée, plus l’influence relative du centre urbain sur cette région sera grande. Chaque municipalité est ainsi classée en six catégories : deux catégories urbaines selon la taille de la population du noyau urbain (région métropolitaine de recensement (RMR) : au moins 100 000 habitants ; agglomération de recensement (AR) : entre 10 000 et 99 999 habitants) et en quatre catégories rurales classées selon le taux de navettage. Ces quatre zones rurales, ou zones d’influence métropolitaine (ZIM), sont désignées ZIM fortes, ZIM modérées, ZIM faibles et ZIM sans influence selon que le taux de navettage est supérieur à 30 %, entre 5 et 30 %, entre 0 et 5 %, et entre 0 et 40 résidants respectivement (Statistique Canada).

  • Les bassins de desserte autour des services de santé : Les bassins de desserte ont été définis différemment selon la maladie sélectionnée. Par exemple, pour l’infarctus du myocarde, des basins de desserte de 32, 64 et 105 km autour des hôpitaux tertiaires ont été définis et étaient basés sur les distances routières. Ces seuils ont été sélectionnés parce qu’ils correspondent à des temps moyens de trajet de 60, 90 et 120 minutes (Scott, 1998 ; Winters, 1998). Seize bassins de desserte sont ainsi définis, correspondant aux bassins autour de Montréal, Gatineau, Sherbrooke, Québec et Chicoutimi. Pour les problèmes de santé mentale, des bassins de desserte de 2, 5, 10 et 20 km autour des hôpitaux psychiatriques de 3e ligne (7 hôpitaux) et des bassins de desserte de 2, 5, 10 et 20 km autour des hôpitaux de 2e et 3e lignes offrant un service en santé mentale (51 hôpitaux) ont été utilisés.

Tableau 1

Indicateurs de santé de l’AIIS

Indicateurs de santé de l’AIIS

-> Voir la liste des tableaux

La troisième dimension est le temps ; elle permet d’observer si les indicateurs de santé évoluent selon des périodes temporelles sélectionnées. Plusieurs périodes de deux à quatre ans ont été sélectionnées selon la maladie à l’étude.

Les quatrième et cinquième dimensions concernent le sexe et l’âge des patients. Ces dimensions permettent aux utilisateurs de mettre en évidence des inégalités spécifiques en fonction de la catégorie de la population étudiée (Lépine et al., 2005 ; Somers et al., 2006).

Enfin, la sixième dimension comporte deux types de mesures, les taux bruts ou ajustés, qui peuvent être sélectionnées pour représenter les informations désirées. Le taux brut donne une représentation exacte de l’indicateur de santé pour une population sélectionnée ; il utilise le nombre de cas comme numérateur et la population totale comme dénominateur. Le taux ajusté permet une comparaison entre les sous-populations en tenant compte de leurs différences d’âge et de sexe dans les analyses comparatives.

Sources de données de l’AIIS

L’Atlas intègre des données provenant de sources multiples en santé : Régie de l’assurance maladie du Québec (RAMQ), ministère de la Santé et des Services sociaux (MSSS), Commission de la santé et de la sécurité au travail (CSST), Société de l’assurance automobile du Québec (SAAQ), Institut de la statistique du Québec (ISQ) de même que des données populationnelles et des données spatiales (Statistique Canada, MSSS). Le registre sur les hospitalisations (MSSS, RAMQ) contient les dates d’admission et de sortie de l’hôpital (s’il y a lieu) avec les raisons de l’hospitalisation (un diagnostic principal et jusqu’à 15 diagnostics secondaires) et les procédures effectuées sur le patient ; le registre sur les services médicaux (RAMQ) contient des données sur les médecins traitants, le diagnostic et la date du service ; le registre sur les bénéficiaires (RAMQ) produit des informations sur le sexe, la date de naissance et le lieu de résidence, tandis que le registre sur les décès (ISQ) contient de l’information sur la date et la cause du décès. Les registres sont fusionnés au niveau patient à l’aide des numéros d’assurance maladie (NAM) encryptés. Les autres données fournies par la RAMQ sont contenues dans le fichier des professionnels, le fichier d’admissibilité au régime public d’assurance médicament et le fichier des services pharmaceutiques. Ces données seront nécessaires pour comptabiliser la consommation de soins et les traitements reçus. Les données sur les tailles des populations par âge et par sexe au niveau des AD et des territoires CLSC ont été obtenues des données des recensements (Statistique Canada) et de l’ISQ. Les données sur les indices de défavorisation matérielle et sociale proviennent de la Table d’équivalence entre les aires de diffusion (AD) et les différents territoires géographiques fournies par l’Institut national de la santé publique du Québec (INSPC, 2011). Les informations spatiales qui ont servi à constituer les limites cartographiques sous le format shapefile proviennent des recensements canadiens (Statistique Canada) dans le cas des AD, et du MSSS dans le cas des limites géographiques liées aux territoires administratifs (MSSS, 2011).

Populations à l’étude

Les registres de données de santé ont été utilisés pour constituer les différentes populations à l’étude et pour définir chaque indicateur de santé lié à la maladie d’intérêt. Ces populations étaient exhaustives, dans le sens où nous obtenions des informations détaillées sur toute la population du Québec répondant à des critères de sélection précis sur une période relativement longue (autour de 10 ans). Ces populations étaient également tirées du monde réel et dites naturalistiques, car aucune intervention extérieure n’était effectuée et les résultats de santé reflétaient la réalité observée sur le terrain.

Processus de transformation des données

Des données brutes provenant des différentes sources jusqu’à la production d’informations spécifiques requises par l’utilisateur, le processus de transformation peut être divisé en trois éléments : 1) les cubes de données OLAP (On-line Analytical Processing) forment les éléments centraux et regroupent les données sous forme de tables dénormalisées et agrégées. La technologie OLAP est une approche informatique permettant de répondre très rapidement à des requêtes multidimensionnelles, un élément essentiel pour la fonctionnalité d’un atlas interactif ; 2) en amont, le module ETL (Extract, Transform and Load) permet d’intégrer les données brutes de sources multiples, de les transformer en informations intermédiaires et de les emmagasiner dans les cubes OLAP selon les six dimensions prédéterminées. Alimenté à partir de données individuelles de santé, le logiciel SAS fournit une banque de données intermédiaires contenant l’essentiel des résultats statistiques. Cette banque est ensuite reprise et transformée sous forme de cubes de données à l’aide de Talend Open Studio (code source libre pour l’intégration de données), puis est chargée dans un système de gestion de bases de données MySQL ; 3) en aval, l’interrogation des cubes de donnés est assurée par la solution JMap/Solap qui, une fois configurée et connectée à MySQL, est en mesure de fournir des cartes thématiques, figures et tableaux à partir d’un ordinateur personnel branché sur Internet.

Considérations éthiques

Les différents projets du programme de recherche ont été approuvés par le comité d’éthique de la recherche chez l’humain du Centre hospitalier de l’Université de Sherbrooke (CHUS) et ont reçu l’autorisation de la Commission d’accès à l’information (CAI) pour l’accès aux données médicales. De plus, par souci de confidentialité, l’AIIS n’affiche les résultats des requêtes (indicateurs de santé) que si le nombre de cas observés est supérieur ou égal à cinq par unité géographique représentée. Les cubes de données, quand à eux, ne contiennent aucune donnée brute et aucune information individuelle.

Résultats

L’AIIS est un outil d’interrogation spatiotemporelle sur l’épidémiologie des maladies chroniques et mentales, développé dans le but d’offrir une meilleure compréhension des inégalités sociales et géographiques de santé. Les maladies chroniques et mentales disponibles à ce jour dans l’AIIS sont l’infarctus du myocarde (IM), le diabète (DB), les fractures ostéoporotiques (OS), les douleurs chroniques (DC), la schizophrénie (SZ) et les troubles de l’humeur (TH). À partir d’une interface conviviale à contenu dynamique et accessible en ligne, les résultats des requêtes des utilisateurs sont présentés en quelques secondes sous forme de cartes, de graphiques ou de tableaux. Tous ces résultats sont basés sur des populations exhaustives issues du monde réel, dont les tailles varient entre 600 000 et 1 650 000 patients (tableau 2) selon la maladie sélectionnée. Les banques de données associées à chacune des maladies contiennent entre 200 millions et un milliard d’enregistrements. Une fois constitués, les cubes de données vont emmagasiner entre 1 683 000 et 5 675 000 résultats préagrégés et pourront produire entre 38 000 et 197 000 cartes, tableaux et graphiques (tableau 2).

Tableau 2

Information sur les tailles des diverses bases de données par maladie

Information sur les tailles des diverses bases de données par maladie

-> Voir la liste des tableaux

Les figures 1 à 5 (en annexe) montrent quelques exemples de résultats de requêtes représentées sous forme de cartes, de tableaux et de graphiques : la figure 1 montre des taux d’angioplastie à l’hospitalisation index, ajustés pour l’âge et le sexe, pour les personnes de 25 ans et plus hospitalisées pour un infarctus du myocarde durant la période 2000-2003 et selon différents bassins de desserte. La figure 2 montre un autre type de sortie, soit le taux d’utilisation d’une ostéodensitométrie dans les 24 mois suivant une fracture ostéoporotique, entre 2000 et 2002 chez les personnes de 40 ans et plus et selon le niveau de ruralité. La figure 3 présente les taux bruts d’utilisation d’insuline, un an après un diagnostic de diabète entre 2001 et 2002, selon la région sociosanitaire. La figure 4 propose deux représentations cartographiques par écoumène comparant les taux ajustés d’utilisation fréquente de soins ambulatoires et de l’urgence, après un diagnostic de douleur chronique entre 2005 et 2006, selon le territoire CLSC. L’interface de l’AIIS permet également d’effectuer des tableaux croisés, comme l’illustre la figure 5, qui permet de comparer la prévalence de la schizophrénie par classe d’âge et de sexe selon le niveau de défavorisation matérielle et sociale.

Depuis le début de sa réalisation, l’AIIS a été présenté à plusieurs décideurs en santé publique aux niveaux régional et provincial au Québec et à l’extérieur du Québec. Depuis 2007, il a notamment été présenté à des Agences de la santé et des services sociaux, à la Table sectorielle des RUIS sur la douleur chronique de la Direction des affaires universitaires du MSSS, à l’INSPQ et aux Journées annuelles de santé mentale. L’AIIS a également été présenté à des décideurs en santé à l’extérieur du Québec, au BC Ministry of Health, à Victoria, et au Cancer Care Ontario, à Toronto. L’Atlas interactif sur les inégalités en santé a suscité beaucoup d’intérêt, et des autorisations d’accès à l’AIIS ont été demandées, entre autres, par le Commissaire à la santé et au bien-être du Québec, le directeur de la santé mentale du MSSS, plusieurs des Centres de santé et de services sociaux, des RUIS, de même que des chercheurs-cliniciens.

Discussion

L’Atlas offre une information épidémiologique complète et détaillée sur des populations exhaustives de patients dans leur contexte réel, sans les biais habituellement associés aux études cliniques ou aux enquêtes. Il permet des études « naturalistiques » sur des populations, incluant les populations marginales qui sont habituellement exclues des études cliniques. En raison de cette stratégie d’utiliser des populations exhaustives, l’Atlas offre la possibilité de faire des requêtes précises en croisant ses six dimensions d’analyse (indicateur de santé, territoire géographique, temps, âge, sexe, mesure) de façon à mettre en évidence des inégalités de santé qui pourraient être invisibles avec une approche d’analyse bidimentionnelle, qu’on retrouve habituellement dans les systèmes d’information en tableau de type Excel. L’Atlas permet également de suivre des phénomènes sur plusieurs périodes, ce qui informe les décideurs sur l’évolution de la santé des populations ou sur l’impact d’un nouveau programme de santé à long terme.

Dans la mesure où les centres de santé et de services sociaux sont responsables de l’accessibilité, de la continuité et de la qualité des services offerts à leur population, disposer d’une information complète constitue un enjeu majeur. Il est essentiel également de recueillir des informations en fonction de découpages territoriaux variés afin de bien planifier l’offre de services. L’AIIS permet tout cela de façon conviviale, et son utilisation peut être faite par des personnes non expertes.

L’AIIS est un projet de recherche et développement et ne prévoit pas la mise à jour des données. Il s’agit donc d’une preuve de concept que les décideurs devront s’approprier afin de développer des outils de surveillance et d’aide à la décision en temps réel pour le bien-être de la population.

Les limites liées à l’utilisation de bases de données existantes imposent certaines réserves dans l’interprétation des résultats, plus précisément en lien avec les biais d’information potentiels ainsi qu’avec les facteurs influençant la validité externe (généralisation) des résultats. En effet, l’intégration des populations à l’étude s’effectue à partir des diagnostics rapportés par les médecins traitants et par les archives médicales hospitalières. Puisque la validité d’algorithmes de sélection de patients souffrant des maladies sélectionnées n’a pas toujours été évaluée dans la population québécoise, nous avons délibérément privilégié les algorithmes offrant une plus grande spécificité. Les taux de consultation d’un omnipraticien pourraient également être sous-évalués, puisque les données du fichier des services médicaux n’incluent pas systématiquement les services rendus par les médecins pratiquant dans les centres de santé et de services sociaux. Il y a également des limites liées à la généralisation des résultats, notamment en ce qui concerne les traitements médicamenteux pour les personnes de moins de 65 ans. En effet, les indicateurs de santé portant sur les médicaments sont calculés pour la sous-population couverte par le régime public de l’assurance médicament administré par la RAMQ. Ce régime couvre les personnes âgées de 65 ans et plus ou ne bénéficiant pas de régimes d’assurance privés, par exemple les personnes bénéficiaires de l’aide financière de dernier recours.

Les développements futurs de l’AIIS peuvent se faire à trois niveaux : soit par l’intégration d’autres maladies chroniques ou mentales, soit par l’ajout d’éléments à la dimension d’analyse sociogéographique, soit par une amélioration du processus informatisé. L’ajout d’autres maladies chroniques à l’AIIS est déjà prévu pour les prochains mois (facteurs de risque des maladies cardio et cérébrovasculaires et troubles anxieux). Quant aux développements méthodologiques, le groupe de recherche PRIMUS envisage une amélioration de l’interface et l’ajout de tutoriels notamment et, éventuellement, selon les possibilités de financement, l’intégration de nouveaux filtres d’analyse (populations immigrantes, populations linguistiques en situation minoritaire).