Article body

Introduction

La biogéographie est la science qui étudie la répartition des êtres vivants sur la Terre. Elle a pour but l’analyse des raisons de la distribution d’un taxon à un moment et à un endroit donnés.

Depuis maintenant plus de 10 ans, la biogéographie profite pleinement de l’avènement de la micro-informatique. Ce phénomène se manifeste par la création et l’exploitation de banques de données biogéographiques. Une telle banque de données est un système informatique qui permet d’organiser, de sauvegarder et d’exploiter les données de nature biogéographique. Elle intègre les trois dimensions fondamentales de la biogéographie : les taxons, le temps et l’espace. Les objectifs qui poussent à la confection de banques de données biogéographiques sont divers : la connaissance de la répartition des espèces, la surveillance (survey) des espèces ou des populations, le suivi de métapopulations, les études d’incidence, etc.

L’une des principales difficultés rencontrées lors de la confection des banques de données biogéographiques est le géoréférencement des observations. La dimension spatiale des données biogéographiques est en effet primordiale puisque c’est elle qui permet de dresser les cartes de répartition. Les méthodes de géoréférencement sont diverses. La technique la plus courante est le recours à des «Gazetteers», sorte de dictionnaires qui comportent les coordonnées géographiques des localités d’un pays ou d’une région. Dans certains cas, les observateurs ont accès à des cartes géoréférencées et peuvent fournir des coordonnées plus ou moins précises de leurs observations. Le choix du système utilisé pour noter les coordonnées a fait l’objet de nombreuses discussions et controverses (Cartan 1978). Le système le plus communément adopté est l’UTM (Universal Transverse Mercator) et plus particulièrement sa notation militaire : le MGRS (Military Grid Reference System). Ce système de notation fut notamment utilisé pour le projet «European Invertebrate Survey» (EIS-CIE-EEW). Il s’agit d’un bon choix, car l’UTM est un système standardisé et international (OTAN-NATO 1983). Il n’est pas lié à un pays en particulier et permet de traverser aisément les frontières lors des opérations de cartographie internationales.

Récemment, le Global Positioning System (GPS) est venu bouleverser très profondément les habitudes des biogéographes. À partir d’un simple récepteur satellite, il est désormais possible d’obtenir très facilement des coordonnées géographiques dont la précision est de l’ordre de 3 m. Cette précision est possible depuis la levée de la Selective Availability (SA) par le Congrès américain, le 1er mai 2000. Auparavant, la précision n’était que de l’ordre de 100 m (Hofmann-Wellenhof et al. 2001). Le GPS permet donc maintenant de localiser des observations biogéographiques de façon extrêmement précise. Cette précision était impossible à atteindre auparavant, même avec de bonnes cartes topographiques, quand celles-ci étaient disponibles.

On pourrait émettre l’objection qu’une telle précision n’est pas requise pour des organismes qui se déplacent sur de grandes distances. Si cela est vrai pour certains taxons, d’autres se déplacent très peu. On peut citer la faune du sol, les espèces sapro-xylophages, les espèces aquatiques, etc. Même les espèces ailées peuvent être très casanières. Ainsi, Rasmont et al. (2002) ont estimé les déplacements de trois espèces de bourdons dans les Pyrénées. Plus de 90 % des déplacements n’excèdent pas 50 m.

Les sauts récents de précision modifient considérablement les possibilités de couplage et d’analyse entre les informations fauniques et les informations topographiques existantes. Ces analyses peuvent être menées grâce aux développements récents qui ont été faits dans le domaine des Systèmes d’information géographiques (SIG). Ceux-ci permettent de croiser des informations géographiques qui sont levées à des niveaux de précision semblables. À titre d’exemple, avec une résolution de 10 km, il est impossible d’associer la distribution des observations avec celle des courbes de niveau en région montagneuse. Même la résolution de 1 km ne permet que difficilement cette mise en relation. Il faut arriver à une précision de 100 m et même 10 m pour pouvoir établir un lien fiable entre l’altitude et la distribution observée.

L’évolution des besoins et des techniques a fait que l’échelle de travail a considérablement changé depuis les premières banques de données biogéographiques. Ce changement est important puisqu’il représente au moins deux ordres de grandeur. On peut dès lors parler de banques de données biotopographiques, car la précision des coordonnées géographiques relève maintenant de la topographie plus que de la géographie. Ce changement d’échelle a des conséquences importantes au niveau de l’organisation des banques de données. Une de ces conséquences est la gestion des coordonnées géographiques. Celle-ci ne peut plus se faire comme il y a 10 ans. L’objectif poursuivi ici est de montrer comment on peut intégrer ces nouveautés dans les banques de données modernes de manière à tirer parti de ces améliorations techniques fondamentales.

Représentation cartographique

Comme chacun le sait, la Terre n’est pas plate. Elle n’est pas non plus parfaitement sphérique puisqu’elle est légèrement aplatie aux deux pôles. Or, pratiquement toutes nos représentations cartographiques se font sur du papier ou des écrans d’ordinateur en deux dimensions. La difficulté réside donc dans le fait de transformer des coordonnées angulaires sphériques en coordonnées planes. Cette transformation est assurée par des fonctions mathématiques appelées projections. Les projections inverses permettent le passage des coordonnées planes vers les coordonnées sphériques.

Pour les représentations cartographiques à très petite échelle telles que les mappemondes, on peut considérer que la Terre est une sphère. Par contre, pour les représentations à plus grande échelle, on ne peut plus assimiler la Terre à une sphère. Il est impossible de tenir compte de la forme réelle de la Terre en tout point. Aussi, est-on obligé de faire quelques approximations. La première de celles-ci est d’utiliser le géoïde comme modèle de la forme terrestre. Le géoïde correspond à la surface qui, en tous ses points, est orthogonale à la direction de la verticale. Elle correspond à une approximation de la forme terrestre par extension de la surface des océans. Cette forme est une surface présentant des ondulations qui varient de l’ordre de 100 m (Snyder 1987). Comme il est impossible de tenir compte de la forme réelle du géoïde pour effectuer les calculs de projection, on utilise pour cela un ellipsoïde. Un ellipsoïde est une sphère très légèrement aplatie caractérisée par un petit et un grand axe. Il existe environ 38 ellipsoïdes de par le monde (EPSG 2000). Il est cependant impossible de définir un ellipsoïde qui épouse parfaitement toute la surface du géoïde. Aussi, est-on obligé, localement, de choisir un ellipsoïde qui épouse au mieux la surface du géoïde et, si besoin, de décentrer cet ellipsoïde par rapport au centre de gravité de la terre si ce décentrage améliore encore l’adéquation entre ellipsoïde et géoïde (Fig. 1). La combinaison d’un ellipsoïde, de paramètres de translation et éventuellement de rotation par rapport au centre de gravité de la terre et d’un point d’origine (sur lequel l’ellipsoïde correspond parfaitement à la surface du géoïde) constitue ce qu’on appelle un datum. Il existe actuellement plus de 230 datums différents (EPSG 2000).

La combinaison d’une projection (et de ses paramètres), d’un datum et d’un système d’unités forme ce qu’on appelle un système de coordonnées. Un tel système nous est très familier, car c’est ce qu’on retrouve sur les cartes de nos Instituts géographiques nationaux. Le système Lambert France I est un exemple de système de coordonnées. Il est défini par la projection conique conforme de Lambert (cinq paramètres non détaillés ici), le datum NTF (Nouvelle Triangulation Française) et des unités exprimées en mètres.

Figure 1

Les datums européen et nord-américain sont adaptés aux formes locales du géoïde

Les datums européen et nord-américain sont adaptés aux formes locales du géoïde

-> See the list of figures

À ce stade, il est fondamental de bien comprendre que des coordonnées, qu’elles soient sphériques ou projetées, d’un point situé à la surface terrestre seront différentes selon qu’elles sont exprimées dans un datum ou dans un autre. Les écarts observés sont généralement de l’ordre de plusieurs dizaines de mètres, mais peuvent atteindre près de 2 km. À titre d’exemple, la figure 2 illustre une même coordonnée MGRS, exprimée dans trois datums différents. On peut voir que le passage du datum ED50 à WGS84 a relativement peu d’incidence sur la précision du point. Par contre, le passage de ED50 à Amersfoort (le datum utilisé aux Pays-Bas) entraîne une perte de précision plus nette. Elle est telle que le point initialement situé dans la grille MGRS en FS0000 est maintenant passé en FR0099. Dans une représentation avec des points de 50 ou 100 km, pour une carte européenne par exemple, le point changerait de carré!

Figure 2

La même coordonnée MGRS (31UFS0000) exprimée dans 3 datums différents

La même coordonnée MGRS (31UFS0000) exprimée dans 3 datums différents

-> See the list of figures

Exemples et recommandations

L’expression des coordonnées géographiques n’est donc pas aussi triviale qu’on pourrait l’imaginer. Autrefois, quand on dressait des cartes à l’échelle d’un continent, d’un pays ou d’une région, on pouvait facilement faire abstraction de ces notions de géodésie. Avec la généralisation de l’usage du GPS et des SIG, il est devenu primordial de bien comprendre ces notions si l’on veut tirer pleinement parti de ces nouvelles possibilités et donc de répondre à de nouvelles questions scientifiques.

Il est donc important de faire des recommandations quant à la gestion des coordonnées géographiques dans les banques de données.

La première recommandation consiste à toujours noter le système de coordonnées qui est utilisé pour les observations biologiques. Si possible, celui-ci doit figurer sur les étiquettes de provenance. L’utilisateur d’un récepteur GPS doit veiller scrupuleusement à la configuration de celui-ci et plus particulièrement au datum. Par défaut, la plupart des récepteurs sont préréglés sur le datum WGS84. Or, en Europe par exemple, la plupart des cartes topographiques qui renseignent les coordonnées sphériques le font en European Data 1950. La différence entre les deux datums est d’environ 100 m. Cette différence n’est plus négligeable lorsqu’on réalise des études de biotopographie.

La seconde recommandation concerne les banques de données. Celles-ci devraient toujours conserver la coordonnée géographique telle qu’elle est donnée par l’observateur. C’est ce qu’on appelle la coordonnée originale. Les informations à conserver en permanence sont :

  1. le système de coordonnées;

  2. la coordonnée elle-même;

  3. le datum associé à la coordonnée originale;

  4. l’ordre de grandeur de la précision (par exemple 10 m).

Les auteurs ont appliqué cette recommandation dans deux de leurs logiciels : Data Fauna-Flora et Carto Fauna-Flora (Barbier et al. 2000; Barbier et Rasmont 1995, 1996, 2000a, 2000b). Dans les banques de données gérées par ces logiciels, les coordonnées originales sont conservées dans trois champs qui sont en principe intouchables. Le système de coordonnées et la coordonnée sont conservés dans un champ de type texte; les trois premiers caractères servent à identifier le système de coordonnées utilisé et le reste de la chaîne sert à conserver la coordonnée proprement dite. Un autre champ sert à identifier le datum associé et un troisième champ à indiquer le niveau de précision de la coordonnée. Le tableau 1 illustre quelques exemples de coordonnées originales.

Tableau 1

Exemples de gestion des coordonnées originales

Exemples de gestion des coordonnées originales

Les 3 premiers champs sont intouchables dans la base de données, alors que les 2 derniers champs sont calculés à la demande

a : les codes qui servent à définir le type de système de coordonnées sont arbitraires. deg = degrés décimaux Greenwich ; mgr = military grid system ; lf2 = Lambert France zone II ; nma = Nord Maroc. D’autres codes sont définis pour les autres systèmes de coordonnées.

-> See the list of tables

Parallèlement à ces champs intouchables, on utilise des champs de calcul qui sont générés à partir des coordonnées originales. Ces champs de calculs peuvent contenir les coordonnées en latitude/longitude ou en X/Y d’un système quelconque. Ce système présente les avantages suivants :

  1. les coordonnées originales et leur précision sont conservées en permanence. Il n’y a donc pas de risque de mauvaise interprétation ou de dégradation de la précision;

  2. on peut, au sein d’une même base de données, mélanger des coordonnées de systèmes différents;

  3. les coordonnées de travail peuvent être recalculées à la demande dans des systèmes variés;

  4. les coordonnées de travail peuvent éventuellement être ajustées à une grille quelconque comme par exemple la grille UTM de 10 km.

Tout ceci nécessite l’utilisation d’algorithmes de conversion de coordonnées géographiques au sein des bases de données. Ceux-ci ne sont pas toujours simples à mettre au point. Il existe cependant une littérature abondante à ce sujet et des ressources Internet nombreuses. Parmi les ouvrages pertinents, citons ceux de Rasmont et al. 1986; Rasmont et André 1989; Snyder 1987; EPSG 2000; Iliffe 2000. Parmi les ressources internet les plus intéressantes, citons : www.epsg.org, www.nima.mil, www.helsinki.fi/~rlampine/cartogr.html.

Afin de faciliter l’utilisation de ces algorithmes dans les banques de données, le premier auteur développe actuellement une librairie de programmation dynamique (DLL) qui permet d’assurer facilement des conversions de coordonnées géographiques dans les programmes de la famille Microsoft. Une version d’évaluation est disponible sur demande.