Renforcement de la qualité d’information de l’occupation du sol par l’intégration de données satellitaires optiques et radar en support à la modélisation hydrologique

Hoang, Kim Huong; Bernier, Monique; Duchesne, Sophie; Y Tran, Minh

doi:https://doi.org/10.7202/1054302ar

1. Introduction

Le bassin versant de la rivière Cau (nord du Vietnam) a connu un développement économique important accompagné d’urbanisation et d’industrialisation après l’adoption d’une politique de réforme économique en 1986. Au cours de la première phase du projet Gestion intégrée du bassin versant de la rivière Cau (GIBVC), une étude sur les changements de l’occupation du sol survenus dans la partie aval du bassin versant entre 1993 et 2003 (HOANG, 2007) a fait ressortir une expansion importante du milieu urbain associée à une densification des zones urbaines existantes et à une diminution significative des espaces agricoles. Il en résulte un impact sur la qualité de l’eau surface de trois sous bassins versants en aval du bassin versant de la rivière Cau, soit une augmentation des concentrations en matières en suspension (MES) et en nitrite (NO^2-) ainsi que de la demande chimique en oxygène (COD) et de la demande biologique en oxygène (BOD₅) dans les cours d’eau du bassin versant.

Dans ce contexte, le besoin d’améliorer la gestion intégrée du bassin versant demande de développer des méthodes pour surveiller les changements de l’occupation du sol. La méthode de télédétection optique a été appliquée avec succès pour classifier et cartographier l’occupation du sol entre 1993 et 2003 (HOANG et al., 2008) et peut être considérée comme efficace avec une précision moyenne de 76 %. Néanmoins, les limites et les lacunes de la méthode ont aussi été relevées lorsqu’appliquées à l’échelle détaillée des régions où l’occupation du sol est diversifiée et morcelée et où la couverture nuageuse est fréquente, comme c’est le cas dans le bassin versant de la rivière Cau. La plupart des zones agricoles du bassin versant sont occupées par des cultures vivrières avec prédominance de la riziculture, mais plusieurs d’entre elles n’ont pas pu être extraites par la méthode appliquée en 2007. Selon le Bureau des statistiques générales du Vietnam (2009), pour deux provinces (Thai Nguyen et Bac Kan, les plus grandes de ce bassin versant, occupant 75,5 % de la superficie totale), plus de 66 % des terres agricoles sont occupées par des champs de riz. Les parcelles des rizières du delta du fleuve Rouge, en général, et du bassin versant de la rivière Cau, en particulier, sont morcelées et dispersées. Les cultures de légumes alternent avec des cultures vivrières diversifiées (maïs, manioc, patate, bananiers, canne à sucre, etc.), près des rizières. De plus, la distinction des rizières des autres types de végétation par des images optiques représente un défi étant donné la confusion des signatures spectrales des cultures dans l’optique, durant la saison sèche (sans nuage) en particulier (McCLOY et al., 1987; OKAMATO et FUKUHARA,1996; SHIU et al., 2010). Pourtant, l’information sur les superficies cultivées en riz et leur localisation est importante lors de la modélisation hydrologique. En effet, les rizières ont un impact significatif sur le bilan hydrologique du bassin versant (BOUMAN et al., 2007, WU et al., 1997). Elles agissent comme des milliers de petits réservoirs, qui sont alternativement mis en eau et asséchés en fonction du cycle des cultures. Il est donc important de savoir où sont situées les rizières pour assurer la qualité des simulations hydrologiques.

Afin d’obtenir les informations sur les rizières du bassin versant, l’utilisation des données radar est préférable aux données optiques, puisque les capteurs radar (Synthetic Aperture Radar - SAR/Radar à synthèse d’ouverture - RSO) sont des capteurs haute résolution (<10 m) dits actifs (générant l’énergie) opérant dans les micro-ondes, dont la réponse est indépendante de l’ensoleillement (jour et nuit) et de la couverture nuageuse (fenêtre atmosphérique des hyperfréquences). Cette capacité de recueillir des images sous n’importe quelle condition climatique est importante pour la cartographie des rizières, lesquelles sont souvent situées dans des régions tropicales nuageuses. Dès le début des années 1990, plusieurs recherches (STAPLES et al., 1994; STAPLES et HURLEY, 1996; LETOAN et al., 1997; ROSS et al., 1998; RIBBES et LETOAN,1999; SHAO et al., 2001, LI et al., 2003; BOUVET et al., 2009; OH et al., 2009; LOPEZ-SANCHEZ et al., 2011) ont montré l’efficacité des données radar en double-polarisation et polarimétriques pour l’identification et la surveillance des rizières. Les images utilisées dans ces travaux proviennent des satellites ERS-1,2, RADARSAT-1, ASAR/ENVISAT, PALSAR/ALOS, TerraSAR-X et RADARSAT-2. Il y a aussi des applications des données radar pour le suivi des rizières dans le delta du fleuve Mékong au sud du Vietnam (LAM DAO, 2005, 2007; BOUVET et al., 2009), où les rizières sont homogènes et couvrent de grandes superficies. Toutefois, l’utilisation des images RADARSAT-2 pour détecter les parcelles de riz relativement petites au nord du Vietnam n’a pas été relevée dans la littérature. Ce satellite a un cycle de répétitivité de 24 jours, qui est adéquat pour suivre chaque stade de croissance du riz, qui dure 30 jours en moyenne. L’imagerie RADARSAT-2 en mode standard et double polarisation (HH, HV) a donc été retenue dans cette étude pour la cartographie des rizières de l’ensemble du bassin versant. Quatorze images correspondant aux deux saisons de culture du riz (environ une par mois) et couvrant l’ensemble du bassin ont été acquises. La polarimétrie radar a aussi été exploitée, mais à l’échelle d’un sous-bassin étant donnée la couverture limitée des images polarimétriques en mode fin (650 km²).

Par contre, les images radar seules peuvent conduire à une certaine confusion entre les classes, laquelle peut être surmontée par la classification orientée-objet d’images optiques, tel qu’expliqué plus en détail ici-bas. Or le bassin versant est trop grand (6 030 km²) pour une couverture à un coût raisonnable avec des images optiques de résolution inférieure à 3 m, telles GeoEye-1 (lancé le 6 septembre 2008) ou Quickbird (lancé le 10 octobre 2001), puisque plus d’une vingtaine d’images seraient nécessaires. En effet, l’acquisition d’une seule couverture nécessiterait plusieurs jours (orbites différentes) sans avoir la garantie d’une couverture sans trop de nuages. C’est pourquoi l’utilisation d’une couverture SPOT-4, 20 m de résolution spatiale (coût raisonnable, courte période d’acquisition, deux orbites voisines), a été retenue. Cinq images SPOT-4 sont nécessaires pour couvrir tout le bassin versant.

Afin de surmonter les limites mentionnées ci-dessus et d’améliorer les informations de l’utilisation du territoire d’un grand bassin versant tropical comme celui de la rivière Cau, des données otiques (SPOT-4) et radar (RADARSAT-2) ont été intégrées. Cette approche a été préférée à la fusion des données multisources à l’aide d’algorithmes de fusion existants (p. ex. POHL et VAN GENDEREN, 1997). En effet, cette façon de faire ne donne pas toujours une classification plus précise puisqu’elle est limitée par certains facteurs, dont l’incertitude au sujet de la validation de l’algorithme de fusion, la disponibilité des données sur le terrain et la complexité du paysage (POHL et VAN GENDEREN, 1997; ZHANG, 2010). D’un autre côté, l’idée de cartographier l’occupation du sol incluant les rizières en utilisant uniquement des images RADARSAT-2 a également été envisagée. Néanmoins, l’utilisation des données en polarisation double (mode standard, résolution spatiale 25 m) ferait face au même problème que l’utilisation des données optiques, soit la confusion entre le riz et les autres types de végétation. Par ailleurs, il serait pertinent d’utiliser des données radar de haute résolution (en mode fin ou ultra-fin), mais ceci nécessiterait plusieurs images pour un bassin versant de celui de la rivière Cau (6 030 km²). C’est pourquoi l’intégration des résultats des classifications à partir d’images optique et radar a été privilégiée pour la cartographie de l’occupation du sol (incluant les rizières) du bassin versant étudié.

La nécessité de documenter l’état de l’occupation du sol du bassin versant de la rivière Cau, afin de quantifier les répercussions sur l’environnement des activités humaines, en tenant compte de leur dimension géographique (spatiale) dans le bassin versant, a conduit au projet de recherche présenté dans cet article, qui vise à répondre aux questions suivantes : 1) Quel moyen permet d’obtenir une classification d’occupation du sol représentative de la complexité et du morcellement du bassin étudié? 2) Quelles sont les méthodes aptes à distinguer les rizières des autres types de cultures à l’échelle régionale, dans le contexte d’une utilisation du sol fragmentée et dans une région tropicale comme celle de la zone d’étude? L’objectif principal des travaux présentés dans cet article est de développer une méthode permettant de créer des cartes d’occupation du sol qui précisent l’étendue des rizières dans des zones où l’occupation du sol est fortement morcelée, par l’intégration des résultats de classification des images radar et optiques. La méthode développée doit également être adaptée à la modélisation hydrologique et de la qualité de l’eau. Une application de la méthode est présentée pour le bassin versant de la rivière Cau.

2. Zone d’étude et données disponibles

2.1 Bassin versant de la rivière Cau

Le bassin versant de la rivière Cau est situé au nord du Vietnam entre 21,07° et 22,18° de latitude Nord et entre 105,28° et 106,08° de longitude Est (Figure 1). Sa superficie totale est de 6 030 km². Il inclut le territoire (entier ou partiel) de six provinces au nord-est du Vietnam, soit : Bac Kan, Thai Nguyen, Vinh Phuc, Bac Giang, Bac Ninh et Ha Noi. Avec une longueur de 288,5 km, la rivière Cau est la plus importante du système du fleuve Thai Binh. Le bassin versant de la rivière Cau est constitué de 68 sous-bassins de dimensions variables. La densité de drainage y est d’environ 0,95 km∙km^-2. La région est soumise à un climat tropical humide de type mousson caractérisé par deux saisons principales : l’hiver (de novembre à mars), froid et sec, et l’été (de mai à octobre), chaud, humide et pluvieux. La température est différenciée par l’altitude et les saisons. Le bassin versant est caractérisé par un réseau hydrographique complexe et de type dendritique, pour lequel le régime hydrologique varie suivant deux saisons : la saison des pluies (saison d’inondation) et la saison sèche (saison de faible débit).

Figure 1

Représentation physiographique du bassin versant de la rivière Cau illustrant ses cinq principaux affluents et les zones montagneuses. L’encadré montre sa localisation (en rouge) au nord du Vietnam.

**Physiography of the Cau River watershed illustrating its five major tributaries and mountainous areas. The inset shows its location (in red) in Northern Vietnam.**

Les analyses présentées dans cet article ont été réalisées sur un sous-bassin versant situé en situation intermédiaire du bassin versant de la rivière Cau. Ce sous-bassin inclut la plupart du territoire de la province de Thai Nguyen et une partie de la province de Bac Kan. La superficie de ce sous-bassin versant est de 4 432 km², et occupe environ 73 % de la superficie totale du bassin versant de la rivière Cau. Selon l’Office de statistique de la province de Thai Nguyen (OSTN, 2010), la superficie des terres agricoles et les rizières occupaient respectivement 78,08 % et 12,25 % de la superficie naturelle de la province de Thai Nguyen. Quant à la province de Bac Kan, l’agriculture y est une source de subsistance pour de nombreux habitants. La superficie des terres agricoles occupe environ 5,2 % de la province. Les cultures vivrières principales sont, par ordre d’importance, le riz, le maïs, la pomme de terre et le manioc (OSB, 2009).

2.2 Données satellites

En raison de la taille du sous-bassin versant étudié (4 432 km²), cinq scènes d’image SPOT-4 du capteur HRVIR-2, trois en novembre 2007 et deux en janvier 2008, ont été nécessaires pour produire une carte de l’occupation du sol qui couvre l’ensemble de la région (Figure 2). Ces images sont en mode multispectral avec quatre bandes : vert (0,50-0,59 µm), rouge (0,61-0,68 µm), PIR (0,79-0,89 µm) et MIR(1,58-1,75 µm) à 20 m de résolution et avec zéro pourcentage (0 %) de couverture nuageuse. Il faut noter que la bande spectrale moyenne infrarouge (MIR) est particulièrement sensible au couvert végétal.

Figure 2

**Localisation (cadres orange) et dates des scènes SPOT-4 acquises.**

**Location (orange frames) and dates of SPOT-4 scenes acquired.**

Grâce au programme SOAR-E (Science and Operational Applications Research - Education), de l’Agence spatiale canadienne (ASC), deux séries d’images RADARSAT-2 couvrant deux zones différentes (Figure 3) au centre du bassin versant ont été acquises (de mai 2009 jusqu’à mai 2010). Ces deux séries consistent en des images à double polarisation (HH et HV) en mode standard (S5, résolution spatiale de 25 m) et des images polarimétriques (quatre polarisations, HH, VV, HV et VH, plus leur différence de phase) en mode fin (résolution spatiale de 9 m). Parmi les modes standards (fauchées de 100 km) de RADARSAT-2, le mode S5 de l’orbite descendante a été choisi parce qu’il couvre toute la zone d’étude. De plus, des angles d’incidence de l’ordre de 40° favorisent la diffusion de volume, ce qui permet une meilleure distinction des types de couvertures végétales (STAPLES et al., 1994; LIEW et al., 1998; PANIGRAHY et al., 1999; SHAO et al., 2001). Les données polarimétriques ou quad-pol (Q) du satellite RADARSAT-2 en mode fin (F) ont aussi été acquises dans les mêmes angles d’incidence que les images S5. Ce mode se nomme FQ21.

Figure 3

llustration des deux sites de test affichés sur une image RADARSAT-2. Le site 1 (en jaune) est un sous-bassin versant (Thai Nguyen). Le site 2 (en vert) est la partie centrale du bassin versant, où l’occupation du sol est diversifiée et morcelée.

Illustration of two test sites displayed on a RADARSAT-2 image. Site 1 (in yellow) is a sub-watershed (Thai Nguyen). Site 2 (in green) is the central part of the watershed, where the land cover is diversified and fragmented.

2.3 Données auxiliaires

2.3.1 Modèle numérique d’altitude

Un modèle numérique d’altitude (MNA) a été utilisé pour prendre des points de contrôle et effectuer une orthorectification des images SPOT-4. Ce MNA a été créé par VTGEO (Centre de Télédétection et Géomatique, Hanoi, Vietnam), à partir des courbes de contour extraites d’une carte topographique à l’échelle du 1:25 000 et sa résolution spatiale est de 30 m. Ce MNA a été ré-échantillonné à 9 m de résolution spatiale lors de la correction géométrique des résultats dérivés de données polarimétriques.

2.3.2 Cartes de référence

Le tableau 1 présente les deux cartes de référence utilisées durant l’étude, qui sont :

La carte topographique numérique (2005) couvrant l’ensemble du bassin versant. Cette carte a été utilisée lors de la correction géométrique des images et du choix des zones étudiées.
La carte d’occupation du sol de la province de Thai Nguyen (2000), obtenue par interprétation visuelle d’images LANDSAT ETM+, qui a été utilisée en vue de choisir les sites d’entraînement lors de la classification. Cette carte a été validée avec une précision globale de 87 %.

2.3.3 Données de validation

Les données de validation (Tableau 2), soit la carte d’utilisation du sol (2010) de la province de Thai Nguyen, qui a été utilisée pour la validation de la précision des classifications dérivées des images SPOT-4 et des images RADARSAT-2. Pour être capable d’utiliser cette carte d’utilisation du sol lors de la validation, elle a été transformée en carte d’occupation du sol en consultant le système de classification d’utilisation/d’occupation du sol de l’USGS (United States Geological Survey) (ANDERSON et al., 1976). Cette transformation d’utilisation vers occupation a donc permis de regrouper et de renommer les classes pour que la carte soit compatible avec celle de la classification.

Tableau 2

**Information sur les données de validation.**

**Information on validation data.**

2.3.4 Données statistiques

Les données statistiques recueillies comprennent la superficie des types d’utilisation du sol en 2007 et celle de deux saisons de riz en 2009. Elles servent à l’étape de validation qualitative des classifications en comparant la superficie issue des statistiques et celle issue de la classification, pour le milieu agricole et les rizières. Ces données proviennent de l’Office de l’agriculture et du développement rural des provinces de Thai Nguyen et de Bac Kan (OADR, 2007) et de l’Office général de la statistique (OGS, 2007).

2.3.5 Données de terrain

En ce qui concerne les données de terrain, les informations de 25 points d’observation et de 10 champs expérimentaux ont été collectées sur le terrain lors de trois campagnes. Une première campagne de terrain a été effectuée à Thai Nguyen en décembre 2007, soit pendant la période d’acquisition des images SPOT-4. Dans cette mission, la carte de l’occupation du sol dérivée de l’image LANDSAT ETM+ (2003) et la carte topographique à l’échelle 1:50 000 ont servi à vérifier les classifications de l’étude précédente (HOANG, 2007) et à identifier les types d’utilisation du sol des parties centrale et nord-est de la province de Thai Nguyen, où l’occupation du sol est variée et morcelée.

Les deux autres campagnes de terrain ont été effectuées sur des périodes plus longues, soit de décembre 2009 à février 2010, durant l’acquisition de quelques images RADARSAT-2, et ensuite de février 2012 à juin 2012, et cela une fois par mois. La campagne terrain de 2012 couvre une saison complète de culture du riz. Le but de ces missions était de recueillir des informations à propos de l’activité agricole (calendrier agricole, irrigation, localisation des divers types de culture) et d’identifier l’état des champs au moment de l’acquisition des images RADARSAT-2.

3. Méthodologie

La méthodologie générale pour la création de la carte qui sera utilisée en entrée du modèle hydrologique consiste en trois étapes principales qui sont : 1) la création d’une carte d’occupation du sol qui ne distingue pas les rizières des autres superficies agricoles, par la classification orientée-objet d’images optiques du satellite SPOT-4; 2) la distinction des rizières des autres types de culture, par l’analyse d’images RADARSAT-2 en bande-C; et 3) l’intégration des résultats issus des deux étapes précédentes. L’impact des rizières sur la modélisation hydrologique a également été estimé à partir des données issues de cette carte. La méthodologie de chaque étape est détaillée dans les sections suivantes.

3.1 Classification orientée-objet des images optiques

La classification orientée-objet a été utilisée dans plusieurs recherches et se montre efficace pour classifier l’occupation du sol en utilisant des données satellite de moyenne et de haute résolutions, lorsqu’appliquée sur des régions où le paysage est fragmenté et hétérogène dans les zones agricoles et périurbaines (WALTER, 2004; WHITESIDE et AHMAD, 2005; WEIH et RIGGAN, 2010). Elle donne un résultat plus réaliste (les classes classifiées se rapprochent des classes réelles) que celui de la classification pixel par pixel (ROBERTSON et KING, 2011). Ce qui ressort de tous les travaux précédents est la capacité de la méthode à mieux distinguer les différentes classes de l’occupation du sol, parce qu’elle permet de diminuer les confusions, de mieux distinguer les objets dans les zones caractérisées par une intercalation de type côte à côte des différents types d’état de surface, comme c’est le cas dans le bassin de la rivière Cau, et donc d’obtenir un meilleur résultat.

L’idée de base de la méthode est d’opérer la classification non pas sur des pixels, mais sur des groupes de pixels homogènes (régions ou objets). Autrement dit, l’approche orientée-objet se base sur l’hypothèse selon laquelle l’information sémantique nécessaire à l’interprétation d’une image n’est pas représentée dans les pixels individuels, mais dans des objets d’image significatifs et leurs relations mutuelles (DEFINIENS IMAGING, 2004; HOFMANN, 2001; BAATZ et SCHÄPE, 2000). Cette méthode divise une image en régions ou entités homogènes. Elle tient compte non seulement des caractéristiques spectrales des pixels, mais également des notions de forme, de texture et de voisinage dans le processus de classification (JENSEN, 2005; RIGGAN et WEIH, 2009; CHEN et al., 2009; WEIH et RIGGAN, 2010; ROBERTSON et KING, 2011).

La classification orientée-objet s’effectue selon deux phases principales: la segmentation et la classification; sa démarche générale est présentée à la figure 4. À partir des couches (bandes) choisies, l’algorithme de segmentation multirésolution (BAATZ et SCHÄPE, 2000; SCHIEWE et al. 2001) a été appliqué afin de créer une image, appelée image segmentée, incluant des objets-images (segments) qui deviendront le support pour les classifications à venir. Cette image nous permet de réaliser l’étape suivante, la création hiérarchique, qui comprend le choix des classes thématiques et la définition de ces classes. Une fois la hiérarchie des classes établie, la classification est effectuée en utilisant le classificateur choisi. Finalement, la validation de la précision permet de décider de garder le résultat de classification obtenu ou de retourner à la définition des classes pour refaire une autre classification. Le détail de chaque phase de traitement est présenté dans les trois sous-sections suivantes.

Figure 4

**Organigramme de la classification orientée-objet.**

**Organizational chart of object-oriented classification.**

3.1.1 Prétraitement des images

3.1.1.1 Correction géométrique

La transformation géométrique locale (CALOZ et COLLET, 2001) a été appliquée sur les images SPOT-4. Cette transformation, reposant sur la prise en compte de la géométrie de prise de vue et du relief, permet de produire une ortho-image à l’aide d’un modèle numérique d’altitude (MNA). Le modèle Satellite Orbital Modelling, développé par TOUTIN (1983, cité par TOUTIN, 1992) et intégré dans le logiciel PCI Geomatica, a été utilisé. Un MNA de 30 m de résolution, les images optiques déjà géoréférencées et des données vectorielles extraites de la carte topographique ont été utilisés afin de prendre des points de contrôle (Ground Control Point - GCP). Le nombre de GCP varie de 9 à 20, dépendamment de chaque image. Les cinq images ont toutes été géoréférencées dans le système de coordonnées UTM (Universal Transverse Mercator), zone 48 Nord, WGS84. Dépendamment de l’image, la précision de la correction varie de 0,5 à 0,64 pixels pour les images SPOT 4.

Le choix des classes thématiques est l’étape préalable au processus de classification. Cette étape est importante pour le travail présenté dans cet article, puisque les classes choisies doivent convenir non seulement à la capacité des images à fournir des informations, mais aussi aux critères requis pour une base de données d’entrée d’un modèle hydrologique tel HYDROTEL (FORTIN et al., 1995), le modèle hydrologique utilisé dans GIBSI (ROUSSEAU et al., 2000). Pour choisir des classes appropriées, nous avons donc consulté : 1) le système de classification d’utilisation/d’occupation du sol de l’USGS (ANDERSON et al., 1976); 2) les confusions identifiées entre les catégories lors de la classification précédente réalisée par HOANG (2007) à partir d’images LANDSAT-ETM+ et 3) les critères de sélection des classes d’occupation du sol pour le modèle HYDROTEL.

Le tableau 3 montre six classes principales et leur description pour la classification de l’occupation du sol du bassin versant de la rivière Cau. Toutefois, il faut considérer avec prudence la détermination des classes du milieu agricole parce que la présence de végétation varie selon les mois de l’année. De plus, pendant la période entre les récoltes (champs nus), les terres agricoles présentent sur les images des valeurs de réflectance similaires à celles d’un sol sans couverture végétale.

Tableau 3

**Les six classes thématiques de la carte de l’occupation du sol.**

**Six thematic classes of the land cover map.**

En réalité, la période des champs nus n’est qu’un état temporaire. Si on identifie des surfaces nues dans une classification, il faut donc vérifier si ces surfaces demeurent toujours dans cet état ou si elles sont couvertes d’une végétation quelconque à une autre période de l’année. Si c’est le cas, on ne peut pas identifier comme « sol nu » les surfaces qui ne le demeurent pas constamment. Ceci est particulièrement vrai dans le cas du riz. La classe des rizières a donc été séparée des autres types de culture à cause de son cycle de culture particulier, mais aussi en raison de l’inondation ponctuelle des champs, qui peut avoir des effets importants sur la modélisation hydrologique. L’identification de cette classe a été dérivée à partir d’images RADARSAT-2 (section 3.2).

3.1.2 Segmentation multirésolution des images

La première étape dans l’approche de la classification orientée-objet est la segmentation de l’image afin de diviser l’image en objets (segments) homogènes. La segmentation multirésolution a été utilisée, puisqu’il s’agit d’un algorithme considéré performant pour la classification d’un milieu hétérogène (BURNETT et BLASCHKE, 2003; RAHMAN et SAHA, 2008). Cet algorithme (équations 1, 2 et 3) est implémenté dans le logiciel eCognition; il se base sur la fonction générale de segmentation (BAATZ et SCHÄPE, 2000; BENZ et al., 2003; DEFINIENS IMAGING, 2004; JENSEN, 2005) :

où f est la valeur de fusion globale (ou la croissance de l’hétérogénéité); w_couleur est le poids donné à l’information spectrale (couleur), défini par l’usager (0 ≤ w_couleur ≤ 1); h_couleurest l’hétérogénéité spectrale d’un objet d’image, calculée par la différence de la somme du produit des écarts-types des valeurs spectrales (σ_c) et du poids de chaque couche (bande) de l’image (w_c) entre les objets originaux (obj1 et obj2) et fusionnés (fusion); h_forme est l’hétérogénéité de forme, définie par la compacité (compactness, hcmpct) et le degré de lissage (smoothness, h_lissage); w_cmpct est le poids donné à la compacité; et n est le nombre de pixels dans chaque objet.

Le procédé de segmentation a été effectué en définissant les trois paramètres suivants: le poids des couches (bandes spectrales) employées, l’échelle et la composition des critères d’homogénéité. Les valeurs de ces trois paramètres ont été choisies après plusieurs tests de vérification visuelle des résultats. Cette phase a été effectuée sur les quatre bandes spectrales du capteur HRVIR (SPOT-4). Le choix des valeurs pour chacun des paramètres est justifié ici-bas :

Le poids des couches (bandes) détermine l’importance relative des bandes utilisées dans la segmentation. Dans les analyses présentées dans cet article, les quatre bandes spectrales (vert, rouge, PIR et MIR) ont été utilisées et leur poids était égal à 1 puisque les informations sur ces bandes sont importantes pour la segmentation de la zone d’étude. où l’occupation du sol est dominée par la végétation.
Le paramètre d’échelle est une valeur abstraite qui détermine l’hétérogénéité maximale permise pour les objets résultants de l’image. Pour des données hétérogènes, il est recommandé de fixer un paramètre d’échelle plus petit que pour des données plus homogènes. La segmentation à un seul niveau ne permet pas de bien distinguer des objets qui ont la même valeur spectrale à partir d’images à faible ou moyenne résolution, en particulier pour une occupation du sol morcelée comme celle du bassin versant étudié. L’idée de cette étape est de segmenter l’image SPOT-4 en deux niveaux d’échelle (figure 5) : le Niveau 1 à grande échelle (G) et le Niveau 2 à petite échelle (P). Après avoir testé quelques valeurs, les valeurs de 80 (G) et de 20 (P) sont attribuées au facteur d’échelle pour chacun des niveaux d’échelle.
L’homogénéité de l’objet auquel se réfère le paramètre d’échelle est définie par la composition du critère d’homogénéité. L’homogénéité est utilisée ici comme synonyme d’hétérogénéité réduite et est définie par la couleur et la forme (shape), qui elle-même est définie par la compacité (compactness) et le lissage (smoothness). Ainsi, le paramètre de couleur est un facteur qui balance l’homogénéité de la couleur et de la forme d’un objet (segment). La valeur de ce paramètre varie de 0 à 1, de même que celle de son complément, le paramètre de forme. La somme de la valeur du paramètre de couleur et de celle du paramètre de forme est toujours égale à 1. Si on désire mettre un plus grand accent sur les caractéristiques spectrales que sur les caractéristiques de forme, la valeur du paramètre couleur est plus forte. Quand la valeur de forme est supérieure à 0, le paramètre de forme est séparé en deux paramètres distincts, qui sont la compacité et le lissage. Le paramètre de lissage est utilisé pour optimiser les objets de l’image en tenant compte de l’aspect « arrondi » des bordures d’objet. Il est conseillé d’utiliser ce paramètre lorsque les données sont très hétérogènes. Quant au paramètre de compacité, il est employé pour optimiser les objets en tenant compte de la compacité des bordures. Ce paramètre doit être utilisé en présence d’objets plutôt compacts qui sont séparés d’objets non compacts par un contraste relativement faible. Ces objets, en général, ont des signatures spectrales similaires, mais des formes très différentes.

Figure 5

**Segmentation des images SPOT-4 selon deux niveaux : a) Niveau G, b) Niveau P.**

**Segmentation of SPOT-4 images at two levels: a) Level G, b) Level P.**

Pour les deux niveaux de segmentation dans ce travail, la valeur choisie pour le facteur de couleur est de 0,9 (la valeur du critère de forme est donc de 0,1). La valeur des paramètres de compacité et de lissage a été fixée à 0,5 pour le Niveau G, puisque le but de ce niveau est de former des grands objets en se basant sur le critère de couleur (spectrale); ainsi, l’importance de la compacité et du lissage des objets est égale. Par ailleurs, puisque le but du Niveau P de segmentation est d’extraire des petits objets qui ont des signatures spectrales similaires, le facteur de couleur est conservé à 0,9; cependant, il est préférable de choisir pour ce niveau un poids plus grand pour le paramètre de compacité (0,9) que pour le lissage (0,1) lors de la définition des valeurs du critère de forme. Cela permet d’obtenir le maximum de pureté et de « solidité » des objets.

3.1.3 Classification hiérarchique

En tenant compte de la complexité de l’occupation du sol de la zone d’étude, pour laquelle la hiérarchie des classes est complexe, la classification hiérarchique a été appliquée. Cette méthode utilise une logique prédéfinie pour activer et désactiver les classes en fonction de règles et des relations mutuelles et sémantiques entre les classes (DISSANSKA et al., 2009; TRIMBLE, 2011). La démarche de la méthode est expliquée par l’exemple concret présenté dans la section 3.1.3.1. La classification appliquée est basée sur la logique floue (ZADEH, 1965), implantée dans le logiciel eCognition. Cette approche permet de classifier des objets en considérant leurs attributs ou différentes caractéristiques (par ex. spectrales, spatiales ou contextuelles), dans la description des classes, par des opérateurs logiques. Elle permet aussi d’estimer l’association possible des objets aux autres classes. Il s’agit de déterminer la classe thématique d’un objet en vérifiant si ses caractéristiques satisfont à la description ou aux conditions typiques de la classe. De cette manière, elle permet d’améliorer la classification des objets. Il est d’abord important, pour appliquer cette méthode, de construire une hiérarchie des classes thématiques (Figures 6a et 6b) et ensuite d’effectuer la classification (Figure 7).

Figure 6

**Exemples : (a) hiérarchie des classes thématiques, niveaux G et P; b) description d’une classe.**

**Examples of a) thematic class hierarchy, levels G and P; b) class description.**

Figure 7

**Schéma de la classification hiérarchique.**

**Hierarchical classification scheme.**

3.1.3.1 Hiérarchie des classes thématiques

La hiérarchie des classes est la base de connaissances pour la classification des objets d'une image. Elle contient l’ensemble de toutes les classes, avec leurs échantillons d’entraînement et leur description spécifique. La description des classes (Figure 6b) contient les expressions décrivant les caractéristiques des objets, ce qui détermine l’appartenance à chaque classe. Il y a deux modes pour déterminer la relation des objets dans la hiérarchie créée : le mode de classification sans caractéristique liée aux classes (without class-related feature) et celui avec caractéristiques liées aux classes (with class-related feature). Le premier mode est approprié dans le cas d’une hiérarchie simple, pour laquelle il n’existe pas de connexion entre les objets des classes. Par contre, le second mode sera utilisé lorsqu’un objet est lié à des objets voisins, à des sous-objets (niveau inférieur) ou à des super-objets (niveau supérieur).

Le tableau 4 présente les classes nécessaires pour la classification correspondant à chacun des deux niveaux de segmentation (Figure 5). Pour le Niveau G, il y a 12 classes correspondant aux quatre principaux types d’occupation du sol du bassin versant (Forêt incluant les plantations, Urbain, Eau, Terre agricole) à différents niveaux de densité et/ou d’hétérogénéité. Le Niveau P comprend des classes thématiques pures incluses dans les classes mixtes (AGR_URB1, PLA_AGR1 et Forêt 1B) du Niveau G. Les classes de ces deux niveaux sont reliées entre elles pour créer la classification finale. Les deux niveaux désignés Niveau G et Niveau P sont constitués de classes appelées « abstraites » puisque ces classes ne représentent pas des classes de l’occupation du sol, mais permettent de garder les classes hiérarchiques en transparence. Ces classes « abstraites » sont caractérisées seulement par leur numéro de niveau de segmentation. Cette condition permet de limiter les applications aux objets correspondants à leur niveau de segmentation. C’est-à-dire que les règles de classification du Niveau G sont appliquées aux objets d’image du Niveau G de la segmentation et que celles des classes du Niveau P agissent uniquement sur les objets d’image du Niveau P de segmentation.

Tableau 4

**Classes thématiques de chaque niveau de la classification et relation super-objets des sous-classes.**

**Thematic classes for each level of classification and the super-object relationship of subclasses.**

3.1.3.2 Processus de la classification hiérarchique

Comme classificateur, l’algorithme du plus proche voisin ainsi qu’une combinaison de cette approche et des fonctions d’appartenance ont été appliqués. Le processus détaillé de la classification hiérarchique appliquée sur le cas du bassin versant de la rivière Cau est présenté à la figure 7.

La classification commence par le Niveau G; le but est alors de séparer les zones hétérogènes de l’occupation (mélange de végétation, de terres agricoles et de zones résidentielles) des autres types homogènes de l’occupation (la forêt, l’eau et les zones urbaines de forte densité). Pour ce faire, 12 classes ont été créées (Tableau 4); elles correspondent à des classes plus homogènes (séparées par d’autres classes) comme les lacs, les rivières, les forêts et les terres agricoles. Les classes mixtes, comme PLA_AGR1, AGR_URB1, Forêt 1B et Terre-agri 1, sont ensuite utilisées pour la segmentation et la classification du niveau le plus fin. Ces classes peuvent être considérées comme des classes « parents ». À ce niveau, le classificateur du plus proche voisin standard et la fonction d’écart-type (qui calcule l’écart-type des objets selon des caractéristiques définies et celles de leurs voisins) ont été appliqués (Figure 7, étape 1).

L’occupation du sol dans la plaine du bassin versant est morcelée (les maisons alternent avec un couvert végétal diversifié : les jardins familiaux, les cultures vivrières et les plantations). Or une classification directe, c.-à-d. à un seul niveau de segmentation et/ou pixel par pixel, ne peut pas extraire de manière satisfaisante ces types d’objets. Pour cette raison, la classification hiérarchique avec caractéristique liée aux classes a été appliquée sur le Niveau P. La classification d’une classe au Niveau P (Figure 7, étape 3) se base sur les connexions entre les voisins et entre les super-objets du Niveau G, en utilisant une combinaison du classificateur du plus proche voisin, de la fonction d’écart-type et de la fonction d’appartenance « existence de super-objets » (qui contient les sous-objets du niveau inférieur de la hiérarchie qui ont une relation avec les objets du niveau supérieur). Le but de cette classification est de chercher les objets des classes « enfants » : Urbain A (zone résidentielle forte densité), Urbain B (zone résidentielle faible densité), Constructions, Terres agricoles, Milieu arbustif, Plantations et Petits lacs, à partir des classes « parents » mélangées. Lorsque l’on recherche des classes au Niveau P, seuls les objets de la segmentation du Niveau P qui ont une ou plusieurs relations sémantiques avec les classes « parents » choisies à travers les fonctions d’appartenance sont classés dans la classe définie. Ainsi, la classification ne fonctionne pas sur les objets du Niveau P qui n’ont pas de relation sémantique avec les classes « parents » choisies, même si leur valeur spectrale est la même. Le Niveau G joue donc un rôle de masque, ce qui permet de limiter au maximum la confusion entre les objets différents, mais de valeur spectrale similaire. Par exemple, la classe Urbain 2A (zone résidentielle de forte densité) est formée d’objets classifiés en tant que Urbain 1A (urbain forte densité) au Niveau G et d’objets du Niveau P semblables, selon la fonction d’écart-type, et qui sont soit dans la classe AGR_URB ou PLA_AGR1 du Niveau G (Figure 6). Ce processus est effectué sur chaque sous-classe du Niveau P (Tableau 4). Une telle organisation des relations horizontales (les voisins) et verticales (super-objets) nous permet de diminuer la confusion entre les classes.

3.1.4 Validation de la carte d’occupation du sol

Essentiellement, l’évaluation de la précision peut être un processus quantitatif ou qualitatif. Ces deux processus ont été appliqués dans les travaux présentés ici.

Avec les données statistiques qui proviennent de l’Office général de la statistique (OGS), nous avons fait une validation qualitative, qui consiste à comparer la superficie cultivée en 2007 avec celle de la classification du milieu agricole issue des images SPOT-4 de l’hiver 2007-2008. Seul le milieu agricole a été choisi pour cette comparaison puisqu’il s’agit de la seule classe pour laquelle nous avons des données statistiques à l’échelle du district.

L’évaluation quantitative de la précision a été réalisée à l’aide de la matrice d’erreurs ou matrice de confusion (CONGALTON et GREEN, 2009). Ce processus consiste en la comparaison de deux sources d’information, celle de l’image classifiée et celle de l'information de référence pour le même site. L’information de référence est soit collectée sur le terrain, soit extraite d’autres types de données comme des photos aériennes ou des cartes de la même période que l’image classifiée.

La démarche d’évaluation de la précision consiste à déterminer un nombre d’échantillons de référence calculé en supposant une distribution multinomiale des valeurs. Ces équations sont recommandées lorsqu’on souhaite estimer la précision de multiples classes par la matrice d’erreurs (CONGALTON et GREEN, 2009).

où n est le nombre d’échantillons; i est l’identifiant de la classe pour laquelle la proportion de la surface est la plus proche de 50 %; Π_i est la proportion de la surface de la classe i; b_i est la précision souhaitée de la classe i; B estv le α/k x 100^e centile de la distribution χ² avec un degré de liberté. Cette valeur est déterminée à partir de la table de la loi de χ² pour 1-α/k; α est le degré de confiance et k est le nombre de classes.

L’équation 4 a été appliquée pour calculer le nombre total d’échantillons de référence nécessaire afin de valider la précision des deux niveaux de la classification. Étant donné un intervalle de confiance attendue de 90 %, une erreur admissible de 5 % et une proportion des classes dominantes de 71 % (Niveau P) et de 60 % (Niveau G), pour les cinq classes, on obtient un nombre de 458 échantillons pour le Niveau P, soit 92 échantillons par classe, et de 637 échantillons pour le Niveau G, soit 212 échantillons par classe. Ces échantillons ont été choisis aléatoirement à partir de la carte de l’occupation du sol de référence de 2010 (Tableau 2). Les informations issues des échantillons de référence ont ensuite été comparées avec celles de la classification dérivée d’images SPOT-4. À cette étape, la matrice d’erreurs (matrice de confusion), qui permet de calculer les erreurs de la classification, a été créée. Il existe deux types d’erreurs en classification : les erreurs de commission et les erreurs d’omission. Ces deux types d’erreurs permettent d’établir les mesures de précision d’une classification : la précision du producteur (qui est le complément de la mesure des erreurs d’omission) et la précision de l’utilisateur (qui est le complément de la mesure des erreurs de commission). La précision de l’utilisateur est la probabilité qu’un pixel classifié dans une classe thématique donnée, par le processus de classification, représente réellement un élément de cette classe sur le terrain. La précision du producteur est la probabilité qu’un site de vérification d’une classe soit identifié correctement comme appartenant à cette classe sur l’image classifiée. La matrice d’erreurs permet également de calculer la précision globale (le total des pixels bien classifiés par rapport au total des pixels dans la matrice d’erreur) et l’indice Kappa de Cohen (K), une autre mesure de l’accord de la précision. Une valeur de K > 0,8 représente une forte précision entre l’information de la carte de la classification et celle des données de référence. Lorsque la valeur de K varie entre 0,4 et 0,8, ceci correspond à une précision modérée. Les détails concernant la matrice d’erreurs et les équations pour calculer la précision du producteur, la précision de l’utilisateur et l’indice K sont présentés dans CONGALTON et GREEN (2009).

3.2 Identification des rizières à l’aide d’images radar

Par rapport à d’autres types de végétation, les cultures inondées telles que les rizières ont une forte rétrodiffusion (quantité d'énergie retournée vers l’antenne du radar) en présence d’eau sur les cultures. Deux approches ont été appliquées sur les images RADARSAT-2 pour l’identification des rizières. Une approche de seuillage d’images sur la variation temporelle du signal en polarisation HH a été appliquée sur la série d’images en mode standard (S5), acquises entre les mois de mai 2009 et d’avril 2010, à l’aide du logiciel ArcGIS. La classification SVM (Support Vector Machine) a été appliquée aux deux images polarimétriques en mode fin représentant la période de mi-saison (lorsque le signal du riz est le plus fort) des deux saisons de culture du riz étudiées, soit les images du 21 août 2009 et du 18 avril 2010, en utilisant le logiciel PolSARpro. Le détail du prétraitement, de la méthodologie et des processus de traitement d’images est présenté dans HOANG et al. (2016). Les sous-sections suivantes présentent une description générale des deux approches.

3.2.1 Correction géométrique

L’approche photogrammétrique qui a été appliquée sur les images radar (mode S5) se base sur le modèle mathématique appelé le modèle de TOUTIN (1995). Ce modèle mathématique a été utilisé pour la majorité des images radar satellites (SEASAT, SIR-C, JERS, ERS, ENVISAT, RADARSAT, PALSAR, TerraSAR-X) acquises sur des environnements topographiques différents dans des conditions opérationnelles très variées (CLAVET et al., 2011). Il tient compte des principes de la radargrammétrie pour traiter la géométrie spécifique des images radar. Pour appliquer le modèle, des images SPOT-4 déjà géoréférencées, des données vectorielles (le réseau routier) et un MNA de 9 m de résolution couvrant l’ensemble du bassin versant ont été utilisés. Le nombre de points d’appui varie de 8 à 18; la précision de la correction varie de 0,25 à 0,8 pixel en fonction de la scène de l'image (topographie variable).

3.2.2 Identification des rizières par seuillage

La technique de seuillage est une méthode de base utilisée pour identifier les rizières en fonction de l’analyse de la variation temporelle de la rétrodiffusion (σ⁰) du riz. La méthodologie est basée sur une technique de l’image du rapport, utilisée pour qualifier les changements temporels entre plusieurs images SAR (trois dates par saison dans le cas de cette étude). Cette méthode a été appliquée sur le site 1 (Figure 3).

L’analyse de la variation temporelle de σ⁰ a été réalisée sur les images en polarisation HH, et pour deux saisons de riz (saison traditionnelle et saison de printemps), afin de comprendre le comportement du signal radar en fonction de chaque stade du cycle de croissance du riz et de déterminer les seuils pour distinguer les rizières. Pour chaque saison, au lieu d’une seule image de rapport comme dans la plupart des applications de seuillage, une paire de l’image du rapport (dérivée de trois images représentant trois différentes étapes du cycle de croissance du riz) a été utilisée pour identifier les rizières. Les calculs des images du rapport ont été réalisés à l’aide du logiciel ArcGIS.

3.2.3 Classification SVM

Afin d’estimer l’efficacité d’extraction des rizières à partir des données polarimétriques, une classification SVM a été appliquée sur la matrice de cohérence (T) des deux images polarimétriques correspondant à la mi-saison des saisons du riz.

Le SVM est une méthode de classification par apprentissage supervisée, qui fut introduite dans les années 1990 par VAPNIK (1999). Cette méthode repose sur l’existence d’un classificateur linéaire dans un espace approprié. Elle est basée sur l’utilisation d’une fonction noyau (kernel function). Le but d’une fonction noyau est de pondérer les observations par rapport à un point de référence de sorte que plus une observation est proche de la référence, plus son poids est grand (MATHIEU-DUPAS, 2010). Elle permet donc une séparation optimale des données. L’ensemble de ce processus de traitement des images a été réalisé à l’aide du logiciel PolSARpro, développé par le professeur Éric Pottier et ses collègues et distribué par l’Agence spatiale européenne (LEE et POTTIER, 2009).

3.3 Intégration de la localisation des rizières dans la carte de l’occupation du sol

Tel que mentionné précédemment, afin de créer la carte de l’occupation du sol servant à la simulation hydrologique, une intégration de la classification de l’occupation du sol dérivée d’images HRVIR2 (haute résolution visible et infrarouge, 20 m) du satellite SPOT-4 et des rizières extraites d’images RADARSAT-2 (en utilisant les rapports d’images de la polarisation HH) a été réalisée. Cette intégration a été faite en deux étapes : 1) ré-échantillonnage de la classification des images RADARSAT-2; et 2) intégration des classifications.

Étape 1 : la dimension des pixels des deux sources de données est différente, soit 20 m pour l’image SPOT-4 et 12,5 m pour les images RADARSAT-2 en double polarisation. Afin d’intégrer les résultats issus de ces deux images, il a fallu effectuer un ré-échantillonnage de la classification des images RADARSAT-2 de 12,5 à 20 m, cette résolution correspondant mieux à la résolution spatiale des images en mode standard, qui est voisine de 25 m. La méthode d’interpolation choisie est celle du plus proche voisin. Cette méthode d’interpolation ne change pas la valeur de pixel et l’erreur spatiale maximale est de moins de 0,5 pixel. Pour cette raison, l’influence de la superposition entre des images et celle du ré-échantillonnage est mineure.

Étape 2 : l’intégration de la couche des rizières dans la classification de l’occupation du sol a été réalisée à l’aide du logiciel ArcGIS. Malgré la différence d’année entre les acquisitions des images SPOT-4 (novembre 2007 et janvier 2008) et les images RADARSAT-2 (2009 et 2010), ce qui n’est pas idéal nous en convenons, la carte des rizières peut être intégrée à la classification SPOT-4. Les mois de novembre à janvier sont les mois où les sols cultivés sont en repos (pas de culture). Comme il n’y a pas de pratique agricole dans cette période (saison sèche), l’état du sol des terres agricoles est le même entre les mois de novembre 2007 et de janvier 2008, et ce d’année en année. Les rizières occupent une partie des terres agricoles. Bien que les superficies des rizières puissent varier d’une saison à l’autre (surtout) et d’année et année, nous avons constaté qu’elles varient à l’intérieur des terres identifiées agricoles (au repos) sur les images SPOT-4.

3.4 Modélisation hydrologique de l’impact des rizières

Dans le cadre du projet Gestion intégrée du bassin versant de la rivière Cau, les informations de l’occupation du sol sont utilisées comme données d’entrée pour les simulations hydrologiques à l’aide du modèle HYDROTEL (FORTIN et al., 1995). Les informations spatialisées sur l’occupation du sol, obtenues par télédétection, fournissent la distribution spatiale des classes d’occupation dans le modèle hydrologique. Pour la modélisation hydrologique, les sept classes listées au tableau 3 ont été utilisées. En connaissant la position spatiale et la dimension des pixels, de même que l’identification de chaque classe, on obtient le pourcentage de chaque classe d’occupation du sol pour chacune des unités hydrologiques relativement homogènes (UHRH) constituant le bassin. Ce pourcentage et deux autres paramètres concernant l’occupation du sol, soit l’indice foliaire et la profondeur racinaire, sont utilisés pour calculer l’évapotranspiration et l’infiltration sur chaque UHRH ainsi que l’écoulement entre les UHRH.

Certaines des étapes du cycle de croissance du riz ont plus d’impact sur le bilan hydrologique, puisque les rizières sont alternativement mises en eau et asséchées pendant le cycle des cultures. Ces cycles ont été pris en compte dans les simulations qui ont été réalisées. D’un point de vue global, les besoins en eau de la culture du riz sont très importants sur le bassin versant de la rivière Cau, d’où l’importance de pouvoir identifier les rizières sur les cartes d’occupation du sol servant comme support à la modélisation hydrologique.

Pour réaliser les calculs du besoin en eau du bassin versant, les données suivantes ont été utilisées :

les données du ministère de l'Agriculture et du Développement rural (MADR) concernant le besoin en eau moyen pour la culture du riz dans les plaines du Nord Vietnam;
la carte des rizières de la saison de riz du printemps dérivée de données RADARSAT-2 (section 4.2);
le débit à l’exutoire des sous-bassins versants choisis pour l’étude, fourni par l’Académie des sciences et technologies du Vietnam.

À titre d’exemple, les besoins en eau du riz et les écoulements totaux pour une saison de culture, celle de la saison sèche, ont été comparés pour deux sous-bassins versants. Il s’agit de la partie amont du bassin versant de la rivière Cau (Figure 8a) et de la partie amont du bassin versant de la rivière Công (Figure 8b), qui est un sous-bassin du bassin versant de la rivière Cau. Ces deux sous-bassins ont été choisis comme exemples en raison de la disponibilité de mesures de débit à leur exutoire. La saison du riz de printemps a été choisie pour les calculs puisqu’elle correspond à la saison sèche du régime hydrologique; pendant cette période, le débit des rivières du bassin versant est très faible et le niveau d’eau dans les champs de riz est contrôlé par le système d’irrigation.

Figure 8

**Localisation des deux bassins versants étudiés : a) celui de l’amont du bassin versant de la rivière Cau et b) celui de la rivière Công.**

**Location of two catchment areas studied: a) upstream of Cau River watershed and b) Công River watershed.**

4 Résultats et discussion

4.1 Précision de la cartographie de l’occupation du sol dérivée des images optiques

La carte obtenue est constituée de cinq classes : Arbuste, Eau, Milieu agricole, Milieu forestier et Milieu urbain.

4.1.1 Comparaison de la superficie du milieu agricole

La superficie cultivée en 2007, issue des données provenant de l’Office général de la statistique (OGS, 2007), a été comparée à celle de la classification du milieu agricole issue des images SPOT-4 de l’hiver 2007-2008. Le résultat de cette comparaison est présenté au tableau 5. On remarque l’absence de la superficie classifiée pour le district de Vo Nhai parce que la moitié de la superficie de cette région est à l’extérieur du territoire du bassin versant. La comparaison montre une forte concordance entre les superficies issues des statistiques officielles (OGS, 2007) et celles issues de la classification du milieu agricole; le pourcentage de concordance varie entre 81 et 97 %, dépendamment du district. On constate que les superficies de la classification sont toujours inférieures aux superficies de l’OGS. Cela peut s’expliquer par la méthode de calcul des superficies statistiques. Selon les documents de l’OGS (2011), la superficie des terres agricoles comprend les superficies ensemencées de riz, de maïs, de cannes à sucre, de haricots et d’arachides pour une saison de culture. Or il peut parfois y avoir une rotation entre les différentes plantes cultivées sur une même surface, tandis que la superficie du milieu agricole issue de la classification correspond aux surfaces (objets) réellement cultivées et détectées au moment de l’acquisition des images. D’autre part, dans la classification, il reste un certain degré de confusion entre certaines terres agricoles et d’autres types d’occupation du sol (par ex. avec les milieux urbain et forestier). Cela est remarqué lorsqu’on analyse la matrice d’erreur (Tableau 6) des cinq classes (qui n’est pas présentée ici). En effet, des pourcentages de 9,8 % (3 967 pixels), 19 % (7 731 pixels) et 4,7 % (1 899 pixels) des pixels de l’occupation Terre agricole ont été classifiés respectivement aux classes Urbain, Forêt et Eau.

Tableau 5

**Comparaison de la superficie totale (statistique et classification) du milieu agricole en 2007.**

**Comparison of the total area (statistics and classification) of the agricultural land in 2007.**

Tableau 6

**Matrice d’erreur de la classification du Niveau P dérivée des images SPOT-4.**

**P-Level classification error matrix derived from SPOT-4 images.**

4.1.2 Validation quantitative

L’évaluation quantitative de la précision a été faite à l’aide de la matrice d’erreur, en utilisant les données de la carte de référence (Tableau 2). Les douze classes du Niveau G (Tableau 4) ont été regroupées en trois classes principales, soit Eau (Rivière 1, Lac 1), Forêt (Forêt 1A, 1B, 1C, Plantation 1), Autre (non Eau, non Forêt). Les classes du Niveau P ont été regroupées en cinq classes correspondent aux cinq classes de la carte finale, soit Urbain, Eau, Forêt, Terre agricole et Arbuste.

Le tableau 7 présente la précision globale des classifications au Niveau G (Figure 7, étape 1) et au Niveau P (Figure 7, étape 4), soit le nombre total de pixels bien classifiés par rapport au nombre total de pixels dans la matrice d’erreur. Malgré une légère différence entre la précision du producteur et de l’utilisateur (5 % pour le Niveau G et 2 % pour le Niveau P), les pixels ont été bien classifiés pour chacune des classes définies. La précision du producteur a montré que les classes du Niveau G ont été mieux classifiées qu’au Niveau P, en comparant aux données de références. Cela s’explique par le fait que le niveau de détail des classes du Niveau G est moindre que celui du Niveau P; la confusion entre les classes est donc moindre au Niveau G qu’au Niveau P. Une précision de l’utilisateur de 83 % signifie que 83 % des pixels classifiés représentent la « réalité » par rapport aux données de référence. L’indice Kappa (K), de l’ordre de 0,80, représente une forte précision entre l’information de la carte de la classification dérivée des images SPOT-4 et celle des données de référence.

Tableau 7

**Précision de la classification des niveaux G et P dérivée des images SPOT-4.**

**Classification accuracy of levels G and P derived from SPOT-4 images.**

En regardant les résultats obtenus à partir de l’image LANDSAT-7 ETM+ de 2003 (Figure 9a) (HOANG et al., 2008), on constate que le résultat obtenu ici (Figure 9b) est plus détaillé. On remarque visuellement qu’avec la classification hiérarchique et la résolution de 20 m de l’image SPOT-4 (par rapport à la résolution spatiale de 30 m de l’image LANDSAT-7 ETM+), la classe mixte de la classification antérieure (dans laquelle on retrouvait des parcelles agricoles, des habitations et des plantations) a été bien séparée. La classification hiérarchique est donc un choix convenable avec des images de résolution moyenne dans des régions où l’occupation du sol est diversifiée et morcelée, comme c’est le cas dans le bassin versant de la rivière Cau.

Figure 9

Illustration de l’occupation du sol : a) dérivée d’une image LANDSAT-7 ETM+ de 2003 et b) dérivée des images SPOT-4 de 2007 et 2008; c) exemple d’une image SPOT_4 de 2008.

**Illustration of land cover derived from a) LANDSAT-7 ETM+ image acquired in 2003, and b) SPOT-4 images acquired in 2007 and 2008; c) example of a SPOT-4 image of 2008.**

4.2 Précision de la cartographie des rizières à l’aide d’images radar

Les résultats et les discussions de la cartographie des rizières à partir des images RADARSAT-2 sont présentés en détail dans HOANG et al. (2016). Rappelons brièvement ici que l’étude de HOANG et al. (2016) a démontré que les données de RADARSAT-2, double polarisation et polarimétriques, peuvent être utilisées avec succès pour identifier et localiser les champs de riz dans des régions où l’occupation du sol est diversifiée et morcelée. La précision globale de la cartographie de la classe rizières extraite des données RADARSAT-2, en mode standard couvrant tout le bassin versant, est de 71 % pour la saison traditionnelle de riz et de 67 % pour la saison de riz du printemps.

4.3 Carte intégrée de l’occupation du sol

La figure 10 présente une carte de l’occupation du sol de la rivière Cau créée à partir de l’intégration de la classification orientée-objet de l’image SPOT-4 de novembre 2007 (cinq classes) et des rizières extraites à partir d’images RADARSAT-2 de 2010.

Figure 10

**Carte de l’occupation du sol du bassin versant de la rivière Cau extraite des images SPOT de 2007. Les rizières (en jaune) de l’année 2010 y sont intégrées.**

**Land cover map of Cau River watershed extracted from SPOT images of 2007. The rice fields (in yellow) of the year 2010 are integrated.**

4.4 Impact de l’intégration de la cartographie des rizières sur la modélisation hydrologique

Pour évaluer l’impact potentiel de l’intégration de la cartographie des rizières (Figure 10) sur la modélisation hydrologique, le besoin en eau du riz sur le bassin versant a été calculé, en utilisant la carte des rizières de la saison de riz de printemps, puis ce besoin a été comparé au débit à l’exutoire des sous-bassins versants choisis, selon l’équation suivante :

où Sriz est la superficie du riz printanier (ha); V_moyen est le besoin en eau moyen pour la culture du riz (saison sèche) dans les plaines du Nord du Vietnam (m³∙saison^-1∙ha^-1).

Les données du MARD ont montré que le besoin en eau moyen (V_moyen) pour la culture du riz dans les plaines du Nord Vietnam est de 4 759,7 m³∙ha^-1 (DOAN et TRAN, 2011). À partir de ce chiffre, nous avons obtenu les besoins en eau (V_{besoin/saison}), présentés au tableau 8, sur les deux bassins choisis (Figure 10). Ainsi, les besoins en eau pour la culture du riz sur le bassin versant de la rivière s’élèvent à 29,2 % du débit moyen mesuré à l’exutoire de ce sous-bassin pour les saisons de culture du printemps de 1961 à 1972 (12 ans; ces années ont été choisies, car elles correspondent à la période d’écoulement naturel, avant la construction du barrage). Pour la partie amont du bassin versant de la rivière Cau, le V_{besoin/saison} représente 23,5 % du débit moyen à l’exutoire de ce sous-bassin pendant les saisons de culture du printemps de 1997 à 2006 (dix ans).

Ces calculs rapides montrent que les besoins en eau des rizières comptent pour une grande proportion des écoulements sur le bassin versant de la rivière Cau. Il est donc important d’intégrer les rizières et leurs particularités dans les modèles hydrologiques utilisés sur ce bassin versant.

Notons par ailleurs que NGUYEN et al. (2017) ont développé un sous-modèle spécifique pour la modélisation hydrologique des rizières dans HYDROTEL. La méthodologie présentée ici a permis de créer une carte d’occupation distinguant les rizières des autres surfaces agricoles, sans laquelle le modèle de NGUYEN et al. (2017) n’aurait pas pu être appliqué au bassin versant de la rivière Cau. Ils ont notamment démontré que la prise en compte des rizières dans la modélisation hydrologique du bassin versant amont de la rivière Cau conduit à une amélioration significative de la qualité des résultats de simulation, c’est-à-dire que les débits simulés par le modèle intégrant les particularités des rizières s’approchent plus des débits observés que les débits simulés sans la prise en compte du caractère spécifique des rizières.

5. Conclusions

Les images SPOT-4 sont un bon choix pour la cartographie de l’occupation du sol à l’échelle régionale. Ces données, issues du capteur HRVIR, sont très sensibles au couvert végétal. À une résolution spatiale de 20 m, les images SPOT-4 permettent de mieux distinguer les zones mixtes par rapport à des images LANDSAT-7 de résolution 30 m. La forte précision globale ainsi que l’indice K des classifications du Niveau G (90 %, 0,78) et du Niveau P (91 %, 0,80) montrent que la classification orientée-objet avec l’algorithme de classification hiérarchique est une méthode efficace pour classifier les zones où l’occupation du sol est morcelée. Les petits objets, qui ont une valeur spectrale similaire, ont été bien distingués. Malgré le résultat obtenu, qui est très bon, la méthode a également montré certaines limites d’applicabilité, en particulier dans le cas de petits objets dans les milieux très hétérogènes, ou dans le cas des objets qui ont la même valeur spectrale ou la même texture (p. ex. les cultures vivrières et les jeunes forêts).

La réussite de l’extraction des rizières à partir d’images RADARSAT-2 a permis d’obtenir des informations sur la distribution spatiale des rizières du bassin versant. Ces résultats et ceux obtenus des images SPOT-4 ont amélioré la précision des cartes de l’occupation du sol requises pour les simulations hydrologiques du bassin versant de la rivière Cau. Les estimations des besoins en eau pour la culture du riz, calculées à partir de cette carte d’occupation du sol représentent respectivement 29,2 % et 23,5 % du débit sortant de la partie en amont du bassin versant de la rivière Công et de la rivière Cau. Ces estimations des besoins en eau ainsi que les résultats présentés dans NGUYEN et al. (2017) confirment que la présence des rizières ne peut donc être ignorée pour des prédictions liées au cycle hydrologique au nord Vietnam.

Résumé

Abstract

1. Introduction