IMPLANTATION DUN MODÈLE DE DISTRIBUTION DES ESPÈCES VÉGÉTALES À PARTIR DINDICATEURS ENVIRONNEMENTAUX |
||||||||||||||||||
| Résumé de la méthode | ||||||||||||||||||
Les données proviennent dune Parmi les variables on note la position longitude-latitude Les variables environnementales mentionnées plus haut sont significatives dans le modèle de prédiction du groupe ERIN. La pertinence dutiliser ces mêmes variables ou dautres pour la prédiction au Québec sera évaluée au moment du choix des données pertinentes (cadrage et design) et de la modélisation.
La transformation (mapping) des données géocodées en format « raster » de type ascii sur plusieurs couches dinformation (une couche par variable), à une échelle cartographique donnée (à définir), la première couche (00) identifiant les coordonnées de lespèce. Cette transformation aura pour effet de normaliser les données par catégorie (présence/absence et valeurs ordinales) et de réduire la taille des fichiers facilitant ainsi le traitement informatique. Un « mapping » environnementale typique sera composé dau maximum 30 couches (1-31) dinformation relatant les indicateurs environnementaux associés au climat, à la géologie, au relief etc. sur toute laire détude. Cette information demeurera constante durant toute la modélisation. De plus, il y aura des couches de localisation des espèces (couche 00) identifiant les coordonnées géographiques de toutes les occurrences connues. Léchantillonnage (échantillonnage) du fichier en deux sets de données: un premier (train set) pour lentraînement du modèle, un second (test set) pour la vérification des prédictions du modèle préliminaire.
Conditions logiques
Il est constitué de règles de décision (si ... alors ..) crées par des inférences sur des paramètres qui conditionnent la présence ou labsence dune espèce sur un site. La modélisation par inférence diffère de la modélisation mathématique en ce quelle génère des réponses basées sur la logique et non sur le calcul ou la statistique seulement. La formulation générale dune règle de décision dans le modèle prend cette forme:
|
Lénoncé A est une précondition du modèle, il peut être composé de plusieurs propositions réunies par les termes ET ou OU. Lénoncé B de la règle est un antécédent (et possiblement une conclusion). La règle est validée par une probabilité (p) calculée à létape de prédiction. Espace environnemental local Une règle donnée du modèle définie une condition dimplantation dune espèce (habitat favorable) dans un espace environnemental local qui satisfait cette condition, par exemple que lacidité du sol soit supérieure à 7,5 et que laltitude soit supérieure à 700 m. Une modélisation dans un espace environnementale local ne présente pas les limitations inhérentes à une modélisation faite à partir seulement de la distribution des occurrences connues dune espèce. [les limites extérieures de la distribution dune espèce sont jointes pour former un périmètre, définissant ainsi une aire de distribution potentielle] Le type de modélisation proposé na pas non plus le défaut de généraliser la distribution dune espèce dans une région. Par exemple, le modèle permettra didentifier les distributions disjointes dans une région, reflétant ainsi les condition environnementales locales du terrain. GARP La méthode GARP (Stockwell et Noble, 1992) a justement cette possibilité de générer plusieurs types de règles à partir de cette technique doptimisation.
Il est ainsi possible de créer un modèle capable dapprendre et de sadapter à des changements survenant lors de son apprentissage. Dans notre étude, les données dapprentissage du modèle sont les données de lenvironnement contenues sur les couches 01 ... 0n du mapping et les données de localisation (couche 00) des espèces. Une règle typique (modèle) évoluera initialement à partir dun ensemble de données initiales (train set) composé de chaînes binaires (1,0) exprimant la présence ou labsence dune caractéristique du milieu dans laire étudiée. Éventuellement, la reproduction des règles se réalise (population de règles) dans laire choisie avec des changements aléatoires provoqués par le logiciel (mutation). Les règles les plus appropriées demeurent jusquau moment où les survivants convergent vers une solution.
|
Vu que la reproduction engendre sans cesse de nouvelles chaînes, des solutions de plus en plus performantes apparaissent. Laptitude des règles pour la prédiction est finalement vérifiées lorsque comparées à des données contrôles. La procédure détaillée de lalgorithme génétique utilisé par le logiciel GARP pour la production de règles à partir des occurrences des espèces est disponible dans Stockwell et Noble (1992).
Les règles retenues sont transcrites en langage naturel. Un exemple est donné ci-après avec trois règles simples appliquées sur des variables significatives pour une espèce sp fictive dans une aire y:
Si GEO= x1 ET TANM= x2 ET
TMMC= x3 OU TMMF= x4
Si GEO= x2 ET TANM= x3 ET TMMC=
x5 OU TMMF= x4
Si GEO= x2 ET PAM= x1 ET PMP=
x1 OU PMC= x4 Dans ce bref exemple, la distribution de lespèce est déterminée par la géologie du site et le climat (température et précipitation). Des règles dun modèle de distribution pour une espèce peuvent être conflictuelles: lune prédit sa présence, dautres son absence. Dans ces cas, la préséance va à la prédiction la plus probable.
Le modèle de distribution des espèces sera implanté sur un serveur Internet et accessible à partir dun site web. Lutilisateur pourra sélectionner une ou plusieurs espèces dans la base de données. La distribution sera visualisée à laide dun gradient de couleurs ou lintensité des teintes indiquera la probabilité de la présence de lespèce, de 0% à 100%. Les variables utiles, leur valeur respectives et les règles de la distribution seront disponibles en format HTML ou texte régulier. Dautres informations pourront sajouter au besoin. © Systemon 1998 |
||||||||||||||||