IMPLANTATION D’UN MODÈLE DE DISTRIBUTION DES ESPÈCES VÉGÉTALES À PARTIR D’INDICATEURS ENVIRONNEMENTAUX

Résumé de la méthode

1

Base de données

Les données proviennent d’une
couverture géographique géocodée relatant les occurrences des espèces (variables dépendantes) et certains indicateurs environnementaux (variables indépendantes) de l’aire étudiée.

Parmi les variables on note la position longitude-latitude
l’abondance relative
les autres variables dont:
le climat, le type géologique, le relief, les caractéristiques du sol

Les variables environnementales mentionnées plus haut sont significatives dans le modèle de prédiction du groupe ERIN.

La pertinence d’utiliser ces mêmes variables ou d’autres pour la prédiction au Québec sera évaluée au moment du choix des données pertinentes (cadrage et design) et de la modélisation.

Formalisation

La transformation (mapping) des données géocodées en format « raster » de type ascii sur plusieurs couches d’information (une couche par variable), à une échelle cartographique donnée (à définir), la première couche (00) identifiant les coordonnées de l’espèce.

Cette transformation aura pour effet de normaliser les données par catégorie (présence/absence et valeurs ordinales) et de réduire la taille des fichiers facilitant ainsi le traitement informatique.

Un « mapping » environnementale typique sera composé d’au maximum 30 couches (1-31) d’information relatant les indicateurs environnementaux associés au climat, à la géologie, au relief etc. sur toute l’aire d’étude. Cette information demeurera constante durant toute la modélisation.

De plus, il y aura des couches de localisation des espèces (couche 00) identifiant les coordonnées géographiques de toutes les occurrences connues.

L’échantillonnage (échantillonnage) du fichier en deux sets de données: un premier (train set) pour l’entraînement du modèle, un second (test set) pour la vérification des prédictions du modèle préliminaire.

Modélisation/vérification)

Conditions logiques

La modélisation est une activité visant à représenter le réel par un modèle. En pratique, un modèle peut prendre plusieurs formes: figures ou schémas, objets, formules mathématiques.

Le modèle proposé dans l’étude exprime la distribution d’une espèce en fonction de gradients environnementaux pour lesquels l’espèce est sensible.

Il est constitué de règles de décision (si ... alors ..) crées par des inférences sur des paramètres qui conditionnent la présence ou l’absence d’une espèce sur un site.

La modélisation par inférence diffère de la modélisation mathématique en ce qu’elle génère des réponses basées sur la logique et non sur le calcul ou la statistique seulement.

La formulation générale d’une règle de décision dans le modèle prend cette forme:

Étant donné que si A alors B
et que A est vrai
alors la prédiction est B p = 75

 

 

2

L’énoncé A est une précondition du modèle, il peut être composé de plusieurs propositions réunies par les termes ET ou OU. L’énoncé B de la règle est un antécédent (et possiblement une conclusion).

La règle est validée par une probabilité (p) calculée à l’étape de prédiction.

Espace environnemental local

Le modèle établie des relations entre des conditions environnementales qui varient localement dans une région.

Une règle donnée du modèle définie une condition d’implantation d’une espèce (habitat favorable) dans un espace environnemental local qui satisfait cette condition, par exemple que l’acidité du sol soit supérieure à 7,5 et que l’altitude soit supérieure à 700 m.

Une modélisation dans un espace environnementale local ne présente pas les limitations inhérentes à une modélisation faite à partir seulement de la distribution des occurrences connues d’une espèce.

[les limites extérieures de la distribution d’une espèce sont jointes pour former un périmètre, définissant ainsi une aire de distribution potentielle]

Le type de modélisation proposé n’a pas non plus le défaut de généraliser la distribution d’une espèce dans une région.

Par exemple, le modèle permettra d’identifier les distributions disjointes dans une région, reflétant ainsi les condition environnementales locales du terrain.

GARP

Comme il est fastidieux d’identifier toutes les règles de distribution d’une espèce, celles-ci seront produites par algorithme génétique.

La méthode GARP (Stockwell et Noble, 1992) a justement cette possibilité de générer plusieurs types de règles à partir de cette technique d’optimisation.

L’algorithme génétique est une technique de programmation qui permet à un programme d’ordinateur d’évoluer en cours de traitement de l’information.

Il est ainsi possible de créer un modèle capable d’apprendre et de s’adapter à des changements survenant lors de son apprentissage.

Dans notre étude, les données d’apprentissage du modèle sont les données de l’environnement contenues sur les couches 01 ... 0n du mapping et les données de localisation (couche 00) des espèces.

Une règle typique (modèle) évoluera initialement à partir d’un ensemble de données initiales (train set) composé de chaînes binaires (1,0) exprimant la présence ou l’absence d’une caractéristique du milieu dans l’aire étudiée.

Éventuellement, la reproduction des règles se réalise (population de règles) dans l’aire choisie avec des changements aléatoires provoqués par le logiciel (mutation).

Les règles les plus appropriées demeurent jusqu’au moment où les survivants convergent vers une solution.

 

3

Vu que la reproduction  engendre sans cesse de nouvelles chaînes, des solutions de plus en plus performantes apparaissent.

L’aptitude des règles pour la prédiction est finalement vérifiées lorsque comparées à des données contrôles.

La procédure détaillée de l’algorithme génétique utilisé par le logiciel GARP pour la production de règles à partir des occurrences des espèces est disponible dans Stockwell et Noble (1992).

Traduction

Les règles retenues sont transcrites en langage naturel. Un exemple est donné ci-après avec trois règles simples appliquées sur des variables significatives pour une espèce sp fictive dans une aire y:

Règle 1

Si GEO= x1 ET TANM= x2 ET TMMC= x3 OU TMMF= x4
Alors sp absente p=90

Règle 2

Si GEO= x2 ET TANM= x3 ET TMMC= x5 OU TMMF= x4
Alors sp absente p=30

Règle 3

Si GEO= x2 ET PAM= x1 ET PMP= x1 OU PMC= x4
Alors sp présente p=95

Dans ce bref exemple, la distribution de l’espèce est déterminée par la géologie du site et le climat (température et précipitation).

Des règles d’un modèle de distribution pour une espèce peuvent être conflictuelles: l’une prédit sa présence, d’autres son absence. Dans ces cas, la préséance va à la prédiction la plus probable.

Implantation sur le web

Le modèle de distribution des espèces sera implanté sur un serveur Internet et accessible à partir d’un site web.

L’utilisateur pourra sélectionner une ou plusieurs espèces dans la base de données.

La distribution sera visualisée à l’aide d’un gradient de couleurs ou l’intensité des teintes indiquera la probabilité de la présence de l’espèce, de 0% à 100%.

Les variables utiles, leur valeur respectives et les règles de la distribution seront disponibles en format HTML ou texte régulier. D’autres informations pourront s’ajouter au besoin.

 Case_a_cocher.gif (662 octets)  Pour plus d'information

© Systemon 1998