Quels types de surfaces en sortie les modèles d’interpolation peuvent-ils générer ?

Disponible avec une licence Geostatistical Analyst.

Tous les modèles d’interpolation sont des méthodes de prévision et l’objectif ultime consiste à produire une surface de valeurs prévues à toutes les localisations entre les localisations mesurées. Vous avez également souvent besoin de savoir si les prévisions sont précises et fiables. Geostatistical Analyst propose donc plusieurs types de surfaces en sortie qui vous aident à interpréter la surface de prévision tout en gardant à l’esprit la variabilité inhérente des prévisions. Les sections suivantes décrivent les différents types de surfaces en sortie et le tableau final indique quels sont les types de surfaces disponibles pour chaque méthode d’interpolation.

Toutes les cartes en sortie supposent que vous avez choisi la méthode d’interpolation et les paramètres d’interpolation appropriés. En pratique, si les données ne correspondent pas aux hypothèses de la méthode d’interpolation ou si des paramètres incorrects sont fournis, ces surfaces risquent de ne pas représenter correctement les valeurs vraies des données.

Surface de prévision

Toutes les méthodes d’interpolation (à l’exception du krigeage d’indicatrices et de probabilités) sont capables de créer des surfaces de prévision ; il s’agit de la sortie par défaut de toutes les méthodes d’interpolation. Cette surface affiche la valeur prévue des données à toutes les localisations entre les localisations mesurées.

Surface des erreurs standard de prévision

La surface des erreurs standard de prévision est une carte des erreurs standard des valeurs prévues à chaque localisation. Les erreurs standard correspondent à l’écart type de la valeur estimée à chaque localisation ; plus l’erreur standard est élevée, plus la précision de la valeur prévue est faible. Les erreurs standard sont le plus souvent utilisées pour créer des intervalles susceptibles de contenir la valeur vraie à chaque localisation prévue.

Règle 68-95-99,7

Si les données suivent une distribution normale multivariée, vous pouvez appliquer une règle d’or simple pour créer des intervalles de confiance pour la valeur vraie à chaque localisation prévue. Cette règle stipule que 68 % (environ deux tiers) des valeurs vraies se situeront dans une erreur standard de la valeur prévue, que 95 % d’entre elles seront comprises dans deux erreurs standard et que 99,7 % (quasiment la totalité) se situeront dans trois erreurs standard. Par exemple, si une localisation reçoit une valeur prévue de 100 avec une erreur standard de 5, vous pouvez être sûr à 68 % que la valeur vraie se situe entre 95 et 105. De même, vous pouvez être sûr à 95 % que la valeur vraie est comprise entre 90 et 110, et vous pouvez être quasiment certain (à 99,7 %) que la valeur vraie est comprise entre 85 et 115. Pour créer des intervalles de confiance avec d’autres pourcentages, vous pouvez consulter les valeurs critiques dans les tables z, largement disponibles dans les manuels de statistiques et sur Internet.

Il est extrêmement difficile de vérifier que les données suivent une distribution normale multivariée et, dans la pratique, seule la normalité univariée est vérifiée. Vous pouvez examiner la normalité univariée à l’aide de l’histogramme.

Inégalité de Chebyshev

Si les données ne répondent pas aux hypothèses de la règle 68-95-99,7 ou si vous ne savez pas si les données répondent à ces hypothèses, il est possible de créer un intervalle de confiance plus conservateur qui repose sur l’inégalité de Chebyshev. Cette inégalité indique que pour n’importe quelle distribution possédant une moyenne et une variance finies, au moins (1-1/k2)·100 % des valeurs vraies se situent dans k erreurs standard de la valeur prévue, où k>1. Si k=2, cette inégalité stipule qu’au moins 75 % des valeurs vraies se situent dans deux erreurs standard de la valeur prévue. De même, si k=3, au moins 88,9 % des valeurs vraies se situent dans trois erreurs standard de la valeur prévue. D’autres valeurs de k peuvent être utilisées pour créer des intervalles avec des pourcentages différents.

Comment interpréter les erreurs standard

Pour interpréter les valeurs d’erreur standard, gardez en tête les valeurs et la plage des données en entrée. Par exemple, si les valeurs de données en entrée sont toutes comprises entre 10 000 et 12 000, une valeur d’erreur standard de 100 indique plutôt une précision élevée des prévisions car l’erreur standard est beaucoup plus petite que les valeurs et la plage des données en entrée. Toutefois, si les valeurs de données sont comprises entre 50 et 200, la même erreur standard de 100 indique une faible précision car la variabilité des prévisions est aussi importante que les valeurs et la plage des données en entrée.

Surface de probabilités

Les carte des probabilités sont généralement utilisées pour une valeur d’intérêt critique, comme un niveau standard national de polluant. Cette valeur critique est appelée seuil et la carte en sortie affiche la probabilité que cette valeur de seuil soit ou non dépassée. Ces cartes sont utiles si vous souhaitez voir quelles sont les zones les plus susceptibles de dépasser ou non ce seuil critique.

Surface de quantiles

Les cartes de quantiles affichent un quantile spécifié de la distribution des prévisions à chaque localisation. Les cartes de quantiles sont généralement utilisées dans la préparation du pire ou du meilleur scénario possible. Par exemple, au lieu de créer une carte avec les valeurs prévues, vous pouvez créer une carte des 95èmes quantiles des valeurs prévues. Dans ce cas, seuls 5 % des valeurs vraies dépassent la valeur de la surface de quantiles. De même, si vous créez une carte des 10èmes quantiles, seuls 10 % des valeurs vraies seront inférieures à la valeur de la surface de quantiles.

Surface des erreurs standard des indicatrices

Une variable indicatrice est une variable binaire qui n’admet que les valeurs 0 et 1. Les krigeages d’indicatrices, de probabilités et disjonctif calculent tous des cartes de probabilités en reclassifiant les données en entrée sur 0 ou 1 en fonction d’une valeur de seuil ; les valeurs inférieures au seuil sont reclassifiées sur 0 et les valeurs supérieures au seuil sur 1. Après avoir interpolé la variable indicatrice, la carte de prévision calcule la valeur attendue de la variable indicatrice et cette valeur attendue peut être interprétée comme la probabilité que la variable indicatrice soit égale à un (en d’autres termes, que la valeur de seuil soit dépassée). La carte en sortie des erreurs standard des indicatrices est donc une surface des erreurs standard de la valeur attendue de la variable indicatrice ; en d’autres termes, il s’agit de l’erreur standard de la probabilité que la valeur de seuil soit dépassée.

Puisque les variables indicatrices ne peuvent pas être normalement distribuées, vous ne pouvez pas utiliser la règle 68-95-99,7 avec des variables indicatrices. Pour créer des intervalles de confiance liés à la probabilité qu’un seuil soit dépassé, vous pouvez utiliser l’inégalité de Chebyshev.

Surface de l’indice de conditionnement

La surface de l’indice de conditionnement est une sortie facultative de l’interpolation polynomiale locale ; elle permet de déterminer la stabilité de la valeur prévue à chaque localisation de prévision. Les indices de conditionnement sont difficiles à interpréter littéralement, mais plus l’indice de conditionnement est élevé, plus les prévisions sont instables. Dans ce cas, la stabilité signifie la proportion de modification de la valeur prévue en cas de petit changement dans les données en entrée ou de petits changements dans les paramètres d’interpolation. La règle d’or des indices de conditionnement de l’interpolation polynomiale locale est que pour les polynômes de premier ordre, les indices de conditionnement ne doivent pas être supérieurs à 10. Dans le cas de polynômes de second ordre, les indices de conditionnement ne doivent pas être supérieurs à 100, et pour les polynômes de troisième ordre, l’indice de conditionnement ne doit pas être supérieur à 1 000. Il n’est généralement pas recommandé d’utiliser des polynômes d’ordre supérieur à trois.

Quels sont les types de surfaces en sortie disponibles pour chaque méthode d’interpolation ?

Dans le tableau suivant, le symbole Pris en charge indique les types de surfaces en sortie disponibles pour chaque méthode d’interpolation.

Méthode d’interpolationPrévisionsErreurs standard de prévisionCartes des quantilesCartes des probabilitésErreurs standard des indicatricesNuméro de condition

Krigeage ordinaire

Pris en charge

Pris en charge

Pris en charge 1

Pris en charge 1

Krigeage universel

Pris en charge

Pris en charge

Pris en charge 1

Pris en charge 1

Krigeage simple

Pris en charge

Pris en charge

Pris en charge 1

Pris en charge 1

Krigeage d’indicatrices

Pris en charge

Pris en charge

Krigeage de probabilités

Pris en charge

Pris en charge

Krigeage disjonctif

Pris en charge 2

Pris en charge 2

Pris en charge 2

Pris en charge 2

Prévision de la régression EBK

Pris en charge

Pris en charge 5

Pris en charge 5

Pris en charge 5

Krigeage bayésien empirique

Pris en charge

Pris en charge

Pris en charge 1

Pris en charge 1

Krigeage bayésien empirique 3D

Pris en charge

Pris en charge

Pris en charge 1

Pris en charge 1

Interpolation surfacique

Pris en charge

Pris en charge

Interpolation par diffusion avec interruptions

Pris en charge

Interpolation polynomiale globale

Pris en charge

IDW

Pris en charge

Interpolation par noyaux avec interruptions

Pris en charge

Pris en charge 3

Interpolation polynomiale locale

Pris en charge

Pris en charge 4

Pris en charge 4

Fonctions de base radiale

Pris en charge

Tableau des méthodes d’interpolation et des surfaces en sortie

1 Requiert une distribution normale multivariée.

2 Requiert une nomalité bivariée deux par deux.

3 L’ordre du polynôme doit être défini sur 1.

4 Un seuil d’indice de conditionnement spatial doit être utilisé.

5 La sortie doit être créée avec Couche GA vers rasters.