Validation croisée (Geostatistical Analyst)

Disponible avec une licence Geostatistical Analyst.

Synthèse

Supprime une localisation de données et prédit les données associées à l’aide des données situées aux localisations restantes. Cet outil sert principalement à comparer la valeur prédite à la valeur observée afin d’obtenir des informations utiles concernant certains de vos paramètres de modèle.

En savoir plus sur la validation croisée et la validation

Utilisation

  • Si vous utilisez cet outil dans Python, l’objet result contient à la fois une classe d’entités et une CrossValidationResult, dont les propriétés sont les suivantes :

    • Total : nombre total d’échantillons utilisés.
    • Erreur moyenne : différence moyennée entre les valeurs mesurées et prédites.
      Erreur moyenne
    • Erreur quadratique moyenne : indique la pertinence de prédiction des valeurs mesurées par votre modèle. Il est préférable que cette erreur soit la plus petite possible.
      Erreur quadratique moyenne
    • Erreur standard moyenne : moyenne des erreurs standard de prédiction.
      Erreur standard moyenne
    • Erreur standardisée moyenne : moyenne des erreurs standardisées. Cette valeur doit être proche de 0.
      Erreur standardisée moyenne
    • Erreur quadratique moyenne standardisée : cette valeur doit être proche de 1 si les erreurs standard de prédiction sont valides. Si l’erreur quadratique moyenne standardisée est supérieure à 1, vous sous-estimez la variabilité dans vos prédictions. Si l’erreur quadratique moyenne standardisée est inférieure à 1, vous surestimez la variabilité dans vos prédictions.
      Erreur quadratique moyenne standardisée
    • Pourcentage dans l’intervalle de 90 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 90 pour cent. Cette valeur doit être proche de 90.
    • Pourcentage dans l’intervalle de 95 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 95 pour cent. Cette valeur doit être proche de 95.
    • CRPS moyen : score de probabilité classé continu moyen de tous les points. Le CRPS est un diagnostic qui mesure l’écart entre la fonction de distribution cumulative prédictive et chaque valeur de donnée observée. Cette valeur doit être aussi petite que possible. Ce diagnostic comporte des avantages sur les autres diagnostics de validation croisée car il compare les données à une distribution complète et non à des prévisions de point unique. Le calcul de cette statistique implique des simulations et ne peut donc pas être écrit dans une formule simple.

    Seuls les résultats des opérations Moyenne et Erreur quadratique moyenne sont disponibles pour IDW, Interpolation polynomiale globale, Fonctions de base radiale, Interpolation par diffusion avec interruptions et Interpolation par noyaux avec interruptions.

    Pourcentage dans l’intervalle de 90 %, Pourcentage dans l’intervalle de 95 % et CRPS moyen sont uniquement disponibles pour les modèles Krigeage bayésien empirique et Prédiction de la régression EBK.

  • Les champs dans la classe d’entités en sortie facultative sont décrits dans l’outil Couche GA vers points.

Paramètres

ÉtiquetteExplicationType de données
Couche géostatistique en entrée

Couche géostatistique à analyser.

Geostatistical Layer
Classe d’entités ponctuelles en sortie
(Facultatif)

Stocke les statistiques de validation croisée à chaque localisation dans la couche géostatistique.

Feature Class

Sortie obtenue

ÉtiquetteExplicationType de données
Total

Nombre total d’échantillons utilisés.

Long
Erreur moyenne

Erreur moyenne : différence moyennée entre les valeurs mesurées et prédites.

Double
Erreur quadratique moyenne

Erreur quadratique moyenne : indique la pertinence de prédiction des valeurs mesurées par votre modèle.

Double
Erreur standard moyenne

Erreur standard moyenne : moyenne des erreurs standard de prédiction.

Double
Erreur standardisée moyenne

Erreur standardisée moyenne : moyenne des erreurs standardisées.

Double
Erreur quadratique moyenne standardisée

Erreur quadratique moyenne standardisée : cette valeur doit être proche de 1 si les erreurs standard de prédiction sont valides.

Double
Pourcentage dans l’intervalle de 90 %

Pourcentage dans l’intervalle de 90 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 90 pour cent. Cette valeur doit être proche de 90.

Double
Pourcentage dans l’intervalle de 95 %

Pourcentage dans l’intervalle de 95 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 95 pour cent. Cette valeur doit être proche de 95.

Double
Average CRPS (CRPS moyen) :

CRPS moyen : score de probabilité classé continu moyen de tous les points. Le CRPS est un diagnostic qui mesure l’écart entre la fonction de distribution cumulative prédictive et chaque valeur de donnée observée. Cette valeur doit être aussi petite que possible. Ce diagnostic comporte des avantages sur les autres diagnostics de validation croisée car il compare les données à une distribution complète et non à des prévisions de point unique. Le calcul de cette statistique implique des simulations et ne peut donc pas être écrit dans une formule simple.

Double

arcpy.ga.CrossValidation(in_geostat_layer, {out_point_feature_class})
NomExplicationType de données
in_geostat_layer

Couche géostatistique à analyser.

Geostatistical Layer
out_point_feature_class
(Facultatif)

Stocke les statistiques de validation croisée à chaque localisation dans la couche géostatistique.

Feature Class

Sortie obtenue

NomExplicationType de données
count

Nombre total d’échantillons utilisés.

Long
mean_error

Erreur moyenne : différence moyennée entre les valeurs mesurées et prédites.

Double
root_mean_square

Erreur quadratique moyenne : indique la pertinence de prédiction des valeurs mesurées par votre modèle.

Double
average_standard

Erreur standard moyenne : moyenne des erreurs standard de prédiction.

Double
mean_standardized

Erreur standardisée moyenne : moyenne des erreurs standardisées.

Double
root_mean_square_standardized

Erreur quadratique moyenne standardisée : cette valeur doit être proche de 1 si les erreurs standard de prédiction sont valides.

Double
percent_in_90_interval

Pourcentage dans l’intervalle de 90 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 90 pour cent. Cette valeur doit être proche de 90.

Double
percent_in_95_interval

Pourcentage dans l’intervalle de 95 % : pourcentage de points qui se trouvent dans un intervalle de confiance de validation croisée de 95 pour cent. Cette valeur doit être proche de 95.

Double
average_crps

CRPS moyen : score de probabilité classé continu moyen de tous les points. Le CRPS est un diagnostic qui mesure l’écart entre la fonction de distribution cumulative prédictive et chaque valeur de donnée observée. Cette valeur doit être aussi petite que possible. Ce diagnostic comporte des avantages sur les autres diagnostics de validation croisée car il compare les données à une distribution complète et non à des prévisions de point unique. Le calcul de cette statistique implique des simulations et ne peut donc pas être écrit dans une formule simple.

Double

Exemple de code

Exemple 1 d’utilisation de la fonction CrossValidation (fenêtre Python)

Effectuez une validation croisée sur une couche géostatistique en entrée.

import arcpy
arcpy.env.workspace = "C:/gapyexamples/data"
cvResult = arcpy.CrossValidation_ga("C:/gapyexamples/data/kriging.lyr")
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))
Exemple 2 d’utilisation de la fonction CrossValidation (script autonome)

Effectuez une validation croisée sur une couche géostatistique en entrée.

# Name: CrossValidation_Example_02.py
# Description: Perform cross validation on an input geostatistical layer.
# Requirements: Geostatistical Analyst Extension

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gapyexamples/data"

# Set local variables
inLayer = "C:/gapyexamples/data/kriging.lyr"

# Execute CrossValidation
cvResult = arcpy.CrossValidation_ga(inLayer)
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))

Informations de licence

  • Basic: Nécessite Geostatistical Analyst
  • Standard: Nécessite Geostatistical Analyst
  • Advanced: Nécessite Geostatistical Analyst

Rubriques connexes