Activer le regroupement des entités (Gestion des données)

Synthèse

Permet le calcul de base de données pour le regroupement des entités sur une classe d’entités.

Le regroupement des entités est une fonctionnalité de visualisation avancée qui permet d’explorer et de visualiser des jeux de données volumineux. Elle vous aide également à observer les schémas aux niveaux macro et micro avec des options de cartographie prêtes à l’emploi. Le regroupement des entités rassemble d’importants volumes d’entités ponctuelles en groupes surfaciques dynamiques qui peuvent varier via les niveaux d’échelle de détail. Un groupe unique représente toutes les entités en son sein à ce niveau de détail. Le regroupement des entités permet d’améliorer à la fois la performance de dessin et la compréhension des données.

En savoir plus sur les couches d’entités regroupées

Illustration

Illustration de l’outil Activer le regroupement des entités

Utilisation

  • Le calcul de base de données pour le regroupement des entités est pris en charge uniquement pour les classes d’entités ponctuelles et multi-points stockées dans une géodatabase d’entreprise ou une base de données. Le regroupement des entités dans les entrepôts de données du cloud est uniquement pris en charge pour les classes d’entités ponctuelles. Les données ne peuvent pas être versionnées et l’archivage ne peut pas être activé sur ces dernières.

    Les plateformes prises en charge sont les suivantes :

    • Amazon Redshift
    • IBM Db2
    • Google BigQuery
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • SAP HANA
    • Snowflake

  • Seul le propriétaire de la classe d’entités peut activer le regroupement des entités. Pour Google BigQuery, qui ne possède pas de propriétaires de tables, l’utilisateur qui active le regroupement des entités doit disposer de privilèges spécifiques. Reportez-vous à Privilèges d’utilisation d’ArcGIS avec le stockage de données cloud pour plus d’informations.

  • Le regroupement des entités n’est pas pris en charge pour les tables externes dans Google BigQuery.

  • Utilisez le même système de coordonnées pour les regroupements que la carte contenant la couche d’entités regroupées pour éviter la projection dynamique (à la volée). Si vous avez des doutes quant au système de coordonnées à utiliser, une projection équivalente telle que la projection cylindrique équivalente mondiale est recommandée. Vous ne pouvez pas utiliser un système de coordonnées personnalisé.

  • Pour les jeux de données très volumineux, ou si les données ne sont pas régulièrement mises à jour, vous pouvez activer un cache statique des résultats agrégés. Le cache n’est pas nécessairement créé pour tous les niveaux de détail. Le cache statique peut être géré en exécutant l’outil Gérer le cache des groupes d’entités. Utilisez cet outil pour indiquer les niveaux de détail du cache statique.

    Une couche activée pour les groupes passe en mode dynamique dans une carte lorsque vous effectuez un zoom au-delà de l’étendue du niveau de détail du cache statique. La propriété Niveau mis en cache maximal de la boîte de dialogue Propriétés de la couche d’une couche activée pour les groupes indique le niveau de détail maximal du cache statique. Les caches statiques sont générés avec toutes les entités du jeu de données. Par exemple, si vous utilisez un ensemble de définition ou que vous appliquez un filtre temporel ou de plage sur une couche d’entités avec regroupement activé dans une carte, le cache statique est ignoré et l’agrégation des groupes est exécutée de manière dynamique.

  • Pour activer le regroupement des entités sur une table distribuée dans Microsoft Azure Cosmos DB for PostgreSQL, la table doit contenir au moins une colonne d’entiers qui n’accepte pas les valeurs nulles et qu’ArcGIS peut utiliser comme colonne d’ID.

  • Utilisez l’outil Désactiver le regroupement des entités pour désactiver la fonctionnalité de calcul de base de données depuis une couche, le cas échéant. Vous pouvez aussi désactiver le dessin de regroupement pour une couche dans une carte ou dans une scène dans ArcGIS Pro ou passer au calcul orienté par les applications en cliquant sur le bouton Paramètres de calcul de l’onglet Regroupement.

  • Si le regroupement des entités est dynamique et si vous souhaitez mettre à jour la liste des résumés statistiques stockés dans la classe d’entités, vous devez désactiver et réactiver le regroupement des entités. Vous pouvez ajouter de nouveaux résumés statistiques dans la couche d’entités dans une carte ou une scène depuis la boîte de dialogue Summary Statistics (Résumés statistiques). Ces résumés statistiques sont enregistrés avec la couche uniquement. Ils ne sont pas enregistrés dans la classe d’entités source.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Classe d’entités pour laquelle un regroupement des entités calculé par base de données est effectué. Les types d’entrées pris en charge sont les classes d’entités ponctuelles et multi-points stockées dans une géodatabase d’entreprise ou dans une base de données, ou les classes d’entités ponctuelles stockées dans un stockage de données cloud. Les données ne peuvent pas être versionnées et l’archivage ne peut pas être activé sur ces dernières.

Feature Layer
Type de groupe
(Facultatif)

Précise le type de regroupement qui sera activé. Si vous utilisez des données SAP HANA, seules les options Carré, Hexagone plat et Hexagone pointu sont prises en charge. Si vous utilisez des données Snowflake ou Redshift, seule l’option Geohash est prise en charge.

  • Hexagone platLa structure de regroupement hexagonale, également connue comme géohexagone plat ou regroupement d’hexagones plats, est activée. Les tuiles constituent une tessellation d’hexagones dans laquelle l’orientation des hexagones implique un tronçon plat en haut. Il s’agit de l’option par défaut pour les données Microsoft SQL Server, Oracle, PostgreSQL et BigQuery.
    Type de groupe hexagonal plat
  • Hexagone pointuLa structure de regroupement haxagonale pointue, également connue comme géohexagone pointu ou regroupement d’hexagones pointus, est activée. Les tuiles constituent une tessellation d’hexagones dans laquelle l’orientation des hexagones implique un point en haut.
    Type de groupe pointu
  • CarréLa structure de regroupement carrée, également connue comme géocarré ou regroupement de carrés, est activée. Les tuiles sont une tessellation de carrés. Il s’agit de la valeur par défaut des données Db2 et SAP HANA.
    Type de groupe carré
  • GeohashLa structure de regroupement geohash dans laquelle les tuiles illustrent une tessellation de rectangles est activée. Dans la mesure où les groupes GeoHash utilisent toujours le système de coordonnées géographiques WGS84 (GCS WGS84, EPSG WKID 4326), vous ne pouvez pas spécifier de système de coordonnées de groupe pour les groupes GeoHash. Il s’agit de l’option par défaut et de l’unique option pour les données Snowflake et Redshift.
    Type de groupe Geohash
String
Systèmes de coordonnées de groupe
(Facultatif)

Systèmes de coordonnées à utiliser pour visualiser la couche d’entités en sortie agrégée. Vous pouvez choisir jusqu’à deux systèmes de coordonnées pour visualiser la couche en sortie. Par défaut, le système de coordonnées de la classe d’entités en entrée est utilisé. Les systèmes de coordonnées personnalisés ne sont pas pris en charge.

Ce paramètre ne s’applique pas à BigQuery, Redshift ou Snowflake. Pour ces plateformes, le système de coordonnées de la classe d’entités en entrée est utilisé.

Coordinate System
Résumés statistiques
(Facultatif)

Spécifie les statistiques à résumer et à stocker dans le cache de groupe. Les statistiques sont utilisées pour symboliser les groupes et fournir des informations d’agrégat pour tous les points au sein d’un groupe. Un résumé statistique, le nombre total d’entités (shape_count), est toujours disponible. Vous pouvez définir jusqu’à cinq résumés statistiques supplémentaires.

  • Champ : champ sur lequel le résumé statistique est calculé. Les types de champ pris en charge sont entier court, entier long, entier très grand, flottant et double.
  • Type de statistique : type de statistique qui est calculé pour le champ spécifié. Les statistiques sont calculées pour toutes les entités du groupe. Types de statistiques disponibles :
    • Moyenne (AVG) : calcule la moyenne du champ spécifié.
    • Minimum (MIN) : recherche la valeur la plus faible parmi tous les enregistrements du champ spécifié.
    • Maximum (MAX) : recherche la valeur la plus élevée parmi tous les enregistrements du champ spécifié.
    • Écart type (STDDEV) : calcule la valeur de l’écart type du champ.
    • Somme (SUM) : ajoute la valeur totale du champ spécifié.

Value Table
Générer le cache de regroupement
(Facultatif)

Indique si un cache statique des résultats agrégés est généré ou si les visualisations sont agrégées à la volée. Le cache n’est pas nécessairement créé pour tous les niveaux de détail.

  • Activé : un cache statique des résultats agrégés est généré. Il est recommandé d’utiliser cette option pour de meilleures performances. Cependant, les modifications apportées aux données sous-jacentes ne sont pas mises à jour dans le cache, sauf si l’outil Gérer le cache des groupes d’entités est exécuté.
    • Un cache statique est généré par défaut pour les données dans IBM Db2, Microsoft SQL Server, Oracle et PostgreSQL.
    • Pour générer un cache statique pour les classes d’entités dans PostgreSQL qui utilisent les types spatiaux PostGIS, les bibliothèques GDAL doivent être installées dans la base de données.
    • Un cache statique est toujours généré pour les données dans BigQuery, Redshift et Snowflake.
  • Désactivé : un cache statique des résultats agrégés n’est pas généré et les visualisations sont agrégées à la volée. Il s’agit de l’unique option des données SAP HANA.

Boolean

Sortie obtenue

ÉtiquetteExplicationType de données
Entités mises à jour

Entrée mise à jour avec le regroupement des entités calculé par base de données activé.

Feature Layer

arcpy.management.EnableFeatureBinning(in_features, {bin_type}, {bin_coord_sys}, {summary_stats}, {generate_static_cache})
NomExplicationType de données
in_features

Classe d’entités pour laquelle un regroupement des entités calculé par base de données est effectué. Les types d’entrées pris en charge sont les classes d’entités ponctuelles et multi-points stockées dans une géodatabase d’entreprise ou dans une base de données, ou les classes d’entités ponctuelles stockées dans un stockage de données cloud. Les données ne peuvent pas être versionnées et l’archivage ne peut pas être activé sur ces dernières.

Feature Layer
bin_type
(Facultatif)

Précise le type de regroupement qui sera activé. Si vous utilisez des données SAP HANA, seules les options SQUARE, FLAT_HEXAGON et POINTY_HEXAGON sont prises en charge. Si vous utilisez des données Snowflake ou Redshift, seule l’option GEOHASH est prise en charge.

  • FLAT_HEXAGONLa structure de regroupement hexagonale, également connue comme géohexagone plat ou regroupement d’hexagones plats, est activée. Les tuiles constituent une tessellation d’hexagones dans laquelle l’orientation des hexagones implique un tronçon plat en haut. Il s’agit de l’option par défaut pour les données Microsoft SQL Server, Oracle, PostgreSQL et BigQuery.
    Type de groupe hexagonal plat
  • POINTY_HEXAGONLa structure de regroupement haxagonale pointue, également connue comme géohexagone pointu ou regroupement d’hexagones pointus, est activée. Les tuiles constituent une tessellation d’hexagones dans laquelle l’orientation des hexagones implique un point en haut.
    Type de groupe pointu
  • SQUARELa structure de regroupement carrée, également connue comme géocarré ou regroupement de carrés, est activée. Les tuiles sont une tessellation de carrés. Il s’agit de la valeur par défaut des données Db2 et SAP HANA.
    Type de groupe carré
  • GEOHASHLa structure de regroupement geohash dans laquelle les tuiles illustrent une tessellation de rectangles est activée. Dans la mesure où les groupes GeoHash utilisent toujours le système de coordonnées géographiques WGS84 (GCS WGS84, EPSG WKID 4326), vous ne pouvez pas spécifier de système de coordonnées de groupe pour les groupes GeoHash. Il s’agit de l’option par défaut et de l’unique option pour les données Snowflake et Redshift.
    Type de groupe Geohash
String
bin_coord_sys
[bin_coord_sys,...]
(Facultatif)

Systèmes de coordonnées à utiliser pour visualiser la couche d’entités en sortie agrégée. Vous pouvez spécifier jusqu’à deux systèmes de coordonnées pour visualiser la couche en sortie. Par défaut, le système de coordonnées de la classe d’entités en entrée est utilisé. Les systèmes de coordonnées personnalisés ne sont pas pris en charge.

Ce paramètre ne s’applique pas à BigQuery, Redshift ou Snowflake. Pour ces plateformes, le système de coordonnées de la classe d’entités en entrée est utilisé.

Coordinate System
summary_stats
[[Field, Statistic Type],...]
(Facultatif)

Spécifie les statistiques à résumer et à stocker dans le cache de groupe. Les statistiques sont utilisées pour symboliser les groupes et fournir des informations d’agrégat pour tous les points au sein d’un groupe. Un résumé statistique, le nombre total d’entités (shape_count), est toujours disponible. Vous pouvez définir jusqu’à cinq résumés statistiques supplémentaires.

  • Champ : champ sur lequel le résumé statistique est calculé. Les types de champ pris en charge sont entier court, entier long, entier très grand, flottant et double.
  • Type de statistique : type de statistique qui est calculé pour le champ spécifié. Les statistiques sont calculées pour toutes les entités du groupe. Types de statistiques disponibles :
    • Moyenne (AVG) : calcule la moyenne du champ spécifié.
    • Minimum (MIN) : recherche la valeur la plus faible parmi tous les enregistrements du champ spécifié.
    • Maximum (MAX) : recherche la valeur la plus élevée parmi tous les enregistrements du champ spécifié.
    • Écart type (STDDEV) : calcule la valeur de l’écart type du champ.
    • Somme (SUM) : ajoute la valeur totale du champ spécifié.

Value Table
generate_static_cache
(Facultatif)

Indique si un cache statique des résultats agrégés est généré ou si les visualisations sont agrégées à la volée. Le cache n’est pas nécessairement créé pour tous les niveaux de détail.

  • STATIC_CACHEUn cache statique des résultats agrégés est généré. Il est recommandé d’utiliser cette option pour de meilleures performances. Cependant, les modifications apportées aux données sous-jacentes ne sont pas mises à jour dans le cache, sauf si l’outil Gérer le cache des groupes d’entités est exécuté.
    • Un cache statique est généré par défaut pour les données dans IBM Db2, Microsoft SQL Server, Oracle et PostgreSQL.
    • Pour générer un cache statique pour les classes d’entités dans PostgreSQL qui utilisent les types spatiaux PostGIS, les bibliothèques GDAL doivent être installées dans la base de données.
    • Un cache statique est toujours généré pour les données dans BigQuery, Redshift et Snowflake.
  • DYNAMICUn cache statique des résultats agrégés n’est pas généré et les visualisations sont agrégées à la volée. Il s’agit de l’unique option des données SAP HANA.
Boolean

Sortie obtenue

NomExplicationType de données
out_features

Entrée mise à jour avec le regroupement des entités calculé par base de données activé.

Feature Layer

Exemple de code

Exemple d’utilisation de l’outil EnableFeatureBinning (fenêtre Python)

Activez le regroupement des entités carrées sur la couche d’entités Séismes dont la statistique Count est ajoutée au cache de regroupement des entités.

import arcpy

bin_coord_sys = arcpy.SpatialReference('GCS_WGS_1984')
arcpy.management.EnableFeatureBinning(
    "lod_gdb.elec.Earthquakes", 
    "SQUARE", 
    bin_coord_sys,
    "depth_km MAX", 
    "STATIC_CACHE")

Environnements

Cet outil n’utilise pas d’environnement de géotraitement.

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes