Entraîner le modèle de transformation de texte (GeoAI)—ArcGIS Pro

Synthèse

Entraîne un modèle de transformation de texte pour transformer, traduire ou résumer du texte.

En savoir plus sur le fonctionnement de l’outil Transformation de texte

Utilisation

Cet outil requiert l’installation des structures de Deep Learning. Pour configurer votre machine afin d’utiliser des structures d’apprentissage profond dans ArcGIS Pro, consultez la rubrique Installer les structures d’apprentissage profond pour ArcGIS.
Cet outil permet également d’optimiser un modèle entraîné existant.
Pour exécuter cet outil avec un processeur, définissez le paramètre d’environnement Type de processeur sur GPU. Si vous avez plusieurs processeurs, spécifiez plutôt le paramètre d’environnement ID de GPU.
L’entrée de l’outil est une table ou une classe d’entités contenant des données d’entraînement, avec un champ de texte contenant le texte en entrée et un champ d’étiquette contenant le texte transformé.
Cet outil utilise des backbones basés sur des transformeurs pour entraîner des modèles de transformation de texte et prend en charge l’apprentissage en contexte avec des invites à l’aide du grand modèle de langage (LLM) Mistral. Pour installer le backbone Mistral, reportez-vous à la rubrique ArcGIS Mistral Backbone.
Pour en savoir plus sur les exigences relatives à l’exécution de cet outil, ainsi que sur les problèmes que vous pouvez rencontrer, consultez les rubriques FAQ Apprentissage profond. .

Paramètres

Étiquette	Explication	Type de données
Table en entrée	Table ou classe d’entités contenant un champ de texte qui comporte le texte en entrée pour le modèle et un champ d’étiquette qui comporte le texte transformé cible.	Feature Layer; Table View
Champ de texte	Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte en entrée que le modèle doit transformer.	Field
Champ d’étiquette	Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte transformé cible pour l’entraînement du modèle.	Field
Modèle en sortie	Emplacement du dossier en sortie où sera stocké le modèle entraîné.	Folder
Fichier de modèle pré-entraîné (Facultatif)	Modèle pré-entraîné utilisé pour optimiser le nouveau modèle. L’entrée peut être un fichier de définition de modèle Esri (.emd) ou un fichier de paquetage d’apprentissage profond (.dlpk). Un modèle pré-entraîné qui effectue une tâche similaire peut être optimisé pour s’ajuster aux données d’entraînement. Le modèle pré-entraîné doit avoir été entraîné avec le même type de modèle et le même modèle backbone que ceux qui serviront à entraîner le nouveau modèle.	File
Nombre maximal d’époques (Facultatif)	Nombre maximal d’époques pour lesquelles le modèle est entraîné. Si le nombre maximal d’époques est égal à 1, le jeu de données est transmis une fois à travers le réseau neuronal. La valeur par défaut est 5.	Long
Backbone du modèle (Facultatif)	Spécifie le réseau neuronal préconfiguré à utiliser comme architecture pour entraîner le nouveau modèle. t5-small—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-small est le petit modèle de T5. t5-base—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-base est le modèle intermédiaire de T5. t5-large—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-large est le grand modèle de T5. mistral—Le modèle sera entraîné à l’aide du grand modèle de langage (LLM) Mistral. Mistral est un transformateur avec décodeur uniquement qui utilise la technique Sliding Window Attention (fenêtre d’attention glissante), Grouped Query Attention (attention de requête groupée) et le tokenizer BPE (Byte-Pair Encoding) Byte-fallback. Pour installer le backbone Mistral, reportez-vous à la rubrique ArcGIS Mistral Backbone.	String
Taille de lot (Facultatif)	Nombre d’échantillons d’entraînement qui seront traités en une fois. La valeur par défaut est de 2. Il est possible d’augmenter la taille de lot pour améliorer les performances de l’outil. Il convient toutefois de noter que le volume de mémoire utilisée est proportionnel à la taille de lot. Si un message d’erreur s’affiche pour mémoire insuffisante, utilisez une taille de lot plus petite.	Double
Arguments du modèle (Facultatif)	Arguments supplémentaires utilisés pour initialiser le modèle. L’argument de modèle pris en charge est sequence_length, ce qui permet de définir la longueur de séquence maximale des données d’entraînement à prendre en compte pour l’entraînement du modèle.	Value Table
Vitesse d’apprentissage (Facultatif)	Taille de l’intervalle indiquant dans quelle mesure les pondérations du modèle seront ajustées au cours du processus d’entraînement. Si aucune valeur n’est spécifiée, une vitesse d’apprentissage optimale est déduite automatiquement.	Double
Pourcentage de validation (Facultatif)	Pourcentage des échantillons d’entraînement utilisés pour valider le modèle. La valeur par défaut est 10 pour les modèles de backbone basés sur des transformeurs et 50 pour le backbone Mistral.	Double
Arrêter lorsque le modèle ne s’améliore plus (Facultatif)	Indique si l’entraînement du modèle s’arrête lorsque ce dernier cesse de s’améliorer ou continue jusqu’à atteindre la valeur du paramètre Max Epochs (Nombre maximal d’époques). Activé : l’entraînement du modèle s’arrête lorsque ce dernier cesse de s’améliorer, quelle que soit la valeur du paramètre Nombre maximal d’époques. Il s’agit de l’option par défaut. Désactivé : l’entraînement du modèle continue jusqu’à atteindre la valeur du paramètre Nombre maximal d’époques.	Boolean
Adapter le backbone du modèle pour l’entraînement (Facultatif)	Spécifie si les couches backbone dans le modèle pré-entraîné sont figées afin que les pondérations et les biais conservent leur conception d’origine. Activé : les couches backbone ne sont pas figées, et les pondérations et biais de la valeur du paramètre Backbone du modèle peuvent être altérés pour s’ajuster aux échantillons d’entraînement. Le temps de traitement est plus long, mais les résultats obtenus sont généralement meilleurs. Il s’agit de l’option par défaut. Désactivé : les couches backbone sont figées et les pondérations et biais prédéfinis de la valeur de paramètre Backbone du modèle ne sont pas altérés lors de l’entraînement.	Boolean
Supprimer les balises HTML (Facultatif)	Indique si les balises HTML seront supprimées ou non du texte en entrée. Activé : les balises HTML du texte en entrée seront supprimées. Il s’agit de l’option par défaut. Désactivé : les balises HTML du texte en entrée ne seront pas supprimées.	Boolean
Supprimer les URL (Facultatif)	Indique si les URL seront ou non supprimées du texte en entrée. Activé : les URL du texte en entrée seront supprimées. Il s’agit de l’option par défaut. Désactivé : les URL du texte en entrée ne seront pas supprimées.	Boolean
Prompt (Facultatif)	Entrée ou instruction spécifique donnée à un grand modèle de langage (LLM) pour générer une sortie attendue. La valeur par défaut est Transformer le texte en entrée du champ Texte en le texte transformé présent dans le champ Étiquette.	String

arcpy.geoai.TrainTextTransformationModel(in_table, text_field, label_field, out_model, {pretrained_model_file}, {max_epochs}, {model_backbone}, {batch_size}, {model_arguments}, {learning_rate}, {validation_percentage}, {stop_training}, {make_trainable}, {remove_html_tags}, {remove_urls}, {prompt})

Nom	Explication	Type de données
in_table	Table ou classe d’entités contenant un champ de texte qui comporte le texte en entrée pour le modèle et un champ d’étiquette qui comporte le texte transformé cible.	Feature Layer; Table View
text_field	Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte en entrée que le modèle doit transformer.	Field
label_field	Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte transformé cible pour l’entraînement du modèle.	Field
out_model	Emplacement du dossier en sortie où sera stocké le modèle entraîné.	Folder
pretrained_model_file (Facultatif)	Modèle pré-entraîné utilisé pour optimiser le nouveau modèle. L’entrée peut être un fichier de définition de modèle Esri (.emd) ou un fichier de paquetage d’apprentissage profond (.dlpk). Un modèle pré-entraîné qui effectue une tâche similaire peut être optimisé pour s’ajuster aux données d’entraînement. Le modèle pré-entraîné doit avoir été entraîné avec le même type de modèle et le même modèle backbone que ceux qui serviront à entraîner le nouveau modèle.	File
max_epochs (Facultatif)	Nombre maximal d’époques pour lesquelles le modèle est entraîné. Si le nombre maximal d’époques est égal à 1, le jeu de données est transmis une fois à travers le réseau neuronal. La valeur par défaut est 5.	Long
model_backbone (Facultatif)	Spécifie le réseau neuronal préconfiguré à utiliser comme architecture pour entraîner le nouveau modèle. t5-small—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-small est le petit modèle de T5. t5-base—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-base est le modèle intermédiaire de T5. t5-large—Le nouveau modèle sera entraîné avec le réseau neuronal T5. T5 est un framework unifié qui convertit chaque problème linguistique en un format texte à texte. t5-large est le grand modèle de T5. mistral—Le modèle sera entraîné à l’aide du grand modèle de langage (LLM) Mistral. Mistral est un transformateur avec décodeur uniquement qui utilise la technique Sliding Window Attention (fenêtre d’attention glissante), Grouped Query Attention (attention de requête groupée) et le tokenizer BPE (Byte-Pair Encoding) Byte-fallback. Pour installer le backbone Mistral, reportez-vous à la rubrique ArcGIS Mistral Backbone.	String
batch_size (Facultatif)	Nombre d’échantillons d’entraînement qui seront traités en une fois. La valeur par défaut est de 2. Il est possible d’augmenter la taille de lot pour améliorer les performances de l’outil. Il convient toutefois de noter que le volume de mémoire utilisée est proportionnel à la taille de lot. Si un message d’erreur s’affiche pour mémoire insuffisante, utilisez une taille de lot plus petite.	Double
model_arguments [model_arguments,...] (Facultatif)	Arguments supplémentaires utilisés pour initialiser le modèle. L’argument de modèle pris en charge est sequence_length, ce qui permet de définir la longueur de séquence maximale des données d’entraînement à prendre en compte pour l’entraînement du modèle.	Value Table
learning_rate (Facultatif)	Taille de l’intervalle indiquant dans quelle mesure les pondérations du modèle seront ajustées au cours du processus d’entraînement. Si aucune valeur n’est spécifiée, une vitesse d’apprentissage optimale est déduite automatiquement.	Double
validation_percentage (Facultatif)	Pourcentage des échantillons d’entraînement utilisés pour valider le modèle. La valeur par défaut est 10 pour les modèles de backbone basés sur des transformeurs et 50 pour le backbone Mistral.	Double
stop_training (Facultatif)	Indique si l’entraînement du modèle s’arrête lorsque ce dernier cesse de s’améliorer ou continue jusqu’à atteindre la valeur du paramètre max_epochs. STOP_TRAINING—L’entraînement du modèle s’arrête lorsque ce dernier cesse de s’améliorer, quelle que soit la valeur du paramètre max_epochs. Il s’agit de l’option par défaut. CONTINUE_TRAINING—L’entraînement du modèle continue jusqu’à atteindre la valeur du paramètre max_epochs.	Boolean
make_trainable (Facultatif)	Spécifie si les couches backbone dans le modèle pré-entraîné sont figées afin que les pondérations et les biais conservent leur conception d’origine. TRAIN_MODEL_BACKBONE—Les couches backbone ne sont pas figées, et les pondérations et biais de la valeur du paramètre model_backbone peuvent être altérés pour s’ajuster aux échantillons d’entraînement. Le temps de traitement est plus long, mais les résultats obtenus sont généralement meilleurs. Il s’agit de l’option par défaut. FREEZE_MODEL_BACKBONE—Les couches backbone sont figées et les pondérations et biais prédéfinis de la valeur de paramètre model_backbone ne sont pas altérés lors de l’entraînement.	Boolean
remove_html_tags (Facultatif)	Indique si les balises HTML seront supprimées ou non du texte en entrée. REMOVE_HTML_TAGS—Les balises HTML du texte en entrée seront supprimées. Il s’agit de l’option par défaut. DO_NOT_REMOVE_HTML_TAGS—Les balises HTML du texte en entrée ne seront pas supprimées.	Boolean
remove_urls (Facultatif)	Indique si les URL seront supprimées ou non du texte en entrée. REMOVE_URLS—Les URL du texte en entrée seront supprimées. Il s’agit de l’option par défaut. DO_NOT_REMOVE_URLS—Les URL du texte en entrée ne seront pas supprimées.	Boolean
prompt (Facultatif)	Entrée ou instruction spécifique donnée à un grand modèle de langage (LLM) pour générer une sortie attendue. La valeur par défaut est Transformer le texte en entrée du champ Texte en le texte transformé présent dans le champ Étiquette.	String

Exemple de code

Exemple d’utilisation de la fonction TrainTextTransformationModel (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction TrainTextTransformationModel.

# Name: TrainTextTransformation.py
# Description: Train a sequence-to-sequence model to translate text from English to German.  
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

# Set local variables
in_table = "training_data.csv"
out_folder = "c\\texttransformer"

# Run Train Text Transformation Model
arcpy.geoai.TrainTextTransformationModel(in_table, out_folder, max_epochs=2,
         text_field="input", label_field="target", batch_size=16)

Environnements

Type de processeur, ID du processeur graphique

Informations de licence

Basic: Non
Standard: Non
Advanced: Oui

Rubriques connexes

Vous avez un commentaire à formuler concernant cette rubrique ?