Etiqueta archivos de Google Drive automáticamente con la clasificación basada en IA

Esta función se incluye en Frontline Plus y Enterprise Plus. También se incluye en los complementos Gemini Enterprise (heredado), Gemini Education Premium y AI Security. Comparar complementos

Las etiquetas de clasificación de datos de Google Drive actúan como metadatos descriptivos para los archivos, que puedes usar para diversas funciones, como la protección de datos, la investigación de auditorías y la retención. La clasificación basada en IA para Google Drive automatiza la tarea de etiquetar archivos sin necesidad de programación.

Existen 2 métodos de clasificación por IA:

  • Modelos personalizados: Crea un modelo especializado de aprendizaje automático exclusivo para tu organización basado en un conjunto de datos de entrenamiento organizacionales. Como administrador, controlas los datos con los que se entrenan tus modelos. Tu modelo es único para tu organización.
  • Usar Gemini (beta): Usa los modelos de lenguaje grandes (LLM) de Gemini para inspeccionar el contenido de los archivos y aplicar etiquetas automáticamente según las instrucciones personalizables en lenguaje natural que definas. Este método no requiere la recopilación de datos ni el entrenamiento de modelos por adelantado.

Puedes crear hasta 5 modelos personalizados únicos de clasificación por IA o instrucciones de Gemini en total, con la flexibilidad de combinar ambos métodos dentro de este límite general.

Nota: Para que la clasificación basada en IA etiquete los archivos, estos deben estar en unidades compartidas o pertenecer a usuarios con licencias que admitan etiquetas de clasificación.

Cómo usar la clasificación basada en IA

A continuación, se indican los pasos básicos que seguirás para configurar la clasificación basada en IA y etiquetar automáticamente los archivos nuevos y existentes en Drive.

1. Crea un modelo personalizado o instrucciones de Gemini: Elige o crea una etiqueta de clasificación que quieras aplicar automáticamente a los archivos.

Nota: Si creas un modelo personalizado, también crearás la etiqueta de entrenamiento. Se usa para marcar los archivos de ejemplo que el modelo usa para aprender a clasificar datos.

2. (Solo para modelos personalizados) Entrena el modelo: Después de crear tus etiquetas, los etiquetadores designados clasifican los archivos de Drive con la etiqueta de entrenamiento para crear tu conjunto de datos de entrenamiento. Luego, tu modelo usa el conjunto de datos para aprender a clasificar archivos sensibles.

3. Activa la clasificación basada en IA: Una vez que se entrene el modelo o se configuren las instrucciones de Gemini, puedes configurar el etiquetado automático de archivos, llamado aplicación automática. Durante la configuración, seleccionas qué opciones de etiquetas habilitar y qué usuarios son propietarios de los archivos a los que deseas que la clasificación por IA aplique etiquetas. Luego, tu modelo o tus instrucciones comenzarán a etiquetar los archivos sensibles.

4. Supervisa tu modelo: Puedes usar el registro de eventos de Drive para supervisar cuántos archivos se clasificaron y cuántos usuarios aceptaron o modificaron una etiqueta aplicada automáticamente (si tienen permisos).

Antes de comenzar

Crea un modelo

Para crear un modelo, primero debes seleccionar una etiqueta de clasificación existente o crear una nueva. A continuación, debes crear una etiqueta de entrenamiento coincidente, ya sea automáticamente (opción recomendada) o de forma manual con el administrador de etiquetas, que usarán los etiquetadores designados.

Elige o crea una etiqueta de clasificación

Tu clasificación debe estar habilitada para Drive y Documentos. Después del entrenamiento, el modelo de IA aplica automáticamente tu etiqueta de clasificación a los archivos sensibles de Drive. El modelo se entrena con solo un campo por etiqueta, que debe ser una lista de insignias o una lista de opciones.

Recomendamos una etiqueta de sensibilidad con insignia, ya que se muestra de forma destacada en los documentos.

Cuando uses un campo de lista de opciones o de lista de insignias para una etiqueta de clasificación, debe cumplir con los siguientes requisitos:

  • Tener al menos 2 y no más de 7 opciones
  • Publicarse

Si tienes una etiqueta existente que cumple con estos requisitos, puedes usarla como etiqueta de clasificación. De lo contrario, usa el administrador de etiquetas para crear una etiqueta, ya sea antes de configurar el modelo o durante la configuración (más adelante en esta página). Si deseas obtener más detalles, consulta Crea etiquetas de clasificación para tu organización.

Crea una etiqueta de entrenamiento

Tu etiqueta de entrenamiento es casi idéntica a la etiqueta de clasificación y los etiquetadores designados la usan solo con fines de entrenamiento. Cuando crees tu modelo (más adelante en esta página), podrás crear automáticamente la etiqueta de entrenamiento para asegurarte de que coincida con la etiqueta de clasificación.

También puedes crear tu propia etiqueta de entrenamiento de forma manual con el administrador de etiquetas, ya sea antes de configurar el modelo o durante la configuración. Para obtener más detalles, consulta ¿Cómo creo manualmente etiquetas de entrenamiento? más adelante en la página.

Crea el modelo

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Crear modelo.
  3. En la lista Etiqueta de clasificación, selecciona una etiqueta de clasificación y un campo existentes para entrenar un modelo, o bien haz clic en Crear etiqueta para crear uno con el administrador de etiquetas.

    Si creaste una etiqueta en el Administrador de etiquetas, vuelve a la página Crear modelo. Es posible que debas actualizar la página para ver la etiqueta nueva en la lista.

  4. Para tu etiqueta de clasificación, selecciona el campo apto que deseas usar en la lista Nombre del campo.
  5. Haz clic en Continuar.
  6. (Opcional) Crea y publica automáticamente una etiqueta de entrenamiento que coincida con tu etiqueta de clasificación:
    1. Haz clic en Crear etiqueta de entrenamiento.
    2. Haz clic en Actualizar permisos de la etiqueta en el mensaje que aparece. La etiqueta se abre en modo de edición en el Administrador de etiquetas en una pestaña aparte.
    3. Haz clic en Permisos y luego Editar y, luego, otorga el permiso Puede aplicar etiquetas y establecer valores al grupo de configuración que contiene a tus etiquetadores.
    4. Haz clic en Guardar y cierra la pestaña del administrador de etiquetas.

      Nota: También puedes establecer permisos de etiquetas más adelante. Sin embargo, es importante que solo tus etiquetadores tengan acceso a la etiqueta de entrenamiento.

  7. (Opcional) Si ya creaste una etiqueta de entrenamiento, selecciónala en la lista Etiqueta de entrenamiento.
  8. (Opcional) Haz clic en Ir al administrador de etiquetas para crear tu propia etiqueta de entrenamiento ahora.

    Importante: Asegúrate de que tu etiqueta cumpla con los criterios de las etiquetas de entrenamiento y establece los permisos de la etiqueta para que solo tus etiquetadores puedan acceder a ella. Para obtener más información, consulta las instrucciones sobre las etiquetas de entrenamiento más adelante en la página.

    Vuelve a la página Crear modelo. Es posible que debas actualizar la página para ver la nueva etiqueta de entrenamiento en la lista.

  9. En la página Crear modelo, haz clic en Continuar.
  10. Ingresa un nombre descriptivo para el modelo.
  11. Haz clic en Crear modelo.

Después de crear el modelo, en la página Detalles del modelo, se muestran la etiqueta de entrenamiento y la etiqueta de clasificación seleccionadas.

Entrena el modelo

Para entrenar el modelo de IA, debes crear un conjunto de datos de entrenamiento y, luego, iniciar su ejecución de entrenamiento inicial. Durante una ejecución de entrenamiento, el modelo aprende de los ejemplos del conjunto de datos.

El reentrenamiento es automático: Después de la ejecución del entrenamiento inicial, tu modelo se reentrena cada 2 semanas para ayudar a mejorar o mantener su nivel de precisión. Puedes volver a entrenar tu modelo manualmente en cualquier momento. Después de cada ejecución de entrenamiento, se lanza un modelo nuevo y se restablece el programa de reentrenamiento automático de 2 semanas.

Crea un conjunto de datos de entrenamiento

Para crear un conjunto de datos de entrenamiento, los etiquetadores designados deben aplicar la etiqueta de entrenamiento a al menos 100 archivos por opción de etiqueta. Por ejemplo, si tu etiqueta tiene 3 opciones (por ejemplo, "Necesidad de saber", "Confidencial" y "Público"), necesitas al menos 300 archivos de entrenamiento. Sin embargo, es mejor tener más de 100 archivos por opción de etiqueta, ya que es probable que algunos archivos no sean aptos para el conjunto de datos de entrenamiento. Obtén más información para etiquetar ejemplos de alta calidad para el entrenamiento.

Nota: Tu conjunto de datos de entrenamiento puede tener un máximo de 1 millón de archivos.

Después de crear el modelo, se verifica automáticamente cuántos archivos se etiquetaron para el entrenamiento en un plazo de 24 horas. Después de eso, se verifica continuamente durante todo el día.

Para verificar cuántos archivos se etiquetaron, sigue estos pasos:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de la parte superior de la página, en Archivos de entrenamiento para el modelo activo, consulta la cantidad de archivos etiquetados.

Si tu modelo tiene suficientes archivos para el entrenamiento, aparecerá el mensaje Listo para el entrenamiento.

Iniciar una ronda de entrenamiento

Por lo general, una ronda de entrenamiento tarda entre 4 y 6 horas, pero puede tardar más para conjuntos de datos más grandes. Es probable que tu modelo necesite varias ejecuciones de entrenamiento para aprender a etiquetar tus archivos con precisión.

Durante una ronda de entrenamiento, el modelo compara la clasificación que selecciona para un archivo con la etiqueta de entrenamiento que se aplicó al archivo para generar puntuaciones. Para obtener más información, consulta Cómo se calculan las puntuaciones.

Después de ejecutar el entrenamiento, puedes verificar la precisión del modelo.

Para iniciar una ronda de entrenamiento, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de entrenamiento que se encuentra en la parte superior de la página, haz clic en Start a training run.

    Nota: Este botón solo está disponible si tus etiquetadores etiquetaron la cantidad mínima de archivos de entrenamiento.

Después del entrenamiento: Verifica las puntuaciones del modelo

Después de una ronda de entrenamiento, se lanza tu modelo con puntuaciones de porcentaje para cada opción de etiqueta. Cada puntuación, llamada puntuación de recuperación, es el porcentaje de ejemplos de entrenamiento que el modelo clasificó correctamente después de evaluarse a sí mismo:

  • Inferior al 50%: Precisión baja. El modelo necesita mejores datos y aún no está listo.
  • Del 50% al 80%: Precisión media. Es posible que el modelo esté listo de forma limitada.
  • Superior al 80%: Precisión alta. El modelo está listo para clasificar archivos en tu organización.

Para verificar la exactitud de tu modelo después de una ronda de entrenamiento:

En la página Detalles del modelo, puedes ver las puntuaciones del modelo:

  • En el panel de resultados del entrenamiento que se encuentra en la parte superior de la página, en Archivos actuales usados y puntuaciones
  • En el panel Conjunto de datos de entrenamiento actual

Crea instrucciones para Gemini

Para crear un conjunto de instrucciones de Gemini, primero debes seleccionar una etiqueta predefinida que contenga instrucciones o elegir una etiqueta de clasificación existente. Antes de comenzar, asegúrate de que tu etiqueta existente cumpla con los criterios de configuración necesarios. Para obtener más información, consulta Elige o crea una etiqueta de clasificación en esta página.

Para crear instrucciones de Gemini, sigue estos pasos:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Usar Gemini.
  3. En la página Selecciona la etiqueta que Gemini aplicará, elige una opción:
    • Selecciona Aplicar una etiqueta predefinida para usar una etiqueta predefinida con instrucciones de plantilla que puedes editar.
    • Selecciona Aplicar tu propia etiqueta para usar una de las etiquetas existentes de tu organización.
  4. Si necesitas una etiqueta nueva, haz clic en Crear etiqueta para abrir el Administrador de etiquetas en una pestaña nueva del navegador.
    • Nota: Después de crear y publicar una etiqueta nueva en la pestaña del administrador de etiquetas, vuelve a la pestaña Usar Gemini para aplicar etiquetas y actualiza la página para actualizar las opciones disponibles.
  5. Si eliges Aplicar tu propia etiqueta, selecciona el menú desplegable Etiqueta de clasificación y elige una etiqueta.
  6. Haz clic en el menú desplegable Nombre del campo y selecciona un campo.
  7. Haz clic en Continuar.
  8. En la página Revisa los detalles de las instrucciones para Gemini, ingresa instrucciones claras y completas para cada opción de etiqueta para ayudar a Gemini a clasificar los datos de tu organización. Incluye los siguientes detalles para cada opción:
    • Qué representa la opción, como una categoría, un tipo o una característica
    • Cómo debe identificar la opción Gemini, por ejemplo, pistas o palabras clave que debe buscar
    • Cómo Gemini debe manejar las excepciones, por ejemplo, situaciones en las que la opción no debe aplicarse
  9. Haz clic en Continuar.
  10. En la página Selecciona las opciones de etiquetas para que sean aptas para la aplicación automática, marca las casillas de las opciones de etiquetas específicas que Gemini debe aplicar automáticamente.
    • Nota: Gemini no aplicará las opciones no marcadas a los archivos de Drive.
  11. Haz clic en Continuar.
  12. En la página Revisa y asigna un nombre a las instrucciones, ingresa un nombre descriptivo para las instrucciones en el campo Nombre*. Revisa y verifica los detalles para asegurarte de que sean correctos.
  13. Haz clic en Guardar o Guardar y configurar la aplicación automática.

Activa la clasificación de IA

Después de configurar las instrucciones de Gemini o entrenar el modelo personalizado para que alcance un nivel mínimo de precisión (al menos el 50%), puedes elegir opciones de etiquetas y activar el etiquetado automático de archivos o la aplicación automática. Para obtener los mejores resultados con un modelo personalizado, se recomienda esperar a que las puntuaciones del modelo para todas las opciones de etiquetas alcancen al menos el 80%.

Para activar la aplicación automática

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de entrenamiento, haz clic en Configurar la aplicación automática.

    Nota: Este botón solo está disponible si al menos 1 opción de etiqueta alcanzó el 50% de precisión.

    O bien, si ya configuraste la aplicación automática, en Archivos etiquetados con IA, haz clic en Editar la aplicación automática.

  5. Marca las casillas de las opciones de etiquetas que quieres que el modelo de IA aplique automáticamente.
  6. Haz clic en Guardar y continuar para seleccionar qué unidades organizativas o grupos son propietarios de los archivos en los que el modelo debe aplicar etiquetas automáticamente. El parámetro de configuración predeterminado es tu organización principal de nivel superior.

    También puedes hacer clic en Guardar para seleccionar usuarios más adelante.

  7. Si elegiste seleccionar usuarios, en el costado, selecciona una unidad organizativa o un grupo de configuración.

    La configuración de los grupos anula la de las unidades organizativas. Más información

  8. Haz clic en Activada: La etiqueta se aplica automáticamente con una de las siguientes opciones.
  9. Haz clic en Guardar.

    En la página Detalles del modelo, el Estado actual de la aplicación automática de la regla es Activado.

Nota: Puedes supervisar la clasificación basada en IA con el registro de eventos de Drive. Para obtener más información, consulta Cómo supervisar eventos de etiquetas de clasificación basadas en IA más adelante en esta página.

Cuándo la clasificación por IA analiza archivos

Después de que se activa la aplicación automática para los archivos propiedad de los usuarios y las unidades compartidas, la clasificación basada en IA analiza sus archivos (en reposo) al menos una vez en un plazo de 1 a 2 semanas. La clasificación basada en IA también analiza los archivos cada vez que se suben o modifican, y puede cambiar la etiqueta aplicada si cambia el contenido del archivo.

Nota: El análisis de archivos inactivos se debe activar de forma manual cuando se usa la clasificación de IA con instrucciones de Gemini. Para activar esta función, haz clic en Aplicar etiqueta a los archivos inactivos en la página Instrucciones.

Cómo se manejan los conflictos de la aplicación automática

Reglas de protección de datos

Los valores de etiquetas establecidos por las reglas de protección de datos tienen prioridad sobre la clasificación de IA, y ambos tienen prioridad sobre la clasificación predeterminada.

Varios modelos personalizados o instrucciones de Gemini

Cuando 2 o más fuentes de clasificación de IA intentan aplicar diferentes opciones de etiquetas del mismo campo de etiqueta al mismo archivo, se aplica la opción que se encuentra más arriba en la lista de opciones de la etiqueta. Por ejemplo, es posible que tengas una etiqueta con un campo que tenga 3 opciones en el administrador de etiquetas:

  1. Confidencial
  2. Interno
  3. Público

Si la fuente de clasificación de IA 1 intenta establecer la etiqueta como Confidencial y la fuente 2 intenta establecer la etiqueta como Público para el mismo archivo, se aplicará Confidencial, ya que se encuentra más arriba en la lista de opciones de la etiqueta. Antes de configurar reglas, asegúrate de que las opciones de campo de una etiqueta aparezcan en el orden de prioridad que prefieras.

Etiquetas aplicadas por el usuario

Las etiquetas que los usuarios aplican a los archivos tienen prioridad sobre las etiquetas aplicadas por la IA, es decir, la clasificación de la IA no modifica una etiqueta que un usuario haya establecido previamente.

Nota: Cuando un usuario acepta o modifica un archivo etiquetado por IA, la etiqueta se considera "aplicada por el usuario" y la clasificación por IA ya no modificará su valor.

Supervisa tu modelo

Obtén detalles sobre cómo la clasificación basada en IA etiqueta archivos en el registro de eventos de Drive. Para cada opción de etiqueta, el registro muestra cuántos archivos se clasificaron con la aplicación automática y cuántos usuarios aceptaron la etiqueta aplicada automáticamente o la modificaron. Los usuarios necesitan permisos para realizar acciones en las etiquetas aplicadas automáticamente.

Permisos que necesitan los usuarios para interactuar con las etiquetas aplicadas automáticamente

Los usuarios necesitan permisos de archivo y etiqueta para interactuar con las etiquetas aplicadas automáticamente. Puedes establecer permisos para tu etiqueta de clasificación en el Administrador de etiquetas. Para obtener más información, consulta Crea etiquetas de clasificación para tu organización.

  • Para ver las etiquetas aplicadas automáticamente, los usuarios necesitan el permiso Puede ver esta etiqueta para tu etiqueta de clasificación.
  • Para aceptar y modificar las etiquetas aplicadas automáticamente, los usuarios deben tener el permiso Can apply labels and set values para tu etiqueta de clasificación y ser Editor o Owner del archivo.

Cómo ver los eventos de clasificación por IA en el registro de eventos de Drive

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Detalles del modelo, en Archivos etiquetados por IA, selecciona Ver archivos para la opción de etiqueta para la que deseas ver eventos.

    La herramienta de investigación de seguridad se abre en una pestaña nueva y muestra los resultados de la búsqueda en el registro de eventos de Drive para dos eventos relacionados con la clasificación de IA: Se aplicó la etiqueta y Se cambió el valor del campo de etiqueta.

  4. Haz clic en la Descripción del evento para obtener detalles adicionales, como los siguientes:
    • Nombre y tipo del documento etiquetado
    • Valor del campo de etiqueta asignado al documento (por ejemplo, Confidencial o Restringido)

Consulta la tasa de aceptación de usuarios para las instrucciones de Gemini

En la página Detalles del modelo de la clasificación basada en IA, el gráfico Aceptación del usuario muestra los datos de rendimiento de tus instrucciones derivados de los comentarios de los usuarios durante los últimos 180 días.

Las métricas incluyen lo siguiente:

  • Usuarios que revisaron la etiqueta: Es el recuento total de usuarios que interactuaron con el banner de etiquetas automáticas para aceptar o modificar una opción de etiqueta aplicada con Gemini.
  • Usuario aceptó: Es el recuento total de usuarios que optaron por conservar la etiqueta específica sugerida por Gemini.

Administra tu modelo

Desactiva la aplicación automática de una etiqueta de clasificación

Para desactivar la aplicación automática de todas las opciones de etiquetas o solo de algunas, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En Archivos etiquetados por IA, haz clic en Editar aplicación automática.
  5. Desmarca las casillas de las opciones de etiquetas para las que deseas desactivar la aplicación automática.

    También puedes borrar todas las opciones para pausar por completo la aplicación automática.

Para desactivar por completo la aplicación automática en unidades organizativas o grupos específicos, haz lo siguiente:

Puedes desactivar por completo la aplicación automática para el contenido que pertenece a los usuarios de unidades organizativas o grupos específicos.

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el menú Más acciones, ubicado en la parte superior de la página, haz clic en Administrar la aplicación automática y luego Actualizar las OU o los grupos habilitados.
  5. Haz clic en una unidad organizativa o un grupo a la izquierda para seleccionarlo.
  6. Selecciona DESACTIVADA: La etiqueta no se aplica automáticamente.
  7. Haz clic en Guardar.

Cómo borrar un modelo personalizado o las instrucciones para Gemini

Es posible que debas borrar un modelo personalizado o instrucciones de Gemini si, por ejemplo, su precisión no es aceptable. Si borras un modelo personalizado o las instrucciones de Gemini, se quitarán de forma permanente todos sus parámetros de configuración de clasificación por IA. Nota:

  • Las etiquetas que se usan en el modelo o en las instrucciones de Gemini se desvinculan de la configuración de clasificación de IA, y se borra el historial del modelo o de las instrucciones de Gemini. Sin embargo, las etiquetas en sí no se borran y se pueden seguir administrando en el Administrador de etiquetas.
  • (Solo para modelos personalizados) Las etiquetas de entrenamiento permanecen en los archivos. Después de borrar el modelo, puedes configurar un nuevo modelo personalizado para usar la misma etiqueta de entrenamiento. Los modelos tendrán un rendimiento similar si vuelves a entrenar tu etiqueta de entrenamiento y los archivos de entrenamiento existentes.
  • Se detendrá de inmediato la aplicación automática de etiquetas que se haya activado para el modelo. Puedes optar por quitar o conservar las etiquetas que se aplicaron automáticamente a los archivos que un usuario no aceptó ni modificó.
  • Si vuelves a crear un modelo nuevo o instrucciones de Gemini con la misma etiqueta de clasificación, la función de clasificación por IA reemplazará los resultados de las clasificaciones anteriores. Esto te permite volver a procesar los archivos de Drive de tu organización, lo que puede ser útil si la calidad de tu modelo o tus instrucciones mejoró significativamente desde que comenzaste a usarlos.

Para borrar un modelo o instrucciones, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridad y luego Control de acceso y datos y luego Clasificación de datos.

    Se requieren los privilegios de administrador Ver regla de DLP y Administrar regla de DLP.

  2. En la sección Clasificación por IA, haz clic en Ver modelos guardados.
  3. En la página Lista de modelos, haz clic en Acciones junto al modelo o las instrucciones, y selecciona Borrar modelo o Borrar instrucciones. En el diálogo, se enumeran los efectos de la eliminación y se te permite decidir si deseas conservar o descartar las etiquetas aplicadas anteriormente:
    • Conservar las etiquetas aplicadas: Las etiquetas que se aplicaron anteriormente con cualquier versión de estas instrucciones permanecerán en los archivos.
    • Quitar etiquetas aplicadas: Se quitarán de los archivos las etiquetas que se hayan aplicado previamente con cualquier versión de estas instrucciones. Las etiquetas pueden tardar hasta 2 semanas en quitarse. No se quitarán si las modificó un usuario, una regla, otro modelo de IA o las instrucciones de Gemini.
  4. Marca la casilla para confirmar lo siguiente: Si continúas, confirmas que esta acción no se puede deshacer.
  5. Para continuar, haz clic en Borrar modelo o Borrar instrucciones.

Preguntas frecuentes

Etiquetas de entrenamiento y clasificación

¿Cuáles son los requisitos para las etiquetas de entrenamiento y clasificación?

Tanto la etiqueta de clasificación como la etiqueta de entrenamiento deben cumplir con los siguientes criterios:

  • Debe contener un mínimo de 2 y un máximo de 7 opciones.
  • Deben tener las opciones en el mismo orden.
  • Debe estar publicado.
  • Tener etiquetas con diferentes permisos de acceso La etiqueta de entrenamiento solo debe estar disponible para los etiquetadores designados que pueden entrenar el modelo. La etiqueta de clasificación puede tener un acceso más amplio.

¿Cómo creo manualmente una etiqueta de entrenamiento?

Si bien se recomienda crear la etiqueta de entrenamiento automáticamente cuando configures tu modelo, puedes crear una de forma manual en el administrador de etiquetas siguiendo estos lineamientos:
  • Asegúrate de que la etiqueta cumpla con los criterios de etiquetado obligatorios.
  • Identifica la etiqueta de entrenamiento con la palabra "entrenamiento" para que los etiquetadores designados puedan reconocerla y aplicarla con mayor facilidad cuando creen tu conjunto de datos de entrenamiento.
  • Agrega un campo de descripción a la etiqueta de entrenamiento para ayudar aún más a los etiquetadores designados a comprender su propósito.
  • Asegúrate de establecer los permisos de la etiqueta solo para los etiquetadores designados, es decir, aquellos que identificarán los archivos para el entrenamiento del modelo, con el grupo de configuración que creaste para los etiquetadores.

¿Puedo usar la etiqueta de clasificación como etiqueta de entrenamiento?

No, la etiqueta de clasificación y la etiqueta de entrenamiento deben ser diferentes. La etiqueta que elijas como etiqueta de clasificación no está disponible para la etiqueta de entrenamiento.

¿Las instrucciones de Gemini permiten que Google use mis datos privados para entrenar modelos globales?

No. Todas las operaciones ocurren dentro de límites de aislamiento estrictos. El contenido interno de Drive y las instrucciones asociadas permanecen aislados de forma segura dentro de tu entorno autorizado de Workspace y no se usan para entrenar los modelos de Google. Obtén más información sobre nuestros compromisos con la privacidad y la seguridad en el Centro de privacidad.

Conjuntos de datos de entrenamiento

¿Qué archivos son adecuados para entrenar el modelo?

Para obtener los mejores resultados en el entrenamiento del modelo, haz que los etiquetadores designados sigan estos lineamientos:

  • Asegúrate de que cada archivo tenga un mínimo de 500 caracteres.
  • Selecciona los archivos que representan el contenido que los usuarios crean, comparten y usan en tu organización.
  • Etiqueta aproximadamente la misma cantidad de archivos por opción de etiqueta, con un mínimo de 100 archivos para cada opción. Esto ayuda al modelo a obtener una comprensión integral de tus datos y a mejorar las puntuaciones.
  • Incluye una variedad representativa de archivos para cada tipo de opción. Por ejemplo, no etiquetes 100 currículums como tu conjunto total de archivos de ejemplo para Top Secret si los contratos también son un tipo de archivo de Top Secret común en tu organización.
  • Aplica la etiqueta de entrenamiento solo a los archivos que pertenecen a tu organización, ya sea que sean propiedad directa de los usuarios o que estén almacenados en unidades compartidas. La clasificación basada en IA no procesa los archivos que pertenecen a usuarios externos ni los que se encuentran en unidades compartidas externas.

¿Se puede entrenar el modelo con archivos etiquetados previamente?

Por el momento, no es posible entrenar el modelo con archivos etiquetados anteriormente. Un modelo requiere que una etiqueta de entrenamiento sea una réplica de la etiqueta que aplicará automáticamente a los archivos, pero no pueden ser la misma etiqueta.

¿El modelo se puede entrenar en varios idiomas?

El modelo admite varios idiomas. Sin embargo, se debe incluir una muestra representativa de archivos para cada tipo de opción y cada idioma en los datos de entrenamiento. Esto aumenta la cantidad de archivos necesarios para entrenar el modelo correctamente. Solo se admiten idiomas basados en caracteres latinos.

¿Cómo se calculan las puntuaciones durante el entrenamiento?

Durante el entrenamiento, el modelo de IA usa el 75% de los datos de entrada para entrenarse sobre cómo etiquetar archivos y reserva el 25% para probar periódicamente su propio rendimiento. En otras palabras, para el 25% de los archivos etiquetados, el modelo los analiza como si no supiera qué etiqueta se aplicó. Luego, el modelo de IA toma su propia decisión sobre la etiqueta y la compara con la etiqueta real que aplicó la persona designada para etiquetar. Las puntuaciones muestran qué proporción de los archivos reservados se etiquetó correctamente.

Una vez que entreno un modelo, ¿puedo "congelarlo" para que deje de reentrenarse automáticamente?

Los modelos de clasificación de IA se entrenan con archivos de Drive. Cuando se borran esos archivos (a menudo, según los programas de retención a través de Google Vault), también se debe borrar el modelo posteriormente para garantizar que el contenido de los archivos no persista de alguna manera. Por este motivo, el reentrenamiento del modelo se realiza en un bucle continuo y no se puede suspender.

¿Los usuarios pueden cambiar o corregir las etiquetas y los valores de campo?

Los usuarios con permiso pueden actualizar una etiqueta o un valor de campo, pero la clasificación de IA no revisa el modelo de clasificación en función de ese cambio. Si observas que el modelo aplicó etiquetas y valores de campo de forma incorrecta, puedes pedirles a los etiquetadores designados que asignen la etiqueta de entrenamiento correcta a los archivos. Luego, la clasificación basada en IA incorpora estos datos en el siguiente ciclo de autoentrenamiento del modelo.

Aplicación automática

¿Puede la clasificación con IA evaluar imágenes, videos y archivos de audio?

La clasificación basada en IA utiliza el mismo procesamiento de texto indexable que la DLP de Drive. Cualquier archivo del que Drive pueda extraer texto indexable se puede evaluar para determinar si se le aplicaron etiquetas de clasificación basada en IA. Esto incluye el reconocimiento óptico de caracteres (OCR) para extraer texto de imágenes. Sin embargo, la clasificación por IA no evalúa los archivos de audio o video.

¿La clasificación por IA funciona para etiquetar solo el contenido sensible?

El contenido sensible es el enfoque principal de la clasificación basada en IA, pero se puede entrenar cualquier etiqueta con hasta 4 opciones para el etiquetado automático. Las etiquetas de clasificación también se usan para la auditoría, la capacidad de búsqueda y la administración de la retención.

¿Funciona la clasificación basada en IA cuando la encriptación del cliente (CSE) está activada?

Debido a que Google no puede desencriptar los archivos encriptados con CSE (solo tu clave de encriptación privada puede hacerlo), la clasificación basada en IA no puede entrenarse con archivos encriptados con CSE ni aplicar etiquetas automáticamente a estos archivos.

¿Cómo y cuándo revisa la clasificación basada en IA las etiquetas aplicadas automáticamente?

Después de activar la aplicación automática, la clasificación basada en IA analiza y clasifica todos los archivos en reposo de los que puede extraer suficiente texto. Estos archivos se analizan al menos una vez.

La clasificación por IA vuelve a procesar los archivos periódicamente a medida que se modifica el contenido. Los cambios en el contenido pueden generar una predicción diferente para un archivo. Cuando la clasificación por IA tenga una opción predicha antigua y una nueva para un archivo, preferirá la opción que esté más arriba en la lista de opciones. Por ejemplo, si un campo tiene tres opciones que se muestran en el administrador de etiquetas:

  • Confidencial
  • Interno
  • Público

Supongamos que la clasificación basada en IA clasifica un archivo como Interno y el contenido cambia de modo que el modelo de clasificación basada en IA predice Confidencial. En este caso, la clasificación del archivo cambia a Confidencial. Sin embargo, si el modelo de clasificación basado en IA predice Público, la clasificación del archivo seguirá siendo Interno.

La clasificación basada en IA no revisa las etiquetas aplicadas automáticamente ni los valores de campo que los usuarios revisaron o modificaron.

Si el modelo cambia, ¿reevalúa automáticamente los archivos existentes?

Tus archivos se procesan con el modelo más reciente cuando se crean o modifican. Los archivos existentes no se vuelven a procesar automáticamente cuando se lanza una nueva versión del modelo. Sin embargo, es posible que el modelo vuelva a procesar periódicamente todos tus archivos con la versión más reciente, independientemente de las actualizaciones o el reentrenamiento específicos del modelo.

¿La clasificación por IA tiene prioridad sobre otros métodos de clasificación cuando hay varios activos?

Se puede anular la clasificación de datos. La clasificación de datos se realiza en el siguiente orden:
  1. Regla de DLP sin anulación del usuario
  2. Clasificación manual
  3. Regla de DLP con anulación del usuario
  4. Clasificación por IA
  5. Clasificación predeterminada
Quitar una etiqueta o un campo permite que entre en vigencia un mecanismo de clasificación de nivel inferior. Por ejemplo, un archivo al que un usuario le quitó una etiqueta puede tener la misma etiqueta aplicada automáticamente más tarde por la clasificación basada en IA.

¿A qué tipos de archivos puede aplicar etiquetas la clasificación basada en IA?

  • La clasificación basada en IA utiliza el mismo procesamiento de texto indexable que la DLP de Drive. Para obtener más detalles, consulta la lista de tipos de archivos que analiza la DLP. No se admiten archivos de audio ni video.
  • Un archivo debe tener una cantidad mínima de texto para que la clasificación por IA aplique una etiqueta. Como resultado, es posible que no se clasifiquen algunos archivos, como documentos muy cortos e imágenes con pequeñas cantidades de texto.

¿Qué sucede cuando se inhabilita una opción para la aplicación automática?

Durante el análisis, si se predice que un archivo tiene una opción para la que está inhabilitada la aplicación automática, la clasificación de IA no aplica ninguna etiqueta ni valor de campo al archivo.

Los archivos que la clasificación de IA etiquetó previamente conservan los valores de la etiqueta y la opción aplicados, incluso después de que se inhabilita la opción.

¿Puedo revertir las etiquetas aplicadas automáticamente?

No puedes deshacer la aplicación de etiquetas. Te recomendamos que definas y pruebes tus modelos con un público pequeño antes de realizar una implementación amplia. Por ejemplo, puedes entrenar tus modelos con una etiqueta temporal. Luego, una vez que el rendimiento del modelo sea satisfactorio, puedes "restablecer" el modelo borrándolo y creando uno nuevo con la misma etiqueta de entrenamiento (el mismo conjunto de datos de entrenamiento), pero con tu etiqueta permanente.

Modelos personalizados y Gemini

¿La clasificación basada en IA con instrucciones de Gemini reemplaza por completo los modelos personalizados existentes?

No. Las instrucciones de Gemini funcionan como una alternativa complementaria. Mientras que los modelos clásicos crean un modelo aislado y específico para el cliente que se adapta exclusivamente a tus patrones de datos históricos, las instrucciones de Gemini usan nuestro modelo de base previamente entrenado para evaluar el contenido en función de las reglas personalizadas basadas en texto que escribes.

¿Cómo decido cuándo usar las instrucciones de Gemini o los modelos clásicos?

Las organizaciones no tienen que elegir exclusivamente una sola arquitectura. Ambos modos se pueden usar en conjunto para admitir diferentes fases de clasificación de datos según las necesidades de tu organización.

¿Qué elementos componen las instrucciones de clasificación de datos?

Una instrucción de clasificación es un esquema estructurado que se le proporciona a Gemini. Para ayudar a Gemini a clasificar tus datos, ingresa detalles de instrucciones claros y completos para cada opción de etiqueta, incluido lo que representa la opción, cómo Gemini debe identificarla y cómo controlar las excepciones.

Comportamiento de la clasificación de IA de Gemini

¿Por qué Gemini a veces asigna diferentes opciones de etiquetas a archivos idénticos o casi idénticos?

Los LLMs son inherentemente probabilísticos en lugar de determinísticos. Si bien el código tradicional sigue una lógica fija para producir resultados idénticos para una entrada determinada, los LLMs generan respuestas basadas en probabilidades estadísticas. Este proceso puede verse influenciado por parámetros internos, como la "temperatura", que introduce un grado de variabilidad en las selecciones del modelo. Además, varias variables externas pueden modificar el razonamiento interno del modelo y generar resultados diferentes para archivos idénticos o casi idénticos. Estos factores incluyen actualizaciones de la versión del modelo subyacente, ajustes a las instrucciones a nivel del sistema o incluso la fecha y hora específicas de la solicitud de clasificación. Como resultado, estos elementos dinámicos garantizan que Gemini evalúe cada archivo dentro de una ventana contextual única, lo que, en ocasiones, puede generar diferentes asignaciones de etiquetas.