Etiqueta archivos de Google Drive automáticamente con la clasificación basada en IA

Esta función se incluye en Frontline Plus y Enterprise Plus. También se incluye en los complementos Gemini Enterprise (heredado), Gemini Education Premium y AI Security. Comparar complementos

La clasificación basada en IA puede etiquetar automáticamente el contenido sensible de tu organización en Google Drive con modelos de IA personalizados que tu organización entrena, sin necesidad de programación. Como administrador, controlas con qué datos se entrenan tus modelos, por lo que cada modelo es único para tu organización y solo ella puede usarlo. Puedes crear hasta 5 modelos de clasificación basados en IA únicos para tu organización.

Puedes aprovechar tus archivos clasificados por IA en políticas de seguridad, como reglas de protección de datos, Vault y mucho más.

Nota: Para que la clasificación basada en IA etiquete los archivos, estos deben estar en unidades compartidas o pertenecer a usuarios con licencias que admitan etiquetas de clasificación.

Descripción general de la clasificación por IA

A continuación, se indican los pasos básicos que seguirás para configurar la clasificación basada en IA y etiquetar automáticamente los archivos nuevos y existentes en Drive.

1. Crea un modelo: Primero, elige o crea una etiqueta de clasificación, que el modelo de IA aplicará automáticamente a los archivos después de que se entrene. También creas la etiqueta de entrenamiento, que se usa para entrenar el modelo para identificar el contenido sensible de tu organización. Luego, creas un modelo de IA para usar esas etiquetas.

2. Entrena el modelo: Después de crear tus etiquetas, los etiquetadores designados clasifican los archivos de Drive con la etiqueta de entrenamiento para crear tu conjunto de datos de entrenamiento. Luego, tu modelo usa el conjunto de datos para aprender a clasificar archivos sensibles.

3. Activa la clasificación basada en IA: Una vez que se entrene el modelo, podrás configurar el etiquetado automático de archivos, llamado aplicación automática. Durante la configuración, seleccionas qué opciones de etiquetas habilitar y qué usuarios son propietarios de los archivos a los que deseas que la clasificación por IA aplique etiquetas. Luego, tu modelo comenzará a etiquetar automáticamente los archivos sensibles.

4. Supervisa tu modelo: Puedes usar el registro de eventos de Drive para supervisar cuántos archivos se clasificaron y cuántos usuarios aceptaron o modificaron una etiqueta aplicada automáticamente (si tienen permisos).

Antes de comenzar

  • Comprende cómo funcionan las etiquetas de clasificación y cómo crearlas. Para obtener más información, consulta Primeros pasos como administrador de etiquetas de clasificación.
  • Elige a los etiquetadores designados, un grupo de usuarios de tu organización que pueden aplicar correctamente la etiqueta de entrenamiento de forma manual a los archivos sensibles.
  • Crea un grupo de configuración solo para los etiquetadores designados. Para obtener instrucciones, consulta Personaliza la configuración de los servicios con grupos de configuración.
  • Habilita los siguientes privilegios en la cuenta de administrador: Administrar etiquetas de clasificación, Administrar regla de DLP y Ver regla de DLP.

Crear un modelo

Para crear un modelo, primero debes seleccionar una etiqueta de clasificación existente o crear una nueva. A continuación, debes crear una etiqueta de entrenamiento coincidente, ya sea de forma automática (recomendado) o manual con el administrador de etiquetas, que usarán los etiquetadores designados.

Elige o crea una etiqueta de clasificación

Tu clasificación debe estar habilitada para Drive y Documentos. Después del entrenamiento, el modelo de IA aplica automáticamente tu etiqueta de clasificación a los archivos sensibles de Drive. El modelo se entrena con solo un campo por etiqueta, que debe ser una lista de insignias o una lista de opciones.

Recomendamos una etiqueta de sensibilidad con insignia, ya que se muestra de forma destacada en los documentos:

Cuando uses un campo de lista de opciones o de lista de insignias para una etiqueta de clasificación, debe cumplir con los siguientes requisitos:

  • Tener al menos 2 y no más de 7 opciones
  • Se publicará

Si tienes una etiqueta existente que cumple con estos requisitos, puedes usarla como etiqueta de clasificación. De lo contrario, usa el administrador de etiquetas para crear una etiqueta, ya sea antes de configurar el modelo o durante la configuración (más adelante en esta página). Si deseas obtener más detalles, consulta Crea etiquetas de clasificación para tu organización.

Crea una etiqueta de entrenamiento

Tu etiqueta de entrenamiento es casi idéntica a la etiqueta de clasificación y los etiquetadores designados la usan solo con fines de entrenamiento. Cuando crees tu modelo (más adelante en esta página), podrás crear automáticamente la etiqueta de entrenamiento para asegurarte de que coincida con la etiqueta de clasificación.

También puedes crear tu propia etiqueta de entrenamiento de forma manual con el administrador de etiquetas, ya sea antes de configurar el modelo o durante la configuración. Para obtener más información, consulta ¿Cómo creo manualmente etiquetas de entrenamiento? más adelante en la página.

Crea el modelo

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Crear modelo.
  3. En la lista Etiqueta de clasificación, selecciona una etiqueta de clasificación y un campo existentes para entrenar un modelo, o bien haz clic en Crear etiqueta para crear uno con el administrador de etiquetas.

    Si creaste una etiqueta en el Administrador de etiquetas, vuelve a la página Crear modelo. Es posible que debas actualizar la página para ver la etiqueta nueva en la lista.

  4. Para la etiqueta de clasificación, selecciona el campo apto que deseas usar en la lista Nombre del campo.
  5. Haz clic en Continuar.
  6. (Opcional) Crea y publica automáticamente una etiqueta de entrenamiento que coincida con tu etiqueta de clasificación:
    1. Haz clic en Crear etiqueta de entrenamiento.
    2. Haz clic en Actualizar permisos de la etiqueta en el mensaje que aparece. La etiqueta se abre en modo de edición en el Administrador de etiquetas en una pestaña aparte.
    3. Haz clic en Permisosy luegoEditar y, luego, otorga el permiso Puede aplicar etiquetas y establecer valores al grupo de configuración que contiene a tus etiquetadores.
    4. Haz clic en Guardar y cierra la pestaña del administrador de etiquetas.

      Nota: También puedes establecer permisos de etiquetas más adelante. Sin embargo, es importante que solo tus etiquetadores tengan acceso a la etiqueta de entrenamiento.

  7. (Opcional) Si ya creaste una etiqueta de entrenamiento, selecciónala en la lista Etiqueta de entrenamiento.
  8. (Opcional) Haz clic en Ir al administrador de etiquetas para crear tu propia etiqueta de entrenamiento ahora.

    Importante: Asegúrate de que tu etiqueta cumpla con los criterios de las etiquetas de entrenamiento y de que configures los permisos de la etiqueta para que solo tus etiquetadores puedan acceder a ella. Para obtener más información, consulta los lineamientos de las etiquetas de entrenamiento más adelante en la página.

    Vuelve a la página Crear modelo. Es posible que debas actualizar la página para ver la nueva etiqueta de entrenamiento en la lista.

  9. En la página Crear modelo, haz clic en Continuar.
  10. Ingresa un nombre descriptivo para el modelo.
  11. Haz clic en Crear modelo.

Después de crear el modelo, en la página Detalles del modelo, se muestran la etiqueta de entrenamiento y la etiqueta de clasificación seleccionadas.

Entrena el modelo

Para entrenar el modelo de IA, debes crear un conjunto de datos de entrenamiento y, luego, iniciar su ejecución de entrenamiento inicial. Durante una ejecución de entrenamiento, el modelo aprende de los ejemplos del conjunto de datos.

El reentrenamiento es automático: Después de la ejecución del entrenamiento inicial, tu modelo se reentrena cada 2 semanas para ayudar a mejorar o mantener su nivel de precisión. Puedes volver a entrenar tu modelo manualmente en cualquier momento. Después de cada ejecución de entrenamiento, se lanza un modelo nuevo y se restablece el programa de reentrenamiento automático de 2 semanas.

Crea un conjunto de datos de entrenamiento

Para crear un conjunto de datos de entrenamiento, los etiquetadores designados deben aplicar la etiqueta de entrenamiento a al menos 100 archivos por opción de etiqueta. Por ejemplo, si tu etiqueta tiene 3 opciones (por ejemplo, "Necesidad de saber", "Confidencial" y "Público"), necesitas al menos 300 archivos de entrenamiento. Sin embargo, es mejor tener más de 100 archivos por opción de etiqueta, ya que es probable que algunos archivos no sean aptos para el conjunto de datos de entrenamiento. Obtén más información para etiquetar ejemplos de alta calidad para el entrenamiento.

Nota: Tu conjunto de datos de entrenamiento puede tener un máximo de 1 millón de archivos.

Después de crear el modelo, este verifica automáticamente cuántos archivos se etiquetaron para el entrenamiento en un plazo de 24 horas. Después de eso, se verifica continuamente durante todo el día.

Para verificar cuántos archivos se etiquetaron, sigue estos pasos:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de la parte superior de la página, en Archivos de entrenamiento para el modelo activo, consulta la cantidad de archivos etiquetados.

Si tu modelo tiene suficientes archivos para el entrenamiento, aparecerá el mensaje Listo para el entrenamiento.

Iniciar una ejecución de entrenamiento

Por lo general, un entrenamiento tarda entre 4 y 6 horas, pero puede demorar más para conjuntos de datos más grandes. Es probable que tu modelo necesite varias ejecuciones de entrenamiento para aprender a etiquetar tus archivos con precisión.

Durante una ejecución de entrenamiento, el modelo compara la clasificación que selecciona para un archivo con la etiqueta de entrenamiento que se aplicó al archivo para generar puntuaciones. Para obtener más información, consulta Cómo se calculan las puntuaciones.

Después de ejecutar el entrenamiento, puedes verificar la exactitud del modelo.

Para iniciar una ejecución de entrenamiento, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de entrenamiento que se encuentra en la parte superior de la página, haz clic en Start a training run.

    Nota: Este botón solo está disponible si tus etiquetadores etiquetaron la cantidad mínima de archivos de entrenamiento.

Después del entrenamiento: Verifica las puntuaciones del modelo

Después de una ejecución de entrenamiento, se lanza tu modelo con puntuaciones de porcentaje para cada opción de etiqueta. Cada puntuación, denominada puntuación de recuperación, es el porcentaje de ejemplos de entrenamiento que el modelo clasificó correctamente después de evaluarse a sí mismo:

  • Inferior al 50%: Precisión baja. El modelo necesita mejores datos y aún no está listo.
  • Del 50% al 80%: Precisión media. Es posible que el modelo esté listo de forma limitada.
  • Superior al 80%: Precisión alta El modelo está listo para clasificar archivos en tu organización.

Para verificar la exactitud de tu modelo después de una ejecución de entrenamiento, sigue estos pasos:

En la página Detalles del modelo, puedes ver las puntuaciones del modelo:

  • En el panel de resultados del entrenamiento que se encuentra en la parte superior de la página, en Archivos actuales usados y puntuaciones
  • En el panel Conjunto de datos de entrenamiento actual

Activa la clasificación de IA

Después de que el modelo de IA se entrena para alcanzar un nivel mínimo de precisión (al menos el 50%), puedes elegir opciones de etiquetas y activar el etiquetado automático de archivos o la aplicación automática. Sin embargo, para obtener los mejores resultados, se recomienda que esperes a que las puntuaciones del modelo para todas las opciones de etiquetas alcancen al menos el 80%.

Cómo activar la aplicación automática

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el panel de entrenamiento, haz clic en Configurar la aplicación automática.

    Nota: Este botón solo está disponible si al menos 1 opción de etiqueta alcanzó el 50% de precisión.

    O bien, si ya configuraste la aplicación automática, en Archivos etiquetados con IA, haz clic en Editar la aplicación automática.

  5. Marca las casillas de las opciones de etiquetas que quieres que el modelo de IA aplique automáticamente.
  6. Haz clic en Guardar y continuar para seleccionar qué unidades organizativas o grupos son propietarios de los archivos en los que el modelo debe aplicar etiquetas automáticamente. El parámetro de configuración predeterminado es tu organización principal de nivel superior.

    También puedes hacer clic en Guardar para seleccionar usuarios más adelante.

  7. Si elegiste seleccionar usuarios, en el costado, selecciona una unidad organizativa o un grupo de configuración.

    La configuración de los grupos anula la de las unidades organizativas. Más información

  8. Haz clic en Activada: La etiqueta se aplica automáticamente con una de las siguientes opciones.
  9. Haz clic en Guardar.

    En la página Detalles del modelo, el Estado actual de la aplicación automática de la regla es Activado.

Nota: Puedes supervisar la clasificación basada en IA con el registro de eventos de Drive. Para obtener más información, consulta Cómo supervisar eventos de etiquetas de clasificación basadas en IA más adelante en esta página.

Cuando la clasificación por IA analiza archivos

Después de que se activa la aplicación automática para los archivos propiedad de los usuarios y las unidades compartidas, la clasificación basada en IA analiza sus archivos (en reposo) al menos una vez en un plazo de 1 a 2 semanas. La clasificación por IA también analiza los archivos cada vez que se suben o modifican, y puede cambiar la etiqueta aplicada si cambia el contenido del archivo.

Cómo se manejan los conflictos de la aplicación automática

Reglas de protección de datos

Los valores de etiquetas establecidos por las reglas de protección de datos tienen prioridad sobre la clasificación de IA, y ambos tienen prioridad sobre la clasificación predeterminada.

Varias reglas

Cuando 2 o más reglas del mismo tipo intentan aplicar diferentes opciones de etiquetas al mismo archivo, se aplica la opción que se encuentra más arriba en la lista de opciones de la etiqueta. Por ejemplo, es posible que tengas una etiqueta con un campo que tenga 3 opciones en el administrador de etiquetas:

  1. Confidencial
  2. Interno
  3. Público

Si la regla 1 intenta establecer la etiqueta como Confidencial y la regla 2 intenta establecer la etiqueta como Público para el mismo archivo, se aplicará Confidencial. Antes de configurar reglas, asegúrate de que las opciones de campo de una etiqueta aparezcan en el orden de prioridad que prefieras.

Etiquetas aplicadas por el usuario

Las etiquetas que los usuarios aplican a los archivos tienen prioridad sobre las etiquetas aplicadas por la IA, es decir, la clasificación de la IA no modifica una etiqueta que un usuario haya establecido anteriormente.

Supervisa tu modelo

Obtén detalles sobre cómo la clasificación basada en IA etiqueta archivos en el registro de eventos de Drive. Para cada opción de etiqueta, el registro muestra cuántos archivos se clasificaron con la aplicación automática y cuántos usuarios aceptaron la etiqueta aplicada automáticamente o la modificaron. Los usuarios necesitan permisos para realizar acciones en las etiquetas aplicadas automáticamente.

Permisos que necesitan los usuarios para interactuar con las etiquetas aplicadas automáticamente

Los usuarios necesitan permisos de archivo y etiqueta para interactuar con las etiquetas aplicadas automáticamente. Puedes establecer permisos para tu etiqueta de clasificación en el Administrador de etiquetas. Para obtener más información, consulta Crea etiquetas de clasificación para tu organización.

  • Para ver las etiquetas aplicadas automáticamente, los usuarios necesitan el permiso Puede ver esta etiqueta para tu etiqueta de clasificación.
  • Para aceptar y modificar las etiquetas aplicadas automáticamente, los usuarios deben tener el permiso Can apply labels and set values para tu etiqueta de clasificación y ser Editor o Owner del archivo.

Cómo ver los eventos de clasificación por IA en el registro de eventos de Drive

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Archivos etiquetados por IA, selecciona Ver archivos para la opción de etiqueta para la que deseas ver eventos.

    La herramienta de investigación de seguridad se abre en una pestaña nueva y muestra los resultados de la búsqueda en el registro de eventos de Drive para dos eventos relacionados con la clasificación basada en IA: Se aplicó la etiqueta y Se cambió el valor del campo de etiqueta.

  4. Haz clic en la Descripción del evento para obtener detalles adicionales, como los siguientes:
    • Nombre y tipo del documento etiquetado
    • Valor del campo de etiqueta asignado al documento (por ejemplo, Confidencial o Restringido)

Administra el modelo.

Cómo desactivar la aplicación automática de una etiqueta de clasificación

Para desactivar la aplicación automática de todas las opciones de etiquetas o solo de algunas, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En Archivos etiquetados por IA, haz clic en Editar aplicación automática.
  5. Desmarca las casillas de las opciones de etiquetas para las que deseas desactivar la aplicación automática.

    También puedes desmarcar todas las opciones para pausar por completo la aplicación automática.

Para desactivar por completo la aplicación automática en unidades organizativas o grupos específicos, haz lo siguiente:

Puedes desactivar por completo la aplicación automática para el contenido que pertenece a los usuarios de unidades organizativas o grupos específicos.

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En el menú Más acciones, ubicado en la parte superior de la página, haz clic en Administrar la aplicación automáticay luegoActualizar las UO o los grupos habilitados.
  5. Haz clic en una unidad organizativa o un grupo a la izquierda para seleccionarlo.
  6. Selecciona Desactivada: La etiqueta no se aplica automáticamente.
  7. Haz clic en Guardar.

Borra un modelo

Es posible que debas borrar un modelo, por ejemplo, porque no mejora su precisión. Si borras un modelo, se quitarán de forma permanente todos sus parámetros de configuración de clasificación por IA. Nota:

  • Las etiquetas que se usan solo en este modelo se quitan de la configuración de clasificación y se borran todas las versiones del modelo.
  • Las etiquetas de entrenamiento permanecerán en los archivos. Después de borrar el modelo, puedes configurar uno nuevo para usar la misma etiqueta de entrenamiento (o una diferente).
  • Se detendrán de inmediato todas las aplicaciones automáticas de etiquetado que hayas activado para este modelo, pero permanecerán en los archivos las etiquetas que se hayan aplicado automáticamente.
  • Los resultados del modelo serán similares si vuelves a entrenar tu etiqueta de entrenamiento y los archivos de entrenamiento existentes.
  • Si vuelves a crear la misma etiqueta de clasificación para un modelo nuevo, la función de clasificación por IA ignorará y sobrescribirá las clasificaciones de los modelos anteriores. De esta manera, puedes "volver a procesar" los archivos de Drive de tu organización. Esto puede ser útil si realizaste mejoras significativas en la calidad del modelo desde tu implementación inicial.

Para borrar un modelo, haz lo siguiente:

  1. En la Consola del administrador de Google, ve a Menú y luego Seguridady luegoControl de acceso y datosy luegoClasificación de datos.

    Es necesario tener el privilegio de administrador de Administrar etiquetas de clasificación.

  2. En la sección Clasificación por IA, haz clic en Ver modelos de nn.
  3. En la página Detalles del modelo, en Acciones para el modelo, selecciona Ver detalles.
  4. En la página Detalles del modelo, en Acciones a la derecha, haz clic en Borrar modelo.

    En el diálogo Borrar modelo, se enumeran los efectos de borrar el modelo.

  5. Para continuar, haz clic en Borrar modelo.

Preguntas frecuentes

Etiquetas de entrenamiento y clasificación

¿Cuáles son los requisitos para las etiquetas de entrenamiento y clasificación?

Tanto la etiqueta de clasificación como la etiqueta de entrenamiento deben cumplir con los siguientes criterios:

  • Debe contener un mínimo de 2 y un máximo de 7 opciones.
  • Deben tener las opciones en el mismo orden.

    Por ejemplo, si la etiqueta de clasificación tiene opciones en este orden:

    1. Opción 1
    2. Opción 2
    3. Opción 3

    Las opciones de etiquetas de entrenamiento no se pueden ordenar de la siguiente manera:

    1. Opción 2
    2. Opción 1
    3. Opción 3
  • Debe estar publicado.
  • Tener etiquetas con diferentes permisos de acceso La etiqueta de entrenamiento solo debe estar disponible para los etiquetadores designados que pueden entrenar el modelo. La etiqueta de clasificación puede tener un acceso más amplio.

¿Cómo creo manualmente una etiqueta de entrenamiento?

Si bien se recomienda crear la etiqueta de entrenamiento automáticamente cuando configures tu modelo, puedes crear una manualmente en el administrador de etiquetas siguiendo estos lineamientos:
  • Asegúrate de que la etiqueta cumpla con los criterios de etiquetado obligatorios.
  • Identifica la etiqueta de entrenamiento con la palabra "entrenamiento" para que los etiquetadores designados puedan reconocerla y aplicarla con mayor facilidad cuando crees tu conjunto de datos de entrenamiento.
  • Agrega un campo de descripción a la etiqueta de entrenamiento para ayudar aún más a los etiquetadores designados a comprender su propósito.
  • Asegúrate de establecer los permisos de la etiqueta en solo tus etiquetadores designados, es decir, aquellos que identificarán los archivos para el entrenamiento del modelo, con el grupo de configuración que creaste para los etiquetadores. Los etiquetadores necesitan el permiso Puede aplicar etiquetas y establecer valores. Si deseas obtener más detalles, consulta Crea etiquetas de clasificación para tu organización.

¿Puedo usar la etiqueta de clasificación como etiqueta de entrenamiento?

No, la etiqueta de clasificación y la etiqueta de entrenamiento deben ser diferentes. La etiqueta que elijas como etiqueta de clasificación no está disponible para la etiqueta de entrenamiento.

Entrenamiento de conjuntos de datos

¿Qué archivos son adecuados para entrenar el modelo?

Para obtener los mejores resultados en el entrenamiento del modelo, haz que los etiquetadores designados sigan estos lineamientos:

  • Asegúrate de que cada archivo tenga un mínimo de 500 caracteres.
  • Selecciona archivos que representen el contenido que los usuarios crean, comparten y usan en tu organización.
  • Etiqueta aproximadamente la misma cantidad de archivos por opción de etiqueta, con un mínimo de 100 archivos para cada opción. Esto ayuda al modelo a obtener una comprensión integral de tus datos y a mejorar las puntuaciones.
  • Incluye una variedad representativa de archivos para cada tipo de opción. Por ejemplo, no etiquetes 100 currículums como tu conjunto total de archivos de ejemplo para Top Secret si los contratos también son un tipo de archivo común de Top Secret en tu organización.
  • Aplica la etiqueta de entrenamiento solo a los archivos que pertenecen a tu organización, ya sea que sean propiedad directa de los usuarios o que estén almacenados en unidades compartidas. La clasificación basada en IA no procesa los archivos que pertenecen a usuarios externos ni los que se encuentran en unidades compartidas externas.

¿Se puede entrenar el modelo con archivos etiquetados previamente?

Por el momento, no es posible entrenar el modelo con archivos etiquetados anteriormente. Un modelo requiere que una etiqueta de entrenamiento sea una réplica de la etiqueta que aplicará automáticamente a los archivos, pero no pueden ser la misma etiqueta.

¿El modelo se puede entrenar en varios idiomas?

El modelo admite varios idiomas. Sin embargo, se debe incluir una muestra representativa de archivos para cada tipo de opción y cada idioma en los datos de entrenamiento. Esto aumenta la cantidad de archivos necesarios para entrenar el modelo correctamente. Solo se admiten los idiomas basados en caracteres latinos.

¿Cómo se calculan las puntuaciones durante el entrenamiento?

Durante el entrenamiento, el modelo de IA usa el 75% de los datos de entrada para entrenarse sobre cómo etiquetar archivos y reserva el 25% para probar periódicamente su propio rendimiento. En otras palabras, para el 25% de los archivos etiquetados, el modelo los analiza como si no supiera qué etiqueta se aplicó. Luego, el modelo de IA toma su propia decisión sobre la etiqueta y la compara con la etiqueta real que aplicó la persona designada. Las puntuaciones muestran qué proporción de los archivos reservados se etiquetó correctamente.

Una vez que entreno un modelo, ¿puedo "congelarlo" para que deje de reentrenarse automáticamente?

Los modelos de clasificación de IA se entrenan con archivos de Drive. Cuando se borran esos archivos (a menudo, según los programas de retención a través de Google Vault), también se debe borrar el modelo posteriormente para garantizar que el contenido de los archivos no persista de alguna manera. Por este motivo, el reentrenamiento del modelo se realiza en un bucle continuo y no se puede suspender.

¿Los usuarios pueden cambiar o corregir las etiquetas y los valores de campo?

Los usuarios con permiso pueden actualizar una etiqueta o un valor de campo, pero la clasificación de IA no revisa el modelo de clasificación en función de ese cambio. Si observas que el modelo aplicó etiquetas y valores de campo de forma incorrecta, puedes pedirles a los etiquetadores designados que asignen la etiqueta de entrenamiento correcta a los archivos. Luego, la clasificación por IA incorpora estos datos en el siguiente ciclo de autoentrenamiento del modelo.

Aplicación automática

¿Puede la clasificación con IA evaluar imágenes, videos y archivos de audio?

La clasificación basada en IA utiliza el mismo procesamiento de texto indexable que la DLP de Drive. Cualquier archivo del que Drive pueda extraer texto indexable se puede evaluar para determinar si se le aplicaron etiquetas de clasificación basada en IA. Esto incluye el reconocimiento óptico de caracteres (OCR) para extraer texto de imágenes. Sin embargo, la clasificación por IA no evalúa los archivos de audio o video.

¿La clasificación por IA funciona solo para etiquetar contenido sensible?

La clasificación basada en IA se enfoca principalmente en el contenido sensible, pero se puede entrenar cualquier etiqueta con hasta 4 opciones para el etiquetado automático. Las etiquetas de clasificación también se usan para la auditoría, la capacidad de búsqueda y la administración de la retención.

¿Funciona la clasificación basada en IA cuando la encriptación del cliente (CSE) está activada?

Debido a que Google no puede desencriptar los archivos encriptados con CSE (solo tu clave de encriptación privada puede hacerlo), la clasificación basada en IA no puede entrenarse con archivos encriptados con CSE ni aplicar etiquetas automáticamente a estos archivos.

¿Cómo y cuándo revisa la clasificación basada en IA las etiquetas aplicadas automáticamente?

Después de activar la aplicación automática, la clasificación basada en IA analiza y clasifica todos los archivos inactivos de los que puede extraer suficiente texto. Estos archivos se analizan al menos una vez.

La clasificación por IA vuelve a procesar los archivos periódicamente a medida que se modifica el contenido. Los cambios en el contenido pueden generar una predicción diferente para un archivo. Cuando la clasificación por IA tenga una opción predicha antigua y una nueva para un archivo, preferirá la opción que esté más arriba en la lista de opciones. Por ejemplo, si un campo tiene tres opciones que se muestran en el administrador de etiquetas:

  • Confidencial
  • Interno
  • Público

Supongamos que la clasificación basada en IA clasifica un archivo como Interno y el contenido cambia de modo que el modelo de clasificación basada en IA predice Confidencial. En este caso, la clasificación del archivo cambia a Confidencial. Sin embargo, si el modelo de clasificación basado en IA predice Público, la clasificación del archivo seguirá siendo Interno.

La clasificación basada en IA no revisa las etiquetas aplicadas automáticamente ni los valores de campo que los usuarios revisaron o modificaron.

Si el modelo cambia, ¿reevalúa automáticamente los archivos existentes?

Tus archivos se procesan con el modelo más reciente cuando se crean o modifican. Los archivos existentes no se vuelven a procesar automáticamente cuando se lanza una nueva versión del modelo. Sin embargo, es posible que el modelo vuelva a procesar periódicamente todos tus archivos con la versión más reciente, independientemente de las actualizaciones o el reentrenamiento específicos del modelo.

¿La clasificación por IA tiene prioridad sobre otros métodos de clasificación cuando hay varios activos?

Se puede anular la clasificación de datos. La clasificación de datos se realiza en el siguiente orden:
  1. Regla de DLP sin anulación del usuario
  2. Clasificación manual
  3. Regla de DLP con anulación del usuario
  4. Clasificación por IA
  5. Clasificación predeterminada
Quitar una etiqueta o un campo permite que entre en vigencia un mecanismo de clasificación de nivel inferior. Por ejemplo, un archivo al que un usuario le quitó una etiqueta puede tener la misma etiqueta aplicada automáticamente por la clasificación basada en IA más adelante.

¿A qué tipos de archivos puede aplicar etiquetas la clasificación basada en IA?

  • La clasificación basada en IA utiliza el mismo procesamiento de texto indexable que la DLP de Drive. Para obtener más detalles, consulta la lista de tipos de archivos que analiza la DLP. No se admiten archivos de audio ni video.
  • Un archivo debe tener una cantidad mínima de texto para que la clasificación por IA aplique una etiqueta. Como resultado, es posible que no se clasifiquen algunos archivos, como documentos muy cortos e imágenes con pequeñas cantidades de texto.

¿Qué sucede cuando se inhabilita una opción para la aplicación automática?

Durante el análisis, si se predice que un archivo tiene una opción para la que está inhabilitada la aplicación automática, la clasificación de IA no aplica ninguna etiqueta ni valor de campo al archivo.

Los archivos que la clasificación de IA etiquetó previamente conservan los valores de las etiquetas y las opciones aplicadas, incluso después de que se inhabilita la opción.

¿Puedo revertir las etiquetas aplicadas automáticamente?

No puedes deshacer la aplicación de etiquetas. Te recomendamos que definas y pruebes tus modelos con un público pequeño antes de realizar una implementación a gran escala. Por ejemplo, puedes entrenar tus modelos con una etiqueta temporal. Luego, una vez que el rendimiento del modelo sea satisfactorio, puedes "restablecer" el modelo borrándolo y creando uno nuevo con la misma etiqueta de entrenamiento (el mismo conjunto de datos de entrenamiento), pero con tu etiqueta permanente.

Licencias

¿Cómo funciona la función para los usuarios sin una licencia apta?

Si un administrador de tu organización tiene una licencia que admite la clasificación basada en IA, puede entrenar un modelo. Los etiquetadores designados (los usuarios que aplican la etiqueta de entrenamiento) no necesitan tener una licencia con clasificación de IA.

Los archivos con la etiqueta de entrenamiento pueden ser propiedad de cualquier usuario con una licencia que admita las etiquetas de clasificación de Drive. Sin embargo, la clasificación por IA solo etiqueta los archivos que se encuentran en unidades compartidas o que pertenecen a usuarios con licencias que admiten la clasificación por IA. La clasificación por IA no procesa los archivos que pertenecen a usuarios sin una licencia compatible.

Si ningún usuario tiene una licencia que admita la clasificación basada en IA, se desactivará la aplicación automática y se borrará el modelo de clasificación. Sin embargo, las etiquetas de entrenamiento y las etiquetas aplicadas por la clasificación de IA persisten en los archivos.

¿Cómo funciona la función para los usuarios archivados?

Los archivos de los usuarios con una licencia de Usuario Archivado de Google Workspace Enterprise Plus se etiquetarán con la clasificación basada en IA.

Primeros pasos como administrador de etiquetas de Drive