Google Drive-Dateien automatisch mithilfe der KI-Klassifizierung labeln

Diese Funktion ist in Frontline Plus und Enterprise Plus enthalten. Es ist auch in den Add‑onsGemini Enterprise–Legacy, Gemini Education Premium und AI Security enthalten. Add‑ons vergleichen

Mit der KI-basierten Klassifizierung können sensible Inhalte Ihrer Organisation in Google Drive automatisch mit Labels versehen werden. Dazu werden benutzerdefinierte KI-Modelle verwendet, die von Ihrer Organisation trainiert werden. Programmierung ist nicht erforderlich. Als Administrator können Sie festlegen, mit welchen Daten Ihre Modelle trainiert werden. Jedes Modell ist also einzigartig und kann nur von Ihrer Organisation verwendet werden. Sie können bis zu fünf eindeutige KI-Klassifizierungsmodelle für Ihre Organisation erstellen.

Sie können Ihre KI-klassifizierten Dateien in Sicherheitsrichtlinien wie Datenschutzregeln und Vault verwenden.

Hinweis:Damit Dateien durch die KI-Klassifizierung gelabelt werden können, müssen sie sich in geteilten Ablagen befinden oder Nutzern mit Lizenzen gehören, die Klassifizierungslabels unterstützen.

KI‑basierte Klassifizierung – Übersicht

Das sind die grundlegenden Schritte, die Sie ausführen müssen, um die KI-basierte Klassifizierung einzurichten, damit neue und vorhandene Dateien in Drive automatisch mit Labels versehen werden.

1. Modell erstellen:Wählen Sie zuerst ein Klassifizierungslabel aus oder erstellen Sie eines. Das KI‑Modell wendet es nach dem Training automatisch auf Dateien an. Sie erstellen auch das Trainingslabel, mit dem das Modell trainiert wird, um die vertraulichen Inhalte Ihrer Organisation zu identifizieren. Anschließend erstellen Sie ein KI-Modell, um diese Labels zu verwenden.

2. Modell trainieren:Nachdem Sie Ihre Labels erstellt haben, klassifizieren zuständige Labelersteller Drive-Dateien mit dem Trainingslabel, um Ihr Trainingsdataset zu erstellen. Ihr Modell verwendet dann das Dataset, um zu lernen, wie sensible Dateien klassifiziert werden.

3. KI-Klassifizierung aktivieren:Sobald das Modell trainiert ist, können Sie die automatische Dateilabelerstellung einrichten, die als automatische Anwendung bezeichnet wird. Bei der Einrichtung wählen Sie aus, welche Labeloptionen aktiviert werden sollen und welche Nutzer die Dateien besitzen, auf die die KI‑basierte Klassifizierung Labels anwenden soll. Ihr Modell beginnt dann, sensible Dateien automatisch zu labeln.

4. Modell im Blick behalten:Im Drive-Ereignisprotokoll können Sie nachvollziehen, wie viele Dateien klassifiziert wurden und wie viele Nutzer ein automatisch angewendetes Label akzeptiert oder geändert haben (sofern sie die Berechtigung dazu haben).

Hinweis

  • Informationen zur Funktionsweise von Klassifizierungslabels und zum Erstellen von Klassifizierungslabels Weitere Informationen finden Sie unter Erste Schritte als Administrator von Klassifizierungslabels.
  • Zuständige Labelersteller auswählen: Das ist eine Gruppe von Nutzern in Ihrer Organisation, die das Trainingslabel manuell auf sensible Dateien anwenden können.
  • Erstellen Sie eine Konfigurationsgruppe nur für die zuständigen Labelersteller. Eine Anleitung finden Sie im Hilfeartikel Diensteinstellungen mit Konfigurationsgruppen anpassen.
  • Aktivieren Sie die folgenden Berechtigungen im Administratorkonto: „Klassifizierungslabels verwalten“, „DLP-Regel verwalten“ und „DLP-Regel ansehen“.

Modell erstellen

Wenn Sie ein Modell erstellen möchten, müssen Sie zuerst ein vorhandenes Klassifizierungslabel auswählen oder ein neues erstellen. Als Nächstes müssen Sie ein entsprechendes Trainingslabel erstellen, das entweder automatisch (empfohlen) oder manuell über den Label-Manager erstellt wird und von den zugewiesenen Labelern verwendet wird.

Klassifizierungslabel auswählen oder erstellen

Die Klassifizierung muss für Drive und Docs aktiviert sein. Nach dem Training wendet das KI-Modell Ihr Klassifizierungslabel automatisch auf vertrauliche Drive-Dateien an. Das Modell wird nur mit einem Feld pro Label trainiert. Dieses Feld muss entweder eine Badge-Liste oder eine Optionsliste sein.

Wir empfehlen ein Badge-Label für die Vertraulichkeit, da es bei Dokumenten gut sichtbar angezeigt wird:

Wenn Sie ein Feld vom Typ „Optionsliste“ oder „Badge“ für ein Klassifizierungslabel verwenden, muss es die folgenden Anforderungen erfüllen:

  • Muss mindestens 2 und darf höchstens 7 Optionen enthalten
  • Veröffentlicht sein

Wenn Sie bereits ein Label haben, das diese Anforderungen erfüllt, können Sie es als Klassifizierungslabel verwenden. Andernfalls können Sie mit dem Label-Manager ein Label erstellen, entweder vor oder während der Einrichtung des Modells (siehe unten auf dieser Seite). Weitere Informationen finden Sie im Hilfeartikel Klassifizierungslabels für Ihre Organisation erstellen.

Trainingslabel erstellen

Ihr Trainingslabel ist fast identisch mit dem Klassifizierungslabel und wird nur zu Trainingszwecken von zuständigen Labelanwendern verwendet. Wenn Sie Ihr Modell erstellen (siehe unten auf dieser Seite), können Sie das Trainingslabel automatisch erstellen lassen, damit es mit dem Klassifizierungslabel übereinstimmt.

Sie können auch manuell ein eigenes Trainingslabel mit dem Label-Manager erstellen, entweder vor oder während der Einrichtung des Modells. Weitere Informationen finden Sie weiter unten im Abschnitt Wie erstelle ich Trainingslabels manuell?.

Modell erstellen

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-basierte Klassifizierung auf Modell erstellen.
  3. Wählen Sie in der Liste Klassifizierungslabel ein vorhandenes Klassifizierungslabel und Feld aus, für das ein Modell trainiert werden soll, oder klicken Sie auf Label erstellen, um ein Label mit der Labelverwaltung zu erstellen.

    Wenn Sie ein Label im Label Manager erstellt haben, kehren Sie zur Seite Modell erstellen zurück. Möglicherweise müssen Sie die Seite aktualisieren, damit das neue Label in der Liste angezeigt wird.

  4. Wählen Sie in der Liste Feldname das infrage kommende Feld aus, das Sie für Ihr Klassifizierungslabel verwenden möchten.
  5. Klicken Sie auf Weiter.
  6. Optional: Trainingslabel, das mit Ihrem Klassifizierungslabel übereinstimmt, automatisch erstellen und veröffentlichen:
    1. Klicken Sie auf Trainingslabel erstellen.
    2. Klicken Sie in der angezeigten Meldung auf Labelberechtigungen aktualisieren. Das Label wird im Label Manager in einem separaten Tab im Bearbeitungsmodus geöffnet.
    3. Klicken Sie auf Berechtigungenund dannBearbeiten und gewähren Sie dann der Konfigurationsgruppe, die Ihre Labelersteller enthält, die Berechtigung Darf Labels anwenden und Werte festlegen.
    4. Klicken Sie auf Speichern und schließen Sie den Tab „Label-Verwaltung“.

      Hinweis:Sie können Labelberechtigungen auch später festlegen. Es ist jedoch wichtig, dass nur Ihre Labelersteller Zugriff auf das Trainingslabel haben.

  7. Optional: Wenn Sie bereits ein Trainingslabel erstellt haben, wählen Sie es in der Liste Trainingslabel aus.
  8. Optional: Sie können jetzt ein eigenes Trainingslabel erstellen, indem Sie auf Zum Label-Manager klicken.

    Wichtig:Achten Sie darauf, dass Ihr Label den Kriterien für Trainingslabels entspricht und Sie die Labelberechtigungen so festlegen, dass nur Ihre Labelersteller darauf zugreifen können. Weitere Informationen finden Sie weiter unten auf dieser Seite unter Richtlinien für Trainingslabels.

    Kehren Sie zur Seite Modell erstellen zurück. Möglicherweise müssen Sie die Seite aktualisieren, um das neue Trainingslabel in der Liste zu sehen.

  9. Klicken Sie auf der Seite Modell erstellen auf Weiter.
  10. Geben Sie einen aussagekräftigen Namen für das Modell ein.
  11. Klicken Sie auf Modell erstellen.

Nachdem Sie Ihr Modell erstellt haben, werden auf der Seite Modelldetails das ausgewählte Trainingslabel und das Klassifizierungslabel angezeigt.

Modell trainieren

Um das KI-Modell zu trainieren, müssen Sie ein Trainingsdataset erstellen und dann den ersten Trainingslauf starten. Während eines Trainingslaufs lernt das Modell aus den Beispielen im Dataset.

Automatisches erneutes Training:Nach dem ersten Trainingsdurchlauf wird Ihr Modell alle zwei Wochen neu trainiert, um die Genauigkeit zu verbessern oder beizubehalten. Sie können Ihr Modell auch jederzeit manuell neu trainieren. Nach jedem Trainingsdurchlauf wird ein neues Modell veröffentlicht und der Zeitraum für das automatische erneute Training nach zwei Wochen beginnt von Neuem.

Trainings-Dataset erstellen

Damit ein Trainingsdataset erstellt werden kann, müssen die zuständigen Labelersteller das Trainingslabel auf mindestens 100 Dateien pro Labeloption anwenden. Wenn Ihr Label beispielsweise drei Optionen hat, z. B. „Zwingend erforderlich“, „Vertraulich“ und „Öffentlich“, benötigen Sie mindestens 300 Trainingsdateien. Es ist jedoch besser, mehr als 100 Dateien pro Labeloption zu haben, da einige Dateien wahrscheinlich nicht für das Trainings-Dataset infrage kommen. Weitere Informationen zum Labeln von hochwertigen Beispielen für das Training

Hinweis:Ihr Trainings-Dataset darf maximal 1 Million Dateien enthalten.

Nachdem Sie das Modell erstellt haben, wird innerhalb von etwa 24 Stunden automatisch geprüft, wie viele Dateien für das Training mit einem Label versehen wurden. Danach wird den ganzen Tag über kontinuierlich geprüft.

So prüfen Sie, wie viele Dateien mit einem Label versehen wurden:

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie unter Aktionen für das Modell die Option Details ansehen aus.
  4. Sehen Sie sich im Bereich oben auf der Seite unter Trainingsdateien für aktives Modell die Anzahl der Dateien mit Labels an.

Wenn Ihr Modell genügend Dateien für das Training hat, wird „Bereit für das Training“ angezeigt.

Trainingslauf starten

Ein Trainingslauf dauert in der Regel 4 bis 6 Stunden, kann bei größeren Datasets aber auch länger dauern. Für Ihr Modell sind wahrscheinlich mehrere Trainingsdurchläufe erforderlich, damit es Ihre Dateien korrekt labeln kann.

Während eines Trainingsdurchlaufs vergleicht das Modell die Klassifizierung, die es für eine Datei auswählt, mit dem auf die Datei angewendeten Trainingslabel, um Werte zu generieren. Weitere Informationen finden Sie im Hilfeartikel Wie werden die Punktzahlen berechnet?.

Nach einem Trainingslauf können Sie die Genauigkeit des Modells prüfen.

So starten Sie einen Trainingslauf:

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter Aktionen für das Modell die Option Details ansehen aus.
  4. Klicken Sie oben auf der Seite im Trainingsbereich auf Trainingseinheit starten.

    Hinweis:Diese Schaltfläche ist nur verfügbar, wenn die Mindestanzahl von Trainingsdateien mit Labels versehen wurde.

Nach dem Training: Modellbewertungen prüfen

Nach einem Trainingsdurchlauf wird Ihr Modell mit Prozentwerten für jede Labeloption veröffentlicht. Jeder Wert, der als Recall-Wert bezeichnet wird, ist der Prozentsatz der Trainingsbeispiele, die das Modell nach dem Test richtig klassifiziert hat:

  • Unter 50%: Geringe Genauigkeit. Das Modell benötigt bessere Daten und ist noch nicht bereit.
  • 50–80%: Mittlere Genauigkeit. Das Modell ist möglicherweise nur eingeschränkt verfügbar.
  • Über 80%: Hohe Genauigkeit. Das Modell kann jetzt Dateien für Ihre Organisation klassifizieren.

So prüfen Sie die Genauigkeit Ihres Modells nach einem Trainingslauf:

Auf der Seite Modelldetails können Sie Modellbewertungen ansehen:

  • Im Bereich mit den Trainingsergebnissen oben auf der Seite unter Aktuell einbezogene Dateien und Bewertungen
  • Im Bereich Aktuelles Trainings-Dataset

KI‑basierte Klassifizierung aktivieren

Nachdem das KI‑Modell trainiert wurde und ein Mindestmaß an Genauigkeit (mindestens 50%) erreicht hat, können Sie Labeloptionen auswählen und die automatische Dateilabelerstellung (automatische Anwendung) aktivieren. Für optimale Ergebnisse sollten Sie jedoch warten, bis die Modellbewertungen für alle Labeloptionen mindestens 80 % erreichen.

So aktivieren Sie die automatische Anwendung:

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter Aktionen für das Modell die Option Details ansehen aus.
  4. Klicken Sie im Trainingsbereich auf Automatische Anwendung einrichten.

    Hinweis:Diese Schaltfläche ist nur verfügbar, wenn mindestens eine Labeloption eine Genauigkeit von 50% erreicht hat.

    Wenn Sie die automatische Anwendung bereits eingerichtet haben, klicken Sie unter KI-labelte Dateien auf Automatische Anwendung bearbeiten.

  5. Setzen Sie ein Häkchen in die Kästchen neben den Labeloptionen, die automatisch vom KI‑Modell angewendet werden sollen.
  6. Klicken Sie auf Speichern und fortfahren, um auszuwählen, welche Organisationseinheiten oder Gruppen die Dateien besitzen, auf die das Modell automatisch Labels anwenden soll. Die Standardeinstellung ist Ihre übergeordnete Organisation auf oberster Ebene.

    Alternativ können Sie auf Speichern klicken, um Nutzer später auszuwählen.

  7. Wenn Sie Nutzer ausgewählt haben, wählen Sie an der Seite eine Organisationseinheit oder Konfigurationsgruppe aus.

    Gruppeneinstellungen überschreiben die Einstellungen von Organisationseinheiten. Weitere Informationen

  8. Klicken Sie auf An: Label wird mit einer der folgenden Optionen automatisch angewendet.
  9. Klicken Sie auf Speichern.

    Auf der Seite Modelldetails ist der Aktueller Status für die automatische Anwendung für die Regel auf Ein gesetzt.

Hinweis:Sie können die KI-Klassifizierung anhand des Drive-Ereignisprotokolls überwachen. Weitere Informationen finden Sie weiter unten auf dieser Seite unter Ereignisse beim Labeling mit KI-Klassifizierung beobachten.

Wann werden Dateien von der KI-Klassifizierung gescannt?

Nachdem die automatische Anwendung für Dateien aktiviert wurde, die Nutzern und geteilten Ablagen gehören, werden die Dateien (im Ruhezustand) mindestens einmal innerhalb von 1 bis 2 Wochen durch die KI-Klassifizierung gescannt. Bei der KI-Klassifizierung werden auch Dateien gescannt, wenn sie hochgeladen oder geändert werden. Das angewendete Label kann sich ändern, wenn sich der Inhalt der Datei ändert.

Umgang mit Konflikten bei der automatischen Anwendung

Datenschutzregeln

Labelwerte, die durch Datenschutzregeln festgelegt werden, haben Vorrang vor der KI-basierten Klassifizierung und beide haben Vorrang vor der Standardklassifizierung.

Mehrere Regeln

Wenn durch zwei oder mehr Regeln desselben Typs versucht wird, unterschiedliche Labeloptionen auf dieselbe Datei anzuwenden, wird die Option angewendet, die in der Optionsliste des Labels weiter oben steht. Beispiel: Sie haben ein Label mit einem Feld, das im Label Manager drei Optionen enthält:

  1. Vertraulich
  2. Intern
  3. Öffentlich

Wenn Regel 1 versucht, das Label als Vertraulich festzulegen, und Regel 2 versucht, das Label für dieselbe Datei auf Öffentlich zu setzen, wird Vertraulich angewendet. Achten Sie darauf, dass die Feldoptionen eines Labels in der gewünschten Prioritätsreihenfolge aufgeführt sind, bevor Sie Regeln einrichten.

Von Nutzern angewendete Labels

Labels, die Nutzer auf Dateien anwenden, haben Vorrang vor Labels, die von der KI angewendet werden. Das bedeutet, dass bei der KI-Klassifizierung ein Label, das ein Nutzer zuvor festgelegt hat, nicht geändert wird.

Modell überwachen

Im Drive-Ereignisprotokoll finden Sie Details dazu, wie Dateien durch die KI-Klassifizierung mit einem Label versehen werden. Für jede Labeloption wird im Protokoll angezeigt, wie viele Dateien mithilfe der automatischen Anwendung klassifiziert wurden und wie viele Nutzer das automatisch angewendete Label akzeptiert oder geändert haben. Nutzer benötigen Berechtigungen, um Aktionen für automatisch angewendete Labels auszuführen.

Berechtigungen, die Nutzer für die Interaktion mit automatisch angewendeten Labels benötigen

Nutzer benötigen Datei- und Labelberechtigungen, um mit automatisch angewendeten Labels interagieren zu können. Sie können Berechtigungen für Ihr Klassifizierungslabel im Label Manager festlegen. Weitere Informationen finden Sie unter Klassifizierungslabels für Ihre Organisation erstellen.

  • Um automatisch angewendete Labels zu sehen, benötigen Nutzer die Berechtigung Dieses Label ansehen für Ihr Klassifizierungslabel.
  • Wenn Nutzer automatisch angewendete Labels akzeptieren und ändern möchten, benötigen sie die Berechtigung Darf Labels anwenden und Werte festlegen für Ihr Klassifizierungslabel und müssen Bearbeiter oder Eigentümer der Datei sein.

Ereignisse zur KI‑basierten Klassifizierung im Drive-Ereignisprotokoll ansehen

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter KI-labelte Dateien für die Labeloption, für die Sie Ereignisse aufrufen möchten, die Option Dateien ansehen aus.

    Das Sicherheitsprüftool wird in einem neuen Tab geöffnet. Es enthält Suchergebnisse für das Drive-Ereignisprotokoll für zwei Ereignisse im Zusammenhang mit der KI-Klassifizierung: Label angewendet und Labelfeldwert geändert.

  4. Klicken Sie auf die Beschreibung des Ereignisses, um weitere Informationen zu erhalten, z. B.:
    • Name und Typ des Dokuments, das mit einem Label versehen wurde
    • Wert des Labelfelds, das dem Dokument zugewiesen ist (z. B. „Vertraulich“ oder „Eingeschränkt“)

Modell verwalten

Automatisches Anwenden eines Klassifizierungslabel deaktivieren

So deaktivieren Sie das automatische Anwenden für alle oder nur bestimmte Labeloptionen:

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter Aktionen für das Modell die Option Details ansehen aus.
  4. Klicken Sie unter KI-labelierte Dateien auf Automatische Anwendung bearbeiten.
  5. Entfernen Sie die Häkchen bei den Labeloptionen, für die Sie das automatische Anwenden deaktivieren möchten.

    Wenn Sie das automatische Anwenden vollständig pausieren möchten, entfernen Sie die Häkchen aus allen Kästchen.

So deaktivieren Sie die automatische Anwendung für bestimmte Organisationseinheiten oder Gruppen vollständig:

Sie können die automatische Anwendung für Inhalte, die Nutzern in bestimmten Organisationseinheiten oder Gruppen gehören, vollständig deaktivieren.

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter Aktionen für das Modell die Option Details ansehen aus.
  4. Klicken Sie oben auf der Seite im Menü Weitere Aktionen auf Automatisch anwenden verwaltenund dannAktivierte Organisationseinheiten/Gruppen aktualisieren.
  5. Klicken Sie links auf eine Organisationseinheit oder Gruppe, um sie auszuwählen.
  6. Wählen Sie Aus: Label wird nicht automatisch angewendet aus.
  7. Klicken Sie auf Speichern.

Modell löschen

Möglicherweise müssen Sie ein Modell löschen, z. B. weil sich die Modellgenauigkeit nicht verbessert. Wenn Sie ein Modell löschen, werden alle Einstellungen für die KI‑basierte Klassifizierung dauerhaft entfernt. Hinweis:

  • Labels, die nur in diesem Modell verwendet werden, werden aus den Klassifizierungseinstellungen entfernt und alle Versionen des Modells werden gelöscht.
  • Trainingslabels bleiben in den Dateien erhalten. Nachdem Sie das Modell gelöscht haben, können Sie ein neues Modell konfigurieren, das dasselbe Trainingslabel (oder ein anderes) verwendet.
  • Alle aktivierten automatischen Labelanwendungen für dieses Modell werden sofort beendet, zuvor automatisch angewendete Labels bleiben aber in den Dateien erhalten.
  • Die Modellergebnisse sind ähnlich, wenn Sie das Training mit dem vorhandenen Trainingslabel und den Trainingsdateien wiederholen.
  • Wenn Sie dasselbe Klassifizierungslabel für ein neues Modell erstellen, werden die Klassifizierungen vorheriger Modelle von der Funktion zur KI-Klassifizierung ignoriert und überschrieben. Auf diese Weise können Sie die Drive-Dateien Ihrer Organisation neu verarbeiten. Das kann nützlich sein, wenn Sie die Modellqualität seit der ersten Bereitstellung deutlich verbessert haben.

So löschen Sie ein Modell:

  1. Gehen Sie in der Admin-Konsole zum Dreistrich-Menü und dann Sicherheitund dannZugriffs- und Datenkontrolleund dannDatenklassifizierung.

    Hierfür ist die Administratorberechtigung Klassifizierungslabels verwalten erforderlich.

  2. Klicken Sie im Bereich KI-Klassifizierung auf nn-Modelle ansehen.
  3. Wählen Sie auf der Seite Modelldetails unter Aktionen für das Modell die Option Details ansehen aus.
  4. Klicken Sie auf der Seite „Modelldetails“ rechts neben Aktionen auf Modell löschen.

    Im Dialogfeld Modell löschen werden die Auswirkungen des Löschens des Modells aufgeführt.

  5. Klicken Sie auf Modell löschen, um fortzufahren.

FAQ

Trainings- und Klassifizierungslabels

Welche Anforderungen gelten für die Trainings- und Klassifizierungslabels?

Sowohl das Klassifizierungslabel als auch das Trainingslabel müssen die folgenden Kriterien erfüllen:

  • Enthält mindestens 2 und höchstens 7 Optionen.
  • Die Optionen müssen in derselben Reihenfolge sein.

    Beispiel: Das Klassifizierungslabel enthält Optionen in dieser Reihenfolge:

    1. Option 1
    2. Option 2
    3. Option 3

    Die Optionen für Trainingslabels können nicht so sortiert werden:

    1. Option 2
    2. Option 1
    3. Option 3
  • Muss veröffentlicht sein.
  • Haben Labels mit unterschiedlichen Zugriffsberechtigungen. Das Trainingslabel sollte nur bestimmten Labelerstellern zur Verfügung stehen, die das Modell trainieren können. Das Klassifizierungslabel kann einen breiteren Zugriff haben.

Wie erstelle ich manuell ein Trainingslabel?

Es empfiehlt sich, das Trainingslabel automatisch zu erstellen, wenn Sie Ihr Modell einrichten. Sie können es aber auch manuell im Label-Manager erstellen. Beachten Sie dabei die folgenden Richtlinien:
  • Prüfen Sie, ob das Label den erforderlichen Labelkriterien entspricht.
  • Identifizieren Sie das Trainingslabel mit dem Wort „train“ oder „training“, damit Ihre zuständigen Labelersteller das Label leichter erkennen und beim Erstellen des Trainingsdatasets anwenden können.
  • Fügen Sie dem Trainingslabel ein Beschreibungsfeld hinzu, damit die zugewiesenen Labelersteller den Zweck besser verstehen.
  • Legen Sie die Labelberechtigungen nur für die festgelegten Labelanwender fest, die Dateien für das Modelltraining identifizieren. Verwenden Sie dazu die Konfigurationsgruppe, die Sie für Labelanwender erstellt haben. Labelersteller benötigen die Berechtigung Darf Labels anwenden und Werte festlegen. Weitere Informationen finden Sie im Hilfeartikel Klassifizierungslabels für Ihre Organisation erstellen.

Kann ich das Klassifizierungslabel als Trainingslabel verwenden?

Nein, das Klassifizierungslabel und das Trainingslabel müssen sich unterscheiden. Das Label, das Sie als Klassifizierungslabel auswählen, ist nicht für das Trainingslabel verfügbar.

Trainings-Datasets

Welche Dateien eignen sich zum Trainieren des Modells?

Damit Sie beim Trainieren des Modells optimale Ergebnisse erzielen, sollten die zuständigen Labelersteller die folgenden Richtlinien beachten:

  • Jede Datei muss mindestens 500 Zeichen enthalten.
  • Wählen Sie Dateien aus, die Inhalte darstellen, die Nutzer in Ihrer Organisation erstellen, freigeben und verwenden.
  • Versehen Sie ungefähr die gleiche Anzahl von Dateien pro Labeloption mit Labels, mindestens 100 Dateien für jede Option. So kann das Modell Ihre Daten umfassend analysieren und die Ergebnisse verbessern.
  • Fügen Sie für jeden Optionstyp eine repräsentative Auswahl von Dateien hinzu. Benennen Sie beispielsweise 100 Lebensläufe nicht als Gesamtmenge der Beispieldateien für „Streng vertraulich“, wenn Verträge auch als streng vertraulicher Dateityp in Ihrer Organisation gelten.
  • Wenden Sie das Trainingslabel nur auf Dateien an, die Ihrer Organisation gehören, also direkt Nutzern gehören oder in geteilten Ablagen gespeichert werden. Bei der KI-Klassifizierung werden keine Dateien verarbeitet, die externen Nutzern gehören oder sich in externen geteilten Ablagen befinden.

Kann das Modell mit Dateien trainiert werden, die zuvor mit Labels versehen wurden?

Das Trainieren mit Dateien, die zuvor mit Labels versehen wurden, ist derzeit nicht möglich. Für ein Modell ist ein Trainingslabel erforderlich, das ein Replikat des Labels ist, das automatisch auf Dateien angewendet wird. Es kann jedoch nicht dasselbe Label sein.

Kann das Modell in mehreren Sprachen trainiert werden?

Das Modell unterstützt mehrere Sprachen. In den Trainingsdaten sollte jedoch eine repräsentative Auswahl von Dateien für jeden Optionstyp und jede Sprache enthalten sein. Dadurch erhöht sich die Anzahl der Dateien, die zum erfolgreichen Trainieren des Modells erforderlich sind. Es werden nur Sprachen unterstützt, die auf lateinischen Zeichen basieren.

Wie werden die Werte während des Trainings berechnet?

Während des Trainings verwendet das KI-Modell 75% der Eingabedaten, um sich selbst im Anwenden von Labels auf Dateien zu trainieren, und reserviert 25 %, um seine eigene Leistung regelmäßig zu testen. Das Modell analysiert also 25% der Dateien mit Label so, als wüsste es nicht, welches Label angewendet wurde. Das KI‑Modell wählt dann ein eigenes Label aus und vergleicht es mit dem tatsächlichen Label, das vom festgelegten Labeler angewendet wurde. Die Punktzahlen geben an, welchem Anteil der reservierten Dateien es korrekt das richtige Label zugewiesen hat.

Kann ich ein Modell nach dem Training „einfrieren“, um das automatische Neutrainieren zu verhindern?

KI‑Klassifizierungsmodelle werden mit Dateien in Drive trainiert. Wenn diese Dateien gelöscht werden (oft gemäß Aufbewahrungszeitplänen über Google Vault), muss auch das Modell gelöscht werden, damit die Inhalte der Dateien nicht in irgendeiner Form erhalten bleiben. Aus diesem Grund wird das Modelltraining in einer Endlosschleife durchgeführt und kann nicht unterbrochen werden.

Dürfen Nutzer Labels und Feldwerte ändern oder korrigieren?

Nutzer mit der entsprechenden Berechtigung können ein Label oder einen Feldwert aktualisieren. Das Klassifizierungsmodell wird durch die KI-Klassifizierung jedoch nicht auf Grundlage dieser Änderung überarbeitet. Wenn Sie feststellen, dass das Modell Labels und Feldwerte falsch angewendet hat, können Sie die zuständigen Labelersteller bitten, den Dateien das richtige Trainingslabel zuzuweisen. Die KI-Klassifizierung bezieht diese Daten dann in den nächsten Selbsttrainingszyklus des Modells ein.

Automatisch anwenden

Kann die KI-Klassifizierung Bilder, Videos und Audiodateien bewerten?

Bei der KI-Klassifizierung wird dieselbe indexierbare Textverarbeitung wie bei Drive DLP verwendet. Alle Dateien, aus denen Drive indexierbaren Text extrahieren kann, können auf mit KI-Klassifizierung angewendete Labels geprüft werden. Dazu gehört die optische Zeichenerkennung (OCR), um Text aus Bildern zu extrahieren. Bei der KI-Klassifizierung werden jedoch keine Video- oder Audiodateien ausgewertet.

Funktioniert die KI-Klassifizierung nur, um sensiblen Inhalten Label hinzuzufügen?

Der Schwerpunkt der KI-Klassifizierung liegt auf sensiblen Inhalten. Jedes Label mit bis zu vier Optionen kann jedoch für die automatische Kennzeichnung trainiert werden. Klassifizierungslabels werden auch für Auditing, Auffindbarkeit und Aufbewahrungsverwaltung verwendet.

Funktioniert die KI-Klassifizierung, wenn die clientseitige Verschlüsselung (CSE) aktiviert ist?

Da Google Dateien, die mit CSE verschlüsselt wurden, nicht entschlüsseln kann (nur Ihr privater Verschlüsselungsschlüssel ist dazu in der Lage), kann die KI-Klassifizierung nicht auf Dateien trainiert werden, die mit CSE verschlüsselt wurden, und kann Labels nicht automatisch auf diese Dateien anwenden.

Wie und wann werden automatisch angewendete Labels durch die KI-Klassifizierung überarbeitet?

Nachdem die automatische Anwendung aktiviert wurde, werden alle Dateien im Ruhezustand, aus denen ausreichend Text extrahiert werden kann, von der KI-Klassifizierung gescannt und klassifiziert. Diese Dateien werden mindestens einmal gescannt.

Bei der KI-Klassifizierung werden Dateien regelmäßig neu verarbeitet, wenn Inhalte geändert werden. Änderungen am Inhalt können zu einer anderen Vorhersage für eine Datei führen. Wenn die KI-Klassifizierung sowohl eine alte als auch eine neue Option für eine Datei hat, wird die Option bevorzugt, die in der Optionsliste weiter oben steht. Nehmen wir an, ein Feld im Label Manager enthält drei Optionen:

  • Vertraulich
  • Intern
  • Öffentlich

Angenommen, die KI-Klassifizierung klassifiziert eine Datei als Intern und der Inhalt ändert sich so, dass das Modell der KI-basierten Klassifizierung Vertraulich vorhersagt. In diesem Fall wird die Klassifizierung der Datei in Vertraulich geändert. Wenn das Modell der KI-basierten Klassifizierung jedoch Öffentlich vorhersagt, bleibt die Klassifizierung der Datei Intern.

Bei der KI-Klassifizierung werden automatisch angewendete Labels und Feldwerte, die von Nutzern überprüft oder geändert wurden, nicht überarbeitet.

Wenn sich das Modell ändert, werden vorhandene Dateien dann automatisch neu bewertet?

Ihre Dateien werden vom neuesten Modell verarbeitet, wenn sie erstellt oder geändert werden. Vorhandene Dateien werden nicht automatisch neu verarbeitet, wenn eine neue Modellversion veröffentlicht wird. Das Modell kann jedoch in regelmäßigen Abständen alle Ihre Dateien mit der neuesten Version neu verarbeiten, unabhängig von bestimmten Modellupdates oder ‑trainings.

Hat die KI-Klassifizierung Vorrang vor anderen Klassifizierungsmethoden, wenn mehrere aktiv sind?

Die Datenklassifizierung kann überschrieben werden. Die Datenklassifizierung erfolgt in der folgenden Reihenfolge:
  1. DLP-Regel ohne Nutzerüberschreibung
  2. Manuelle Klassifizierung
  3. DLP-Regel mit Nutzerüberschreibung
  4. KI‑basierte Klassifizierung
  5. Standardklassifizierung
Wenn Sie ein Label oder Feld entfernen, kann ein Klassifizierungsmechanismus der niedrigeren Stufe wirksam werden. So kann beispielsweise ein Label, das von einem Nutzer entfernt wurde, später automatisch durch die KI-Klassifizierung wieder auf eine Datei angewendet werden.

Auf welche Dateitypen können Labels durch KI-Klassifizierung angewendet werden?

  • Bei der KI-Klassifizierung wird dieselbe indexierbare Textverarbeitung wie bei Drive DLP verwendet. Weitere Informationen finden Sie in der Liste der von DLP gescannten Dateitypen. Audio- und Videodateien werden nicht unterstützt.
  • Eine Datei muss eine Mindestmenge an Text enthalten, damit die KI-Klassifizierung ein Label anwenden kann. Daher werden einige Dateien, z. B. sehr kurze Dokumente und Bilder mit wenig Text, möglicherweise nicht klassifiziert.

Was passiert, wenn eine Option für die automatische Anwendung deaktiviert wird?

Wenn während des Scans für eine Datei eine Option vorhergesagt wird, für die die automatische Anwendung deaktiviert ist, wird der Datei kein Label oder Feldwert durch die KI-basierte Klassifizierung zugewiesen.

Bei Dateien, die zuvor mithilfe der KI-basierten Klassifizierung ein Label erhalten haben, bleiben die angewendeten Label und Optionswerte auch nach der Deaktivierung der Option erhalten.

Kann ich automatisch angewendete Labels zurücksetzen?

Das Anwenden von Labels kann nicht rückgängig gemacht werden. Wir empfehlen, Ihre Modelle mit einer kleinen Zielgruppe zu optimieren und zu testen, bevor Sie sie breit einsetzen. Sie können Ihre Modelle beispielsweise mit einem temporären Label trainieren. Wenn die Modellleistung zufriedenstellend ist, können Sie das Modell „zurücksetzen“, indem Sie es löschen und ein neues Modell mit demselben Trainingslabel (demselben Trainingsdatensatz), aber mit Ihrem permanenten Label erstellen.

Lizenzierung

Wie funktioniert die Funktion für Nutzer ohne entsprechende Lizenz?

Wenn ein Administrator in Ihrer Organisation eine Lizenz hat, die die KI-Klassifizierung unterstützt, kann er ein Modell trainieren. Die zuständigen Labelersteller (die Nutzer, die das Trainingslabel anwenden) benötigen keine Lizenz mit KI‑Klassifizierung.

Dateien mit dem Trainingslabel können Nutzern mit einer Lizenz gehören, die Drive-Klassifizierungslabels unterstützt. Die KI-Klassifizierung kennzeichnet jedoch nur Dateien, die sich in geteilten Ablagen befinden oder Nutzern mit Lizenzen gehören, die die KI-Klassifizierung unterstützen. Dateien, die Nutzern ohne unterstützte Lizenz gehören, werden nicht durch die KI‑Klassifizierung verarbeitet.

Wenn keine Nutzer eine Lizenz haben, die die KI-Klassifizierung unterstützt, wird die automatische Anwendung deaktiviert und das Klassifizierungsmodell wird gelöscht. Trainingslabels und Labels, die durch die KI-basierte Klassifizierung angewendet werden, bleiben jedoch in Dateien erhalten.

Wie funktioniert die Funktion für archivierte Nutzer?

Bei Nutzern mit einer Lizenz für „Google Workspace Enterprise Plus – Archivierter Nutzer“ werden die Dateien durch KI‑Klassifizierung gekennzeichnet.

Erste Schritte als Administrator für Google Drive-Labels