Automatyczne oznaczanie plików na Dysku Google etykietami przy użyciu klasyfikacji AI

Ta funkcja jest dostępna w wersjach Frontline Plus i Enterprise Plus. Jest ona też dostępna w dodatkach Gemini Enterprise–Legacy, Gemini Education Premium i AI Security. Porównanie dodatków

Etykiety klasyfikacji danych na Dysku Google działają jak opisowe metadane plików, których możesz używać do różnych funkcji, takich jak ochrona danych, analiza kontrolna i przechowywanie. Klasyfikacja AI na Dysku Google automatyzuje oznaczanie plików etykietami bez konieczności programowania.

Dostępne są 2 metody klasyfikacji AI:

  • Modele niestandardowe – tworzenie specjalistycznego modelu uczenia maszynowego unikalnego dla Twojej organizacji na podstawie zestawu danych treningowych organizacji. Jako administrator możesz określić, na jakich danych trenowane są modele. Model jest unikalny dla Twojej organizacji.
  • Używanie Gemini (beta): używaj dużych modeli językowych (LLM) Gemini do sprawdzania zawartości plików i automatycznego stosowania etykiet na podstawie dostosowywanych instrukcji w języku naturalnym. Ta metoda nie wymaga wstępnego zbierania danych ani trenowania modelu.

Możesz utworzyć łącznie do 5 niepowtarzalnych modeli niestandardowych klasyfikacji opartej na AI lub instrukcji Gemini, z możliwością łączenia obu metod w ramach tego ogólnego limitu.

Uwaga: aby pliki zostały oznaczone etykietami przez klasyfikację AI, muszą znajdować się na dyskach współdzielonych lub należeć do użytkowników z licencjami, które obsługują etykiety klasyfikacji.

Korzystanie z klasyfikacji AI

Oto podstawowe czynności, które należy wykonać, aby skonfigurować klasyfikację AI na potrzeby automatycznego oznaczania etykietami nowych i istniejących plików na Dysku.

1. Utwórz model niestandardowy lub instrukcje dla Gemini: wybierz lub utwórz etykietę klasyfikacji, którą chcesz automatycznie stosować do plików.

Uwaga: jeśli tworzysz model niestandardowy, musisz też utworzyć etykietę do trenowania. Służy do oznaczania przykładowych plików, których model używa do uczenia się klasyfikowania danych.

2. (Tylko model niestandardowy) Trenowanie modelu: po utworzeniu etykiet wyznaczeni twórcy etykiet klasyfikują pliki na Dysku za pomocą etykiety do trenowania, aby utworzyć zbiór danych treningowych. Model następne wykorzysta ten zbiór danych, aby nauczyć się klasyfikować pliki poufne.

3. Włączenie klasyfikacji AI: po wytrenowaniu modelu lub skonfigurowaniu instrukcji Gemini możesz skonfigurować automatyczne dodawanie etykiet do plików, czyli automatyczne stosowanie. Podczas konfiguracji musisz wybrać, które opcje etykiet chcesz włączyć, Musisz też ustalić, kto będzie właścicielem plików, do których klasyfikacja AI ma stosować etykiety. Model lub instrukcje zaczną wtedy dodawać etykiety do plików poufnych.

4. Monitorowanie modelu: możesz użyć dziennika zdarzeń na Dysku, aby sprawdzić, ile plików zostało sklasyfikowanych oraz ilu użytkowników zaakceptowało lub zmodyfikowało automatycznie zastosowaną etykietę (jeśli mają do tego uprawnienia).

Zanim zaczniesz

  • Dowiedz się, jak działają etykiety klasyfikacji i jak je tworzyć. Więcej informacji znajdziesz w artykule Pierwsze kroki w roli administratora etykiet klasyfikacji.
  • Wybierz wyznaczonych twórców etykiet – grupę użytkowników w organizacji, którzy mogą ręcznie zastosować etykietę do trenowania do plików poufnych.
  • Utwórz grupę konfiguracji tylko dla wyznaczonych twórców etykiet. Instrukcje znajdziesz w artykule Dostosowywanie ustawień usługi przy użyciu grup konfiguracji.
  • Włącz te uprawnienia na koncie administratora: Zarządzanie etykietami klasyfikacji, Zarządzanie regułami DLP i Wyświetlanie reguł DLP.

Tworzenie modelu

Aby utworzyć model, musisz najpierw wybrać istniejącą etykietę klasyfikacji lub utworzyć nową. Następnie musisz utworzyć pasującą etykietę trenowania automatycznie (zalecane) lub ręcznie za pomocą menedżera etykiet. Będzie ona używana przez wyznaczonych twórców etykiet.

Wybierz lub utwórz etykietę klasyfikacji

Klasyfikacja musi być włączona w na Dysku i w Dokumentach. Po wytrenowaniu model AI automatycznie stosuje etykietę klasyfikacji do plików poufnych na Dysku. Model jest trenowany na podstawie tylko jednego pola na etykietę, które musi być listą plakietek lub listą opcji.

Zalecamy użycie etykiety poufności z plakietką, ponieważ jest ona wyraźnie widoczna w dokumentach.

Gdy używasz pola listy opcji lub listy plakietek jako etykiety klasyfikacji, musi ono:

  • mieć od 2 do 7 opcji;
  • być opublikowane.

Jeśli masz już etykietę, która spełnia te wymagania, możesz użyć jej jako etykiety klasyfikacji. W przeciwnym razie użyj menedżera etykiet, aby utworzyć etykietę przed skonfigurowaniem modelu lub w trakcie tego procesu (opisanym poniżej). Więcej informacji znajdziesz w artykule Tworzenie etykiet klasyfikacji dla organizacji.

Tworzenie etykiety trenowania

Etykieta do trenowania jest niemal identyczna z etykietą klasyfikacji i jest używana tylko do trenowania przez wyznaczonych twórców etykiet. Możesz automatycznie utworzyć etykietę do trenowania podczas tworzenia modelu (zobacz sekcję niżej). Dzięki temu będziesz mieć pewność, że będzie pasować do etykiety klasyfikacji.

Możesz też utworzyć własną etykietę trenowania ręcznie za pomocą menedżera etykiet przed skonfigurowaniem modelu lub w trakcie jego konfigurowania. Szczegółowe informacje znajdziesz poniżej w sekcji Jak ręcznie utworzyć etykietę do trenowania?.

Tworzenie modelu

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Utwórz model.
  3. Na liście Etykieta klasyfikacji wybierz istniejącą etykietę klasyfikacji i pole, dla którego chcesz wytrenować model, lub kliknij Utwórz etykietę, aby utworzyć etykietę za pomocą menedżera etykiet.

    Jeśli etykieta została utworzona w narzędziu menedżer etykiet, wróć na stronę Tworzenie modelu. Może być konieczne odświeżenie strony, zanim nowa etykieta będzie widoczna na liście.

  4. W przypadku etykiety klasyfikacji wybierz spełniające wymagania pole, którego chcesz użyć, na liście Nazwa pola.
  5. Kliknij Dalej.
  6. (Opcjonalnie) Automatycznie utwórz i opublikuj etykietę do trenowania, która pasuje do etykiety klasyfikacji:
    1. Kliknij Utwórz etykietę do trenowania.
    2. W komunikacie, który się wyświetli, kliknij Aktualizuj uprawnienia związane z etykietami. Etykieta otworzy się w trybie edycji w narzędziu menedżer etykiet na osobnej karcie.
    3. Kliknij Uprawnienia a potem Edytuj, a następnie przyznaj grupie konfiguracji z twórcami etykiet uprawnienie Może stosować etykiety i ustawiać wartości.
    4. Kliknij Zapisz i zamknij kartę menedżera etykiet.

      Uwaga: uprawnienia związane z etykietami możesz też ustawić później. Ważne jest jednak, aby tylko osoby twórcy etykiet mieli dostęp do etykiety do trenowania.

  7. (Opcjonalnie) Jeśli masz już utworzoną etykietę do trenowania, wybierz ją z listy Etykieta do trenowania.
  8. (Opcjonalnie) Utwórz teraz własną etykietę do trenowania, klikając Otwórz menedżera etykiet.

    Ważne: sprawdź, czy etykieta spełnia kryteria etykiety do trenowania i że masz ustawione uprawnienia do niej, tak aby tylko twórcy etykiet mieli do niej dostęp. Szczegółowe informacje znajdziesz w wytycznych dotyczących etykiet do trenowania poniżej.

    Wróć na stronę Tworzenie modelu. Może być konieczne odświeżenie strony, zanim nowa etykieta do trenowania będzie widoczna na liście.

  9. Na stronie Tworzenie modelu kliknij Dalej.
  10. Wpisz opisową nazwę modelu.
  11. Kliknij Utwórz model.

Po utworzeniu modelu na stronie Szczegóły modelu wyświetli się wybrana etykieta do trenowania i etykieta klasyfikacji.

Trenowanie modelu

Aby wytrenować model AI, musisz utworzyć zbiór danych treningowych, a następnie rozpocząć początkowe trenowanie. Podczas trenowania model uczy się na przykładach ze zbioru danych.

Ponowne trenowanie jest automatyczne: po początkowym trenowaniu model jest ponownie trenowany co 2 tygodnie, aby zwiększyć lub utrzymać poziom dokładności. W każdej chwili możesz ponownie przetrenować model ręcznie. Po każdej sesji trenowania publikowany jest nowy model, a automatyczny 2-tygodniowy harmonogram ponownych sesji trenowania jest resetowany.

Tworzenie zbioru danych do trenowania

Aby utworzyć zbiór danych do trenowania, wyznaczeni twórcy etykiet muszą zastosować etykietę trenowania do co najmniej 100 plików na opcję etykiety. Jeśli przykładowo etykieta ma 3 opcje, np. „Potrzeba dostępu do informacji”, „Poufny” i „Publiczny”, potrzebujesz co najmniej 300 plików treningowych. Najlepiej jednak mieć więcej niż 100 plików na opcję etykiety, ponieważ niektóre pliki mogą nie nadawać się do użycia w zbiorze danych do trenowania. Więcej informacji o wysokiej jakości przykładach na potrzeby trenowania oznaczania etykietami

Uwaga: zbiór danych do trenowania może zawierać maksymalnie milion plików.

Po utworzeniu modelu automatycznie sprawdzi on w ciągu około 24 godzin, ile plików zostało oznaczonych etykietami do trenowania. Potem sprawdza je na bieżąco w ciągu dnia.

Aby sprawdzić liczbę plików oznaczonych etykietami:

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. W sekcji Działania przy modelu kliknij Wyświetl szczegóły.
  4. W panelu u góry strony w sekcji Pliki do trenowania aktywnego modelu sprawdź liczbę plików z etykietami.

Jeśli model ma wystarczającą liczbę plików do trenowania, będzie on gotowy do trenowania.

Rozpocznij trenowanie

Proces trenowania trwa zwykle od 4 do 6 godzin, ale w przypadku większych zbiorów danych może potrwać dłużej. Model prawdopodobnie będzie wymagać kilku sesji trenowania, aby nauczyć się prawidłowego oznaczania plików.

Podczas trenowania model porównuje wybraną klasyfikację pliku z etykietą do trenowania zastosowaną do tego pliku, aby wygenerować wyniki. Więcej informacji znajdziesz w sekcji o sposobie obliczania wyników.

Po zakończeniu sesji trenowania możesz sprawdzić dokładność modelu.

Aby rozpocząć trenowanie:

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Szczegóły modelu w sekcji Działania dotyczącej modelu kliknij Wyświetl szczegóły.
  4. W panelu szkoleniowym u góry strony kliknij Rozpocznij trenowanie.

    Uwaga: ten przycisk jest dostępny tylko wtedy, gdy twórcy etykiet oznaczyli minimalną liczbę plików do trenowania.

Po trenowaniu: sprawdzanie wyników modelu

Po sesji trenowania model jest publikowany z wynikami procentowymi dla każdej opcji etykiety. Każdy wynik, nazywany pełnością, to odsetek przykładów treningowych, które model prawidłowo sklasyfikował po przeprowadzeniu testów:

  • Poniżej 50% – niska dokładność. Model potrzebuje lepszych danych i jeszcze nie jest gotowy.
  • 50–80% – średnia dokładność. Model może być gotowy w ograniczonym zakresie.
  • Powyżej 80% – wysoka dokładność. Model jest gotowy do klasyfikowania plików w Twojej organizacji.

Aby sprawdzić dokładność modelu po przeprowadzeniu trenowania:

Na stronie Szczegóły modelu możesz wyświetlić jego wyniki:

  • w panelu wyników trenowania u góry strony w sekcji Obecnie użyte pliki i wyniki,
  • w panelu Bieżący zbiór danych treningowych.

Tworzenie instrukcji Gemini

Aby utworzyć zestaw instrukcji Gemini, musisz najpierw wybrać predefiniowaną etykietę zawierającą instrukcje lub wybrać istniejącą etykietę klasyfikacji. Zanim zaczniesz, sprawdź, czy obecna etykieta spełnia wymagane kryteria konfiguracji. Więcej informacji znajdziesz na tej stronie w sekcji Wybieranie lub tworzenie etykiety klasyfikacji.

Aby utworzyć instrukcje dla Gemini:

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Użyj Gemini.
  3. Na stronie Wybierz etykietę, którą ma stosować Gemini wybierz opcję:
    • Kliknij Zastosuj wstępnie zdefiniowaną etykietę, aby użyć wstępnie zdefiniowanej etykiety z instrukcjami z szablonu, które możesz edytować.
    • Aby użyć jednej z istniejących etykiet organizacji, kliknij Zastosuj własną etykietę.
  4. Jeśli potrzebujesz nowej etykiety, kliknij Utwórz etykietę, aby otworzyć menedżera etykiet w nowej karcie przeglądarki.
    • Uwaga: po utworzeniu i opublikowaniu nowej etykiety na karcie menedżera etykiet wróć na kartę Użyj Gemini do zastosowania etykiet i odśwież stronę, aby zaktualizować dostępne opcje.
  5. Jeśli zdecydujesz się zastosować własną etykietę, kliknij menu Etykieta klasyfikacji i wybierz etykietę.
  6. Kliknij menu Nazwa pola i wybierz pole.
  7. Kliknij Dalej.
  8. Na stronie Sprawdź szczegóły instrukcji dla Gemini wpisz jasne, wyczerpujące instrukcje dotyczące każdej opcji etykiety, aby pomóc Gemini w klasyfikowaniu danych organizacji. Podaj te informacje o każdej opcji:
    • Co reprezentuje opcja, np. kategorię, typ lub cechę.
    • Jak Gemini ma identyfikować opcję, np. wskazówki lub słowa kluczowe, których ma szukać.
    • Jak Gemini powinien obsługiwać wyjątki, np. sytuacje, w których opcja nie powinna być stosowana.
  9. Kliknij Dalej.
  10. Na stronie Wybór opcji etykiet kwalifikujących się do automatycznego stosowania zaznacz pola obok opcji etykiet, które Gemini ma stosować automatycznie.
    • Uwaga: Gemini nie będzie stosować niezaznaczonych opcji do plików na Dysku.
  11. Kliknij Dalej.
  12. Na stronie Sprawdzenie i nazwanie instrukcji wpisz opisową nazwę instrukcji w polu Nazwa*. Sprawdź i zweryfikuj szczegóły, aby upewnić się, że są prawidłowe.
  13. Kliknij Zapisz lub Zapisz i skonfiguruj automatyczne stosowanie.

Włączanie klasyfikacji AI

Po skonfigurowaniu instrukcji Gemini lub wytrenowaniu modelu niestandardowego pod kątem uzyskania minimalnego poziomu dokładności (co najmniej 50%) możesz wybrać opcje etykiet i włączyć automatyczne dodawanie etykiet do plików. Aby uzyskać najlepsze wyniki w przypadku modelu niestandardowego, zalecamy poczekać, aż wyniki modelu dla wszystkich opcji etykiet osiągną co najmniej poziom 80%.

Włączanie automatycznego stosowania

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Szczegóły modelu w sekcji Działania dotyczącej modelu kliknij Wyświetl szczegóły.
  4. W panelu szkoleniowym kliknij Skonfiguruj automatyczne stosowanie.

    Uwaga: ten przycisk jest dostępny tylko wtedy, gdy co najmniej 1 opcja etykiety osiągnęła dokładność na poziomie 50%.

    Jeśli automatyczne stosowanie zostało już skonfigurowane, w sekcji Pliki z etykietami AI kliknij Edytuj ustawienia automatycznego stosowania.

  5. Zaznacz pola obok opcji etykiet, które mają być automatycznie stosowane przez model AI.
  6. Kliknij Zapisz i kontynuuj, aby wybrać jednostki organizacyjne lub grupy będące właścicielami plików, w których model ma automatycznie stosować etykiety. Domyślnie ustawiona jest organizacja nadrzędna najwyższego poziomu.

    Możesz też kliknąć Zapisz, aby wybrać użytkowników później.

  7. Jeśli chcesz wybrać użytkowników, z boku wybierz jednostkę organizacyjną lub grupę konfiguracji.

    Ustawienia grupy zastępują ustawienia jednostek organizacyjnych. Więcej informacji

  8. Kliknij WŁĄCZONE – etykieta jest stosowana automatycznie z jedną z opcji przedstawionych poniżej.
  9. Kliknij Zapisz.

    Na stronie Szczegóły modelu Bieżący stan automatycznego stosowania reguły to Włączony.

Uwaga: klasyfikację AI możesz monitorować za pomocą dziennika zdarzeń na Dysku. Więcej informacji znajdziesz w sekcji poświęconej monitorowaniu zdarzeń dotyczących etykiety klasyfikacji AI poniżej.

Kiedy klasyfikacja AI skanuje pliki

Po włączeniu automatycznego stosowania w przypadku plików należących do użytkowników i dysków współdzielonych klasyfikacja AI skanuje ich pliki (podczas przechowywania) co najmniej raz w ciągu 1–2 tygodni. Klasyfikacja AI skanuje też pliki podczas ich przesyłania lub modyfikowania i może zmienić zastosowaną etykietę, jeśli zmieni się zawartość pliku.

Uwaga: skanowanie nieaktywnych plików musi być włączone ręcznie, gdy używasz klasyfikacji AI z instrukcjami Gemini. Aby aktywować tę funkcję, na stronie Instrukcje kliknij Zastosuj etykietę do nieaktywnych plików.

Sposób obsługi konfliktów automatycznego stosowania

Reguły ochrony danych

Wartości etykiet ustawione przez reguły ochrony danych mają wyższy priorytet niż klasyfikacja AI, a obie z nich mają wyższy priorytet niż klasyfikacja domyślna.

Wiele modeli niestandardowych lub instrukcji Gemini

Jeśli co najmniej 2 źródła klasyfikacji AI próbują zastosować różne opcje etykiet tego samego pola etykiety do tego samego pliku, stosowana jest opcja, która jest wyżej na liście opcji etykiety. Możesz np. mieć etykietę z polem zawierającym 3 opcje w narzędziu menedżer etykiet:

  1. Poufny
  2. Wewnętrzny
  3. Publiczna

Jeśli źródło 1 klasyfikacji AI próbuje ustawić etykietę Poufny, a źródło 2 próbuje ustawić etykietę Publiczny dla tego samego pliku, zastosowana zostanie etykieta Poufny, ponieważ znajduje się wyżej na liście opcji etykiety. Przed skonfigurowaniem reguł sprawdź, czy opcje pól etykiety są wymienione w preferowanej kolejności według priorytetu.

Etykiety stosowane przez użytkowników

Etykiety stosowane przez użytkowników mają wyższy priorytet niż etykiety stosowane przez AI. Oznacza to, że klasyfikacja AI nie zmieni etykiety, którą użytkownik ustawił wcześniej.

Uwaga: gdy użytkownik zaakceptuje lub zmodyfikuje plik z etykietą AI, etykieta zostanie uznana za „zastosowaną przez użytkownika”, a klasyfikacja AI nie będzie już modyfikować jej wartości.

Monitorowanie modelu

Szczegółowe informacje o tym, jak klasyfikacja AI oznacza pliki etykietami, znajdziesz w dzienniku zdarzeń na Dysku. W przypadku każdej opcji etykiety dziennik pokazuje, ile plików zostało sklasyfikowanych przy użyciu automatycznego stosowania oraz ilu użytkowników zaakceptowało automatycznie zastosowaną etykietę lub ją zmodyfikowało. Użytkownicy muszą mieć uprawnienia do wykonywania działań na automatycznie zastosowanych etykietach.

Uprawnienia wymagane do interakcji z automatycznie zastosowanymi etykietami

Aby wykonywać działania na automatycznie zastosowanych etykietach, użytkownicy muszą mieć uprawnienia do plików i etykiet. Uprawnienia do etykiety klasyfikacji możesz ustawić w narzędziu menedżer etykiet. Więcej informacji znajdziesz w artykule Tworzenie etykiet klasyfikacji dla organizacji.

  • Aby wyświetlać etykiety zastosowane automatycznie, użytkownicy muszą mieć uprawnienie Może wyświetlać tę etykietę w przypadku danej etykiety klasyfikacji.
  • Aby akceptować i modyfikować automatycznie stosowane etykiety, użytkownicy muszą mieć uprawnienia Może stosować etykiety i ustawiać wartości w danej przypadku etykiety klasyfikacji oraz muszą mieć rolę Edytujący lub Właściciel w pliku.

Wyświetlanie zdarzeń klasyfikacji AI w dzienniku zdarzeń na Dysku

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Szczegóły modelu w sekcji Pliki z etykietami AI kliknij Wyświetl pliki w przypadku opcji etykiety, dla której chcesz wyświetlić zdarzenia.

    W nowej karcie otworzy się narzędzie do analizy zagrożeń z wynikami wyszukiwania w dzienniku zdarzeń na Dysku dotyczącymi 2 zdarzeń związanych z klasyfikacją AI: Etykieta została zastosowana i Zmieniono wartość pola etykiety.

  4. Kliknij Opis zdarzenia, aby uzyskać dodatkowe informacje, takie jak:
    • nazwa i typ dokumentu, który został oznaczony etykietą;
    • wartość pola etykiety przypisana do dokumentu (na przykład Poufny lub Dostęp ograniczony).

Wyświetlanie wskaźnika akceptacji przez użytkowników instrukcji dla Gemini

Na stronie Szczegóły modelu dotyczącej klasyfikacji opartej na AI wykres Akceptacja przez użytkowników zawiera dane o skuteczności Twoich instrukcji uzyskane na podstawie opinii użytkowników z ostatnich 180 dni.

Wskaźniki obejmują:

  • Sprawdzone przez użytkownika – łączna liczba użytkowników, którzy weszli w interakcję z banerem automatycznie zastosowanej etykiety, aby zaakceptować lub zmodyfikować opcję etykiety zastosowaną przez Gemini.
  • Użytkownik zaakceptował – łączna liczba użytkowników, którzy zdecydowali się zachować konkretną etykietę sugerowaną przez Gemini.

Zarządzanie modelem

Wyłączanie automatycznego stosowania etykiety klasyfikacji

Aby wyłączyć automatyczne stosowanie wszystkich lub tylko określonych opcji etykiet:

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Szczegóły modelu w sekcji Działania dotyczącej modelu kliknij Wyświetl szczegóły.
  4. W sekcji Pliki z etykietami AI kliknij Edytuj ustawienia automatycznego stosowania.
  5. Odznacz pola obok opcji etykiet, w przypadku których chcesz wyłączyć automatyczne stosowanie.

    Aby całkowicie wstrzymać automatyczne stosowanie, usuń zaznaczenie wszystkich opcji.

Całkowite wyłączanie automatycznego stosowania w określonych jednostkach organizacyjnych lub grupach

Możesz całkowicie wyłączyć automatyczne stosowanie w przypadku treści należących do użytkowników w określonych jednostkach organizacyjnych lub grupach.

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Szczegóły modelu w sekcji Działania dotyczącej modelu kliknij Wyświetl szczegóły.
  4. W menu Więcej działań u góry strony kliknij Zarządzanie automatycznym stosowaniem a potem Zaktualizuj włączone jednostki organizacyjne lub grupy.
  5. Po lewej stronie kliknij jednostkę organizacyjną lub grupę, aby ją wybrać.
  6. Wybierz WYŁĄCZONE – etykieta nie jest stosowana automatycznie.
  7. Kliknij Zapisz.

Usuwanie modelu niestandardowego lub instrukcji dla Gemini

Może być konieczne usunięcie modelu niestandardowego lub instrukcji Gemini, jeśli na przykład ich dokładność jest niezadowalająca. Jeśli usuniesz model niestandardowy lub instrukcje Gemini, wszystkie ustawienia klasyfikacji AI zostaną bezpowrotnie usunięte. Uwaga:

  • Etykiety używane w modelu lub instrukcjach Gemini zostaną odłączone od ustawień klasyfikacji AI, a historia modelu lub instrukcji Gemini zostanie usunięta. Same etykiety nie zostaną jednak usunięte i nadal będzie można nimi zarządzać w menedżerze etykiet.
  • (Tylko model niestandardowy) Etykiety do trenowania pozostają w plikach. Po usunięciu modelu możesz skonfigurować nowy model niestandardowy, aby używał tej samej etykiety do trenowania. Jeśli powtórzysz trenowanie z użyciem istniejących etykiet i plików do trenowania, modele będą działać podobnie.
  • Automatyczne stosowanie etykiet włączone w modelu zostanie natychmiast zatrzymane. Możesz usunąć lub zachować etykiety, które zostały wcześniej automatycznie zastosowane do plików, które nie zostały zaakceptowane ani zmodyfikowane przez użytkownika.
  • Jeśli utworzysz nowy model lub instrukcje Gemini z użyciem tej samej etykiety klasyfikacji, funkcja klasyfikacji AI zastąpi wyniki poprzednich klasyfikacji. Dzięki temu możesz ponownie przetworzyć pliki organizacji na Dysku, co może być przydatne, jeśli od czasu rozpoczęcia korzystania z modelu lub instrukcji ich jakość znacznie się poprawiła.

Aby usunąć model lub instrukcje:

  1. W konsoli administracyjnej Google otwórz Menu  a potem Bezpieczeństwo a potem Dostęp do danych i kontrola nad nimi a potem Klasyfikacja danych.

    Wymaga uprawnień administratora do wyświetlania reguł DLP i zarządzania nimi.

  2. W sekcji Klasyfikacja AI kliknij Wyświetl zapisane modele.
  3. Na stronie Lista modeli kliknij Działania obok modelu lub instrukcji, a następnie wybierz Usuń model lub Usuń instrukcje. W oknie dialogowym wyświetlają się skutki usunięcia. Możesz zdecydować, czy zachować wcześniej zastosowane etykiety, czy je odrzucić:
    • Zachowaj zastosowane etykiety – etykiety wcześniej zastosowane przez dowolną wersję tych instrukcji pozostaną w plikach.
    • Usuń zastosowane etykiety – etykiety wcześniej zastosowane przez dowolną wersję tych instrukcji zostaną usunięte z plików. Usunięcie etykiet może potrwać do 2 tygodni. Etykiety nie zostaną usunięte, jeśli zostały zmodyfikowane przez użytkownika, reguły, inny model AI lub instrukcje Gemini.
  4. Zaznacz pole, aby potwierdzić: Przechodząc dalej, potwierdzasz, że tej czynności nie będzie można cofnąć.
  5. Aby kontynuować, kliknij Usuń model lub Usuń instrukcje.

Najczęstsze pytania

Etykiety do trenowania i etykiety klasyfikacji

Jakie są wymagania dotyczące etykiet do trenowania i etykiet klasyfikacji?

Zarówno etykieta klasyfikacji, jak i etykieta do trenowania muszą spełniać te kryteria:

  • Muszą mieć od 2 do 7 opcji.
  • Muszą mieć opcje w tej samej kolejności.
  • Muszą być opublikowane.
  • Muszą mieć etykiety z różnymi uprawnieniami dostępu. Etykieta do trenowania powinna być dostępna tylko dla wyznaczonych twórców etykiet, którzy mogą trenować model. Etykieta klasyfikacji może mieć szerszy zakres dostępu.

Jak ręcznie utworzyć etykietę do trenowania?

Chociaż najlepszym rozwiązaniem jest automatyczne utworzenie etykiety do trenowania podczas konfigurowania modelu, możesz utworzyć ją ręcznie w narzędziu menedżer etykiet, postępując zgodnie z tymi wytycznymi:
  • Sprawdź, czy etykieta spełnia wymagane kryteria.
  • Oznacz etykietę do trenowania słowem „trenowanie”, aby ułatwić wyznaczonym twórcom etykiet jej rozpoznawanie i stosowanie podczas tworzenia zbioru danych treningowych.
  • Dodaj pole opisu do etykiety do trenowania, aby pomóc wyznaczonym twórcom etykiet zrozumieć jej przeznaczenie.
  • Ustaw uprawnienia do etykiety tylko dla wyznaczonych twórców etykiet, czyli osób, które będą identyfikować pliki do trenowania modelu. Użyj do tego utworzonej przez Ciebie grupy konfiguracji dla twórców etykiet.

Czy mogę użyć etykiety klasyfikacji jako etykiety do trenowania?

Nie. Etykieta klasyfikacji i etykieta do trenowania to dwie inne etykiety. Etykieta wybrana jako etykieta klasyfikacji nie jest dostępna jako etykieta do trenowania.

Czy instrukcje do Gemini pozwalają Google używać moich danych prywatnych do trenowania modeli globalnych?

Nie. Wszystkie operacje są wykonywane w ściśle określonych granicach izolacji. Wewnętrzne treści Dysku i powiązane z nimi prompty pozostają bezpiecznie odizolowane w autoryzowanym środowisku Workspace i nie są używane do trenowania modeli Google. Więcej informacji o naszych zobowiązaniach dotyczących prywatności i bezpieczeństwa znajdziesz w Centrum prywatności.

Zbiory danych treningowych

Na jakich plikach najlepiej trenować model?

Aby uzyskać najlepsze rezultaty podczas trenowania modelu, poproś wyznaczonych twórców etykiet o przestrzeganie tych wytycznych:

  • Każdy plik musi zawierać co najmniej 500 znaków.
  • Należy wybrać pliki, które reprezentują treści tworzone, udostępniane i używane przez użytkowników w Twojej organizacji.
  • Należy oznaczyć mniej więcej taką samą liczbę plików (co najmniej 100) dla każdej opcji etykiety. Pomaga to modelowi w pełni zrozumieć Twoje dane i poprawić wyniki.
  • Należy uwzględnić różne, reprezentatywne pliki dla każdego typu opcji. Nie należy oznaczać na przykład 100 CV jako zbioru przykładowych plików w kategorii „Ściśle tajne”, jeśli wśród ściśle tajnych plików w Twojej organizacji często występują również umowy.
  • Etykietę do trenowania należy stosować tylko do plików należących do Twojej organizacji, czyli do plików, których właścicielami są bezpośrednio użytkownicy, lub do plików przechowywanych na dyskach współdzielonych. Klasyfikacja AI nie przetwarza plików należących do użytkowników zewnętrznych ani plików znajdujących się na zewnętrznych dyskach współdzielonych.

Czy model można trenować na podstawie plików wcześniej oznaczonych etykietą?

Trenowanie na podstawie plików wcześniej oznaczonych etykietą nie jest obecnie możliwe. Etykieta do trenowania modelu musi być repliką etykiety, którą model będzie automatycznie stosować do plików, ale nie może to być ta sama etykieta.

Czy model można trenować w przypadku wielu języków?

Model obsługuje wiele języków, ale w danych treningowych należy uwzględnić reprezentacyjne przykłady plików dla każdego typu i języka opcji. Zwiększa to liczbę plików wymaganych do udanego wytrenowania modelu. Obsługiwane są tylko języki oparte na znakach łacińskich.

Jak obliczane są wyniki podczas trenowania?

Podczas trenowania model AI wykorzystuje 75% danych wejściowych, aby nauczyć się oznaczania plików etykietami, i rezerwuje 25% na potrzeby okresowego testowania swojego działania. Innymi słowy, model analizuje 25% plików oznaczonych etykietami tak, jakby nie wiedział, jaka etykieta została do nich zastosowana. Model AI Następnie sam wybiera etykietę i porównuje ją z etykietą zastosowaną przez wyznaczonego autora etykiet. Wyniki pokazują, jaka część zarezerwowanych plików otrzymała prawidłową etykietę.

Czy po wytrenowaniu modelu mogę go „zamrozić”, aby zatrzymać automatyczne ponowne trenowanie?

Modele klasyfikacji AI są trenowane na plikach na Dysku. Gdy te pliki zostaną usunięte (często dochodzi do tego zgodnie z harmonogramem przechowywania w Google Vault), model również musi zostać usunięty. Gwarantuje to, że zawartość tych plików nie będzie w żaden sposób przechowywana. Z tego powodu ponowne trenowanie modelu odbywa się w sposób ciągły i nie można go wstrzymać.

Czy użytkownicy mogą zmieniać lub poprawiać etykiety i wartości pól?

Użytkownicy z uprawnieniami mogą zaktualizować etykietę lub wartość pola, ale klasyfikacja AI nie zmieni modelu klasyfikacji na podstawie tej zmiany. Jeśli zauważysz, że model nieprawidłowo zastosował etykiety i wartości pól, możesz poprosić wyznaczonych twórców etykiet o przypisanie do plików prawidłowej etykiety do trenowania. Klasyfikacja AI uwzględni te dane w kolejnym cyklu samouczenia się modelu.

Automatyczne stosowanie

Czy klasyfikacja AI może oceniać obrazy, filmy i pliki audio?

Klasyfikacja AI korzysta z tego samego przetwarzania tekstu podlegającego indeksowaniu co DLP dla Dysku. Każdy plik, z którego Dysk może wyodrębnić tekst podlegający indeksowaniu, może zostać oceniony pod kątem etykiet stosowanych przez klasyfikację AI. Obejmuje to optyczne rozpoznawanie znaków (OCR) w celu wyodrębniania tekstu z obrazów. Klasyfikacja AI nie ocenia jednak plików wideo ani audio.

Czy klasyfikacja AI działa w przypadku oznaczania tylko treści o charakterze kontrowersyjnym?

Klasyfikacja AI koncentruje się na treściach poufnych, ale na potrzeby automatycznego oznaczania etykietami można wytrenować każdą etykietę z maksymalnie 4 opcjami. Etykiety klasyfikacji są też używane na potrzeby kontroli, zapewniania znajdowalności i zarządzania przechowywaniem.

Czy klasyfikacja AI działa, gdy włączone jest szyfrowanie po stronie klienta?

Google nie może odszyfrować plików zaszyfrowanych po stronie klienta (może to zrobić tylko Twój prywatny klucz szyfrowania), więc klasyfikacja AI nie może trenować na plikach zaszyfrowanych w ten sposób ani automatycznie stosować do nich etykiet.

Jak i kiedy klasyfikacja AI poprawia automatycznie zastosowane etykiety?

Po włączeniu automatycznego stosowania funkcja klasyfikacji AI skanuje i klasyfikuje wszystkie pliki w spoczynku, z których można wyodrębnić wystarczającą ilość tekstu. Te pliki są skanowane co najmniej raz.

Klasyfikacja AI okresowo ponownie przetwarza pliki w miarę modyfikowania treści. Zmiany treści mogą spowodować inną prognozę dla pliku. Jeśli klasyfikacja AI zawiera zarówno starą, jak i nową opcję prognozowaną dla pliku, preferowana jest opcja znajdująca się wyżej na liście opcji. Jeśli na przykład pole ma 3 opcje wymienione w menedżerze etykiet:

  • Poufny
  • Wewnętrzny
  • Publiczna

Załóżmy, że klasyfikacja AI zaklasyfikowała plik jako Wewnętrzny, a jego treść uległa zmianie, przez co model klasyfikacji AI przewiduje, że plik jest Poufny. W takim przypadku klasyfikacja pliku zostanie zmieniona na Poufny. Jeśli jednak model klasyfikacji AI przewiduje, że plik jest Publiczny, pozostanie on sklasyfikowany jako Wewnętrzny.

Klasyfikacja AI nie sprawdza automatycznie zastosowanych etykiet ani wartości pól, które zostały sprawdzone lub zmodyfikowane przez użytkowników.

Jeśli model się zmieni, czy automatycznie ponownie oceni istniejące pliki?

Pliki są przetwarzane przez najnowszy model podczas ich tworzenia lub modyfikowania. Gdy pojawi się nowa wersja modelu, istniejące pliki nie są automatycznie przetwarzane ponownie. Model może jednak okresowo przetwarzać wszystkie Twoje pliki w najnowszej wersji, niezależnie od konkretnych aktualizacji lub ponownego trenowania.

Czy klasyfikacja AI ma wyższy priorytet niż inne metody klasyfikacji, gdy kilka z nich jest aktywnych?

Klasyfikację danych można zastąpić. Dane klasyfikowane są w tej kolejności:
  1. Reguła DLP bez zastąpienia użytkownika
  2. Klasyfikacja ręczna
  3. Reguła DLP z zastąpieniem użytkownika
  4. Klasyfikacja AI
  5. Klasyfikacja domyślna
Usunięcie etykiety lub pola umożliwia zastosowanie mechanizmu klasyfikacji niższego poziomu. Przykładowo klasyfikacja AI może zastosować do pliku etykietę, która została wcześniej usunięta przez użytkownika.

Do jakich typów plików klasyfikacja AI może stosować etykiety?

  • Klasyfikacja AI korzysta z tego samego przetwarzania tekstu podlegającego indeksowaniu co DLP dla Dysku. Szczegółowe informacje znajdziesz na liście typów plików skanowanych przez DLP. Pliki audio i wideo nie są obsługiwane.
  • Aby klasyfikacja AI mogła zastosować etykietę, plik musi zawierać minimalną ilość tekstu. Oznacza to, że niektóre pliki, np. bardzo krótkie dokumenty i obrazy z małą ilością tekstu, mogą nie zostać zaklasyfikowane.

Co się stanie, gdy opcja automatycznego stosowania etykiet zostanie wyłączona?

Jeśli podczas skanowania według prognozy plik ma opcję, w przypadku której automatyczne stosowanie jest wyłączone, klasyfikacja AI nie zastosuje do niego żadnej etykiety ani wartości pola.

Pliki, które zostały wcześniej oznaczone etykietą AI, zachowują zastosowaną etykietę i wartości opcji nawet po wyłączeniu tej opcji.

Czy mogę wycofać zmiany automatycznie zastosowanych etykiet?

Nie można cofnąć zastosowania etykiet. Przed szerokim wdrożeniem zalecamy udoskonalenie i przetestowanie modeli na małej grupie odbiorców. Możesz na przykład trenować modele przy użyciu tymczasowej etykiety. Gdy skuteczność modelu będzie zadowalająca, możesz go „zresetować”, usuwając go i tworząc nowy model z tą samą etykietą do trenowania (tym samym zbiorem danych treningowych), ale z Twoją stałą etykietą.

Gemini i modele niestandardowe

Czy klasyfikacja AI z instrukcjami Gemini całkowicie zastępuje dotychczasowe modele niestandardowe?

Nie. Instrukcje Gemini stanowią alternatywę uzupełniającą. Modele klasyczne tworzą odizolowany model dostosowany do klienta, który jest dopasowany wyłącznie do jego historycznych wzorców danych, natomiast instrukcje Gemini wykorzystują nasz wstępnie wytrenowany model podstawowy do oceny treści na podstawie niestandardowych reguł tekstowych napisanych przez Ciebie.

Jak zdecydować, kiedy używać instrukcji Gemini, a kiedy klasycznych modeli?

Organizacje nie muszą wybierać tylko jednej architektury. Oba tryby można stosować równocześnie, aby obsługiwać różne etapy klasyfikacji danych w zależności od potrzeb organizacji.

Z jakich elementów składają się instrukcje klasyfikacji danych?

Instrukcja klasyfikacji to strukturalny plan przekazywany Gemini. Aby pomóc Gemini w klasyfikowaniu danych, podaj jasne, wyczerpujące szczegóły instrukcji dotyczące każdej opcji etykiety, w tym co ona reprezentuje, jak Gemini ma ją identyfikować i jak postępować w przypadku wyjątków.

Działanie klasyfikacji funkcji AI od Gemini

Dlaczego Gemini czasami przypisuje różne opcje etykiet do identycznych lub prawie identycznych plików?

Modele LLM są z natury probabilistyczne, a nie deterministyczne. Tradycyjny kod postępuje zgodnie z ustaloną logiką, aby generować identyczne dane wyjściowe dla danych wejściowych, natomiast LLM generują odpowiedzi na podstawie prawdopodobieństwa statystycznego. Na ten proces mogą wpływać parametry wewnętrzne, takie jak „temperatura”, które wprowadzają pewien stopień zmienności w wyborach modelu. Ponadto kilka zmiennych zewnętrznych może zmienić wewnętrzne rozumowanie modelu i prowadzić do różnych wyników w przypadku identycznych lub prawie identycznych plików. Obejmują one aktualizacje wersji modelu bazowego, ulepszenia instrukcji na poziomie systemu, a nawet konkretną datę i godzinę żądania klasyfikacji. Dzięki temu Gemini ocenia każdy plik w unikalnym oknie kontekstowym, co może czasami prowadzić do przypisania różnych etykiet.