AI 분류를 사용하여 Google Drive 파일에 자동으로 라벨 지정하기

이 기능은 Frontline Plus 및 Enterprise Plus에 포함되어 있습니다. Gemini Enterprise–Legacy, Gemini Education Premium, AI Security 부가기능에도 포함되어 있습니다. 부가기능 비교하기

Google Drive 데이터 분류 라벨은 파일의 설명 메타데이터 역할을 하며, 데이터 보호, 감사 조사, 보관과 같은 다양한 기능에 사용할 수 있습니다. Google Drive의 AI 분류는 프로그래밍 없이 파일에 라벨을 지정하는 작업을 자동화합니다.

AI 분류 방법에는 다음 두 가지가 있습니다.

  • 맞춤 모델: 조직의 학습 데이터 세트를 기반으로 조직에 고유한 전문 머신러닝 모델을 빌드합니다. 관리자는 모델이 학습하는 데이터를 관리합니다. 모델은 조직에 고유합니다.
  • Gemini 사용 (베타)Gemini 대규모 언어 모델 (LLM)을 사용하여 파일 콘텐츠를 검사하고 사용자가 정의한 맞춤설정 가능한 일반 언어 요청 사항에 따라 라벨을 자동으로 적용합니다. 이 방법은 사전 데이터 수집이나 모델 학습이 필요하지 않습니다.

총 5개의 고유한 AI 분류 맞춤 모델 또는 Gemini 명령어를 만들 수 있으며, 이 전체 한도 내에서 두 방법을 자유롭게 조합할 수 있습니다.

참고: AI 분류로 라벨을 지정하려면 파일이 공유 드라이브에 있거나 분류 라벨을 지원하는 라이선스를 보유한 사용자가 소유해야 합니다.

AI 분류 사용

Drive에서 새 파일과 기존 파일에 자동으로 라벨을 지정하도록 AI 분류를 설정하는 기본 단계는 다음과 같습니다.

1. 맞춤 모델 만들기 또는 Gemini 요청 사항: 파일에 자동으로 적용할 분류 라벨을 선택하거나 만듭니다.

참고: 커스텀 모델을 만드는 경우 학습 라벨도 만듭니다. 모델이 데이터를 분류하는 방법을 학습하는 데 사용하는 예시 파일을 표시하는 데 사용됩니다.

2. (맞춤 모델만 해당) 모델 학습시키기: 라벨을 만든 후 지정된 라벨러가 학습 라벨로 Drive 파일을 분류하여 학습 데이터 세트를 만듭니다. 그런 다음 모델은 데이터 세트를 사용하여 민감한 파일을 분류하는 방법을 학습합니다.

3. AI 분류 사용 설정하기: 모델이 학습되거나 Gemini 안내가 설정되면 자동 적용이라는 파일 자동 라벨 지정 기능을 설정할 수 있습니다. 설정 과정에서 사용 설정할 라벨 옵션과 AI 분류를 통해 라벨을 적용할 파일의 소유자를 선택합니다. 그러면 모델 또는 안내에 따라 민감한 파일에 라벨이 지정됩니다.

4. 모델 모니터링하기: Drive 이벤트 로그를 사용하여 분류된 파일 수와 자동 적용된 라벨을 수락하거나 수정 (권한이 있는 경우)한 사용자 수를 모니터링할 수 있습니다.

시작하기 전에

  • 분류 라벨의 작동 방식과 생성 방법을 알아봅니다. 자세한 내용은 분류 라벨 관리자로 시작하기를 참고하세요.
  • 지정된 라벨러를 선택합니다. 민감한 파일에 학습 라벨을 수동으로 올바르게 적용할 수 있는 조직의 사용자 그룹입니다.
  • 지정된 라벨러 전용으로 구성 적용 그룹을 만듭니다. 자세한 안내는 구성 적용 그룹으로 서비스 설정 맞춤설정하기를 참고하세요.
  • 관리자 계정에서 분류 라벨 관리, DLP 규칙 관리, DLP 규칙 보기 권한을 사용 설정합니다.

모델 만들기

모델을 만들려면 먼저 기존 분류 라벨을 선택하거나 새 라벨을 만들어야 합니다. 다음으로 지정된 라벨러가 사용할 일치하는 학습 라벨을 만들어야 합니다. 자동으로 (권장) 또는 라벨 관리자를 사용하여 수동으로 만들 수 있습니다.

분류 라벨 선택 또는 만들기

Drive 및 Docs에서 분류가 사용 설정되어 있어야 합니다. 학습이 완료되면 AI 모델이 민감한 Drive 파일에 분류 라벨을 자동으로 적용합니다. 모델은 라벨당 하나의 필드만 사용하여 학습되며, 이 필드는 배지 목록 또는 옵션 목록이어야 합니다.

문서에 눈에 띄게 표시되므로 배지가 있는 민감도 라벨을 사용하는 것이 좋습니다.

분류 라벨에 옵션 목록 또는 배지 목록 필드를 사용하는 경우 다음 조건을 충족해야 합니다.

  • 옵션이 2개 이상 7개 이하여야 합니다.
  • 게시되어야 합니다.

이러한 요구사항을 충족하는 기존 라벨이 있는 경우 이를 분류 라벨로 사용할 수 있습니다. 그렇지 않은 경우 라벨 관리자를 사용하여 모델을 설정하기 전이나 설정할 때 라벨을 만듭니다(이 페이지의 뒷부분 참고). 자세한 내용은 조직의 분류 라벨 만들기를 참고하세요.

학습 라벨 만들기

학습 라벨은 분류 라벨과 거의 동일하며 지정된 라벨러가 학습용으로만 사용합니다. 모델을 만들 때(이 페이지의 뒷부분 참고) 학습 라벨을 자동으로 만들어 분류 라벨과 일치하는지 확인할 수 있습니다.

모델을 설정하기 전이나 설정할 때 라벨 관리자를 사용하여 학습 라벨을 수동으로 만들 수도 있습니다. 자세한 내용은 이 페이지 뒷부분의 학습 라벨을 직접 만들려면 어떻게 해야 하나요?를 참고하세요.

모델 만들기

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 모델 만들기를 클릭합니다.
  3. 분류 라벨 목록에서 모델을 학습시킬 기존 분류 라벨과 필드를 선택하거나 라벨 만들기를 클릭한 다음 라벨 관리자를 사용하여 라벨을 만듭니다.

    라벨 관리자에서 라벨을 만든 경우 모델 만들기 페이지로 돌아갑니다. 목록에 새 라벨이 표시되려면 페이지를 새로고침해야 할 수 있습니다.

  4. 분류 라벨의 경우 필드 이름 목록에서 사용 가능한 필드를 선택합니다.
  5. 계속을 클릭합니다.
  6. (선택사항) 다음과 같이 분류 라벨과 일치하는 학습 라벨을 자동으로 만들어 게시합니다.
    1. 학습 라벨 만들기를 클릭합니다.
    2. 표시되는 메시지에서 라벨 권한 업데이트를 클릭합니다. 별도의 탭에서 라벨 관리자의 수정 모드로 라벨이 열립니다.
    3. 권한 다음 수정을 클릭한 다음 라벨러가 포함된 구성 적용 그룹에 라벨을 적용하고 값을 설정할 수 있음 권한을 부여합니다.
    4. 저장을 클릭하고 라벨 관리자 탭을 닫습니다.

      참고: 나중에 라벨 권한을 설정할 수도 있습니다. 하지만 라벨러만 학습 라벨에 액세스할 수 있어야 합니다.

  7. (선택사항) 이미 학습 라벨을 만든 경우 학습 라벨 목록에서 해당 라벨을 선택합니다.
  8. (선택사항) 지금 라벨 관리자로 이동을 클릭하여 직접 학습 라벨을 만듭니다.

    중요: 라벨이 학습 라벨 기준을 충족하는지 확인하고 라벨러만 액세스할 수 있도록 라벨 권한을 설정하세요. 자세한 내용은 이 페이지 뒷부분의 학습 라벨 가이드라인을 참고하세요.

    모델 만들기 페이지로 돌아갑니다. 목록에 새 학습 라벨이 표시되지 않으면 페이지를 새로고침해야 할 수 있습니다.

  9. 모델 만들기 페이지에서 계속을 클릭합니다.
  10. 모델을 설명하는 이름을 입력합니다.
  11. 모델 만들기를 클릭합니다.

모델을 만든 후 모델 세부정보 페이지에 선택한 학습 라벨과 분류 라벨이 표시됩니다.

모델 학습시키기

AI 모델을 학습시키려면 학습 데이터 세트를 만든 다음 초기 학습 실행을 시작해야 합니다. 학습 실행 중에 모델은 데이터 세트의 예시를 기반으로 학습합니다.

자동 재학습: 초기 학습이 실행된 이후 모델은 정확도를 개선하거나 유지하기 위해 2주마다 재학습됩니다. 사용자는 언제든지 모델의 재학습을 직접 진행할 수 있습니다. 학습이 실행될 때마다 새 모델이 출시되고 2주의 자동 재학습 일정이 재설정됩니다.

학습 데이터 세트 만들기

학습 데이터 세트를 만들려면 지정 라벨러가 라벨 옵션당 최소 100개의 파일에 학습 라벨을 적용해야 합니다. 예를 들어 라벨에 '알아야 함', '기밀', '공개'의 3가지 옵션이 있는 경우 학습 파일이 300개 이상 필요합니다. 하지만 일부 파일은 학습 데이터 세트에 적합하지 않을 수 있으므로 라벨 옵션당 100개 이상의 파일을 준비하는 것이 좋습니다. 학습을 위해 고품질 예에 라벨을 지정하는 방법에 대해 자세히 알아보세요.

참고: 학습 데이터 세트에는 최대 100만 개의 파일이 포함될 수 있습니다.

모델을 만들면 약 24시간 후에 학습을 위해 라벨이 지정된 파일 수를 자동으로 확인합니다. 그 후에는 하루 종일 지속적으로 확인합니다.

라벨이 지정된 파일 수를 확인하려면 다음 안내를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델의 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 패널에 있는 활성 모델의 학습 파일에서 라벨이 지정된 파일 수를 확인합니다.

모델에 학습을 위한 파일이 충분한 경우 학습 준비됨으로 표시됩니다.

학습 실행을 시작합니다

학습 실행은 일반적으로 4~6시간이 걸리지만 데이터 세트가 클수록 더 오래 걸릴 수 있습니다. 모델이 파일에 정확하게 라벨을 지정하는 방법을 학습하려면 학습을 여러 번 실행해야 할 수 있습니다.

학습 실행 중에 모델은 파일에 적용된 학습 라벨과 파일에 대해 선택한 분류를 비교하여 점수를 생성합니다. 자세한 내용은 점수는 어떻게 계산되나요?를 참고하세요.

학습 실행 후 모델의 정확도를 확인할 수 있습니다.

학습 실행을 시작하려면 다음 안내를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 학습 패널에서 학습 실행 시작을 클릭합니다.

    참고: 이 버튼은 라벨러가 최소 개수의 학습 파일에 라벨을 지정한 경우에만 사용할 수 있습니다.

학습 후: 모델 점수 확인하기

학습 실행이 완료되면 각 라벨 옵션에 대한 백분율 점수와 함께 모델이 출시됩니다. 각 점수(재현율 점수라고 함)는 자체 테스트 후 모델이 올바르게 분류한 학습 예시의 비율입니다.

  • 50%미만: 정확도가 낮습니다. 모델에 더 나은 데이터가 필요하며 아직 준비가 완료되지 않았습니다.
  • 50~80%: 정확도가 보통입니다. 모델이 제한적으로 준비되어 있을 수 있습니다.
  • 80%이상: 정확도가 높습니다. 모델이 조직의 파일을 분류할 준비가 되었습니다.

학습 실행 후 모델의 정확도를 확인하려면 다음 안내를 따르세요.

모델 세부정보 페이지의 다음에서 모델 점수를 확인할 수 있습니다.

  • 페이지 상단의 학습 결과 패널에 있는 현재 사용된 파일 및 점수
  • 현재 학습 데이터 세트 패널

Gemini 요청 사항 만들기

Gemini 요청 사항 세트를 만들려면 먼저 요청 사항이 포함된 사전 정의된 라벨을 선택하거나 기존 분류 라벨을 선택해야 합니다. 시작하기 전에 기존 라벨이 필요한 설정 기준을 충족하는지 확인하세요. 자세한 내용은 이 페이지의 분류 라벨 선택 또는 만들기를 참고하세요.

Gemini 요청 사항을 만들려면 다음 단계를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 Gemini 사용을 클릭합니다.
  3. Gemini가 적용할 라벨 선택 페이지에서 다음 옵션 중 하나를 선택합니다.
    • 수정 가능한 템플릿 안내와 함께 사전 정의된 라벨을 사용하려면 사전 정의된 라벨 적용을 선택합니다.
    • 조직의 기존 라벨 중 하나를 사용하려면 자체 라벨 적용을 선택합니다.
  4. 새 라벨이 필요한 경우 라벨 만들기를 클릭하여 새 브라우저 탭에서 라벨 관리자를 엽니다.
    • 참고: 라벨 관리자 탭에서 새 라벨을 만들고 게시한 후 Gemini를 사용하여 라벨 적용 탭으로 돌아가 페이지를 새로고침하여 사용 가능한 선택사항을 업데이트합니다.
  5. 자체 라벨 적용을 선택하는 경우 분류 라벨 드롭다운을 선택하고 라벨을 선택합니다.
  6. 필드 이름 드롭다운을 클릭하고 필드를 선택합니다.
  7. 계속을 클릭합니다.
  8. Gemini에 대한 요청 사항 세부정보 검토 페이지에서 Gemini가 조직의 데이터를 분류하는 데 도움이 되도록 모든 라벨 옵션에 명확하고 포괄적인 요청 사항을 입력합니다. 각 옵션에 다음 세부정보를 포함합니다.
    • 옵션이 나타내는 항목(예: 카테고리, 유형, 특징)
    • Gemini가 옵션을 식별하는 방법(예: 찾아야 할 단서 또는 키워드)
    • 옵션을 적용하지 않아야 하는 상황과 같은 예외를 Gemini가 처리하는 방법
  9. 계속을 클릭합니다.
  10. 자동 적용이 가능하도록 라벨 옵션 선택하기 페이지에서 Gemini가 자동으로 적용해야 하는 특정 라벨 옵션의 체크박스를 선택합니다.
    • 참고: Gemini는 선택되지 않은 옵션을 Drive의 파일에 적용하지 않습니다.
  11. 계속을 클릭합니다.
  12. 요청 사항 검토 및 이름 지정하기 페이지의 이름* 필드에 요청 사항의 설명이 포함된 이름을 입력합니다. 세부정보를 검토하고 확인하여 정확성을 보장합니다.
  13. 저장 또는 저장 및 자동 적용 설정을 클릭합니다.

AI 분류 사용 설정

Gemini 안내가 설정되거나 맞춤 모델이 최소 수준의 정확도 (50% 이상)를 달성하도록 학습되면 라벨 옵션을 선택하고 파일 라벨 자동 지정 또는 자동 적용을 사용 설정할 수 있습니다. 맞춤 모델로 최상의 결과를 얻으려면 모든 라벨 옵션의 모델 점수가 80% 이상에 도달할 때까지 기다리는 것이 좋습니다.

자동 적용을 사용 설정하려면 다음 단계를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 학습 패널에서 자동 적용 설정을 클릭합니다.

    참고: 이 버튼은 1개 이상의 라벨 옵션이 50%의 정확도에 도달한 경우에만 사용할 수 있습니다.

    또는 이전에 자동 적용을 설정한 경우 AI 라벨이 지정된 파일에서 자동 적용 수정을 클릭합니다.

  5. AI 모델이 자동 적용하도록 허용하려는 라벨 옵션의 체크박스를 선택합니다.
  6. 저장하고 계속하기를 클릭하여 모델이 라벨을 자동 적용할 파일의 소유자인 조직 단위 또는 그룹을 선택합니다. 기본 설정은 최상위 조직입니다.

    또는 저장을 클릭하여 나중에 사용자를 선택할 수 있습니다.

  7. 사용자를 선택한 경우 옆에서 조직 단위 또는 구성 적용 그룹을 선택합니다.

    그룹 설정은 조직 단위보다 우선 적용됩니다. 자세히 알아보기

  8. 사용: 아래 옵션 중 하나로 라벨이 자동 적용됨을 클릭합니다.
  9. 저장을 클릭합니다.

    모델 세부정보 페이지에서 규칙의 현재 자동 적용 상태사용으로 표시됩니다.

참고: Drive 이벤트 로그를 사용하여 AI 분류를 모니터링할 수 있습니다. 자세한 내용은 이 페이지 뒷부분의 AI 분류 라벨 이벤트 모니터링하기를 참고하세요.

AI 분류가 파일을 스캔하는 경우

사용자가 소유한 파일 및 공유 드라이브에 자동 적용이 사용 설정되면 AI 분류가 1~2주 이내에 저장 파일을 한 번 이상 스캔합니다. AI 분류는 파일이 업로드되거나 수정될 때마다 파일을 스캔하며, 적용된 라벨은 파일의 콘텐츠 변경사항에 따라 변경할 수 있습니다.

참고: Gemini 안내와 함께 AI 분류를 사용하는 경우 비활성 파일 스캔을 수동으로 사용 설정해야 합니다. 이 기능을 활성화하려면 안내 페이지에서 비활성 파일에 라벨 적용을 클릭하세요.

자동 적용 충돌이 처리되는 방법

데이터 보호 규칙

데이터 보호 규칙으로 설정된 라벨 값은 AI 분류보다 우선하며, 둘 다 기본 분류보다 우선 적용됩니다.

여러 맞춤 모델 또는 Gemini 요청 사항

2개 이상의 AI 분류 소스에서 동일한 라벨 필드의 서로 다른 라벨 옵션을 동일한 파일에 적용하려고 하면 라벨의 옵션 목록에서 더 높은 옵션이 적용됩니다. 예를 들어 라벨 관리자 필드에 다음의 세 가지 옵션이 있는 라벨이 있을 수 있습니다.

  1. 기밀
  2. 내부
  3. 공개

AI 분류 소스 1이 라벨을 기밀로 설정하려고 하고 소스 2가 동일한 파일에 라벨을 공개로 설정하려고 하면 라벨의 옵션 목록에서 더 높은 기밀이 적용됩니다. 규칙을 설정하기 전에 라벨의 필드 옵션이 원하는 우선순위로 나열되어 있는지 확인하세요.

사용자가 적용한 라벨

사용자가 파일에 적용하는 라벨은 AI가 적용한 라벨보다 우선합니다. 즉, AI 분류는 사용자가 이전에 설정한 라벨을 수정하지 않습니다.

참고: 사용자가 AI 라벨이 지정된 파일을 수락하거나 수정하면 라벨이 '사용자 적용'으로 간주되며 AI 분류는 더 이상 값을 수정하지 않습니다.

모델 모니터링

Drive 이벤트 로그에서 AI 분류가 파일에 라벨을 지정하는 방법에 대한 세부정보를 확인하세요. 각 라벨 옵션에 대해 로그에는 자동 적용을 사용하여 분류된 파일 수와 자동 적용된 라벨을 수락하거나 수정한 사용자 수가 표시됩니다. 사용자가 자동 적용된 라벨에 대해 작업을 실행하려면 권한이 있어야 합니다.

자동 적용된 라벨과 상호작용하는 데 필요한 사용자 권한

사용자가 자동 적용된 라벨과 상호작용하려면 파일 및 라벨 권한이 필요합니다. 라벨 관리자에서 분류 라벨에 대한 권한을 설정할 수 있습니다. 자세한 내용은 조직의 분류 라벨 만들기를 참고하세요.

  • 자동 적용된 라벨을 보려면 사용자에게 분류 라벨에 대한 이 라벨을 볼 수 있음 권한이 있어야 합니다.
  • 자동 적용된 라벨을 수락하고 수정하려면 분류 라벨에 대한 라벨을 적용하고 값을 설정할 수 있음 권한이 있어야 하며 파일의 편집자 또는 소유자여야 합니다.

Drive 이벤트 로그에서 AI 분류 이벤트 보기

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 AI 라벨이 지정된 파일에서 이벤트를 볼 라벨 옵션의 파일 보기를 선택합니다.

    보안 조사 도구가 새 탭에서 열리고 두 개의 AI 분류 관련 이벤트(라벨 적용됨라벨 필드 값 변경됨)에 대한 Drive 이벤트 로그 검색 결과가 표시됩니다.

  4. 이벤트 설명을 클릭하면 다음과 같은 다음과 같은 추가 세부정보를 확인할 수 있습니다.
    • 라벨이 지정된 문서의 이름 및 유형
    • 문서에 할당된 라벨 필드 값(예: 기밀 또는 제한됨)

Gemini 요청 사항의 사용자 수락률 보기

AI 분류의 모델 세부정보 페이지에서 사용자 수용도 차트는 지난 180일 동안의 사용자 피드백에서 파생된 안내의 실적 데이터를 표시합니다.

측정항목은 다음과 같습니다.

  • 사용자 검토: Gemini로 적용된 라벨 옵션을 수락하거나 수정하기 위해 자동 라벨 배너와 상호작용한 사용자의 총수입니다.
  • 사용자가 수락함: Gemini에서 제안한 특정 라벨을 유지하기로 선택한 사용자의 총수입니다.

모델 관리하기

분류 라벨의 자동 적용 사용 중지하기

모든 라벨 옵션 또는 특정 라벨 옵션의 자동 적용을 사용 중지하려면 다음 안내를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. AI 라벨이 지정된 파일에서 자동 적용 수정을 클릭합니다.
  5. 자동 적용을 사용 중지하려는 라벨 옵션의 체크박스를 선택 해제합니다.

    자동 적용을 완전히 중지하려면 모든 옵션을 선택 해제하세요.

특정 조직 단위 또는 그룹에 대한 자동 적용을 완전히 사용 중지하려면 다음 안내를 따르세요.

특정 조직 단위 또는 그룹의 사용자가 소유한 콘텐츠에 대해 자동 적용을 완전히 사용 중지할 수 있습니다.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 추가 작업 메뉴에서 자동 적용 관리 다음 사용 설정된 OU/그룹 업데이트를 클릭합니다.
  5. 왼쪽의 조직 단위 또는 그룹을 클릭하여 선택합니다.
  6. 사용 중지: 라벨이 자동 적용되지 않음을 선택합니다.
  7. 저장을 클릭합니다.

맞춤 모델 또는 Gemini 요청 사항 삭제하기

예를 들어 정확도가 허용되지 않는 경우 맞춤 모델이나 Gemini 안내를 삭제해야 할 수 있습니다. 맞춤 모델 또는 Gemini 요청 사항을 삭제하면 모든 AI 분류 설정이 영구 삭제됩니다. 참고:

  • 모델 또는 Gemini 요청 사항에 사용된 라벨이 AI 분류 설정에서 연결 해제되고 모델 또는 Gemini 요청 사항의 기록이 삭제됩니다. 하지만 라벨 자체는 삭제되지 않으며 라벨 관리자에서 계속 관리할 수 있습니다.
  • (맞춤 모델만 해당) 학습 라벨은 파일에 그대로 유지됩니다. 모델을 삭제한 후 동일한 학습 라벨을 사용하도록 새 맞춤 모델을 구성할 수 있습니다. 기존 학습 라벨 및 학습 파일로 다시 학습시키면 모델의 성능이 비슷해집니다.
  • 모델에 대해 사용 설정된 라벨 자동 적용이 즉시 중지됩니다. 사용자가 수락하거나 수정하지 않은 파일에 이전에 자동 적용된 라벨을 삭제하거나 유지할 수 있습니다.
  • 동일한 분류 라벨을 사용하여 새 모델 또는 Gemini 요청 사항을 다시 만들면 AI 분류 기능이 이전 분류 결과를 덮어씁니다. 이를 통해 조직의 Drive 파일을 다시 처리할 수 있으며, 이는 사용을 시작한 이후 모델 또는 지침의 품질이 크게 개선된 경우에 유용할 수 있습니다.

모델 또는 안내를 삭제하려면 다음 단계를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안 다음 액세스 및 데이터 관리 다음 데이터 분류로 이동합니다.

    DLP 규칙 보기 및 DLP 규칙 관리 관리자 권한이 필요합니다.

  2. AI 분류 섹션에서 저장된 모델 보기를 클릭합니다.
  3. 모델 목록 페이지에서 모델 또는 지침 옆에 있는 작업을 클릭하고 모델 삭제 또는 지침 삭제를 선택합니다. 대화상자에는 삭제의 효과가 나열되며 이전에 적용된 라벨을 유지할지 삭제할지 결정할 수 있습니다.
    • 적용된 라벨 유지: 이 안내의 모든 버전에서 이전에 적용된 라벨은 파일에 계속 남아 있게 됩니다.
    • 적용된 라벨 삭제: 이 요청 사항의 모든 버전에 의해 이전에 적용된 라벨이 파일에서 삭제됩니다. 라벨이 삭제되는 데 최대 2주가 걸릴 수 있습니다. 사용자, 규칙, 다른 AI 모델 또는 Gemini 요청 사항에 의해 수정된 라벨은 삭제되지 않습니다.
  4. 계속 진행하면 이 작업은 되돌릴 수 없음을 확인한 것으로 간주됩니다.라는 메시지를 확인했음을 인정하는 체크박스를 선택합니다.
  5. 계속하려면 모델 삭제 또는 요청 사항 삭제를 클릭합니다.

FAQ

학습 및 분류 라벨

학습 및 분류 라벨의 요구사항은 무엇인가요?

분류 라벨과 학습 라벨은 모두 다음 기준을 충족해야 합니다.

  • 최소 2개에서 최대 7개의 옵션이 있어야 합니다.
  • 옵션이 동일한 순서로 정렬되어 있어야 합니다.
  • 게시되어야 합니다.
  • 라벨별로 액세스 권한이 달라야 합니다. 학습 라벨은 모델을 학습시킬 수 있는 지정된 라벨러만 사용할 수 있어야 합니다. 분류 라벨은 더 광범위한 액세스 권한을 가질 수 있습니다.

학습 라벨을 직접 만들려면 어떻게 해야 하나요?

모델을 설정할 때 학습 라벨을 자동으로 만드는 것이 좋지만 다음 가이드라인에 따라 라벨 관리자에서 직접 만들 수도 있습니다.
  • 라벨이 필수 라벨 기준을 충족하는지 확인합니다.
  • 학습 라벨을 '학습'이라는 단어로 식별하여 지정된 라벨러가 학습 데이터 세트를 만들 때 라벨을 쉽게 인식하고 적용할 수 있도록 합니다.
  • 학습 라벨에 설명 필드를 추가하여 지정된 라벨러가 목적을 더 쉽게 이해할 수 있도록 합니다.
  • 라벨러용으로 만든 구성 적용 그룹을 사용하여 모델 학습을 위해 파일을 식별할 지정된 라벨러에게만 라벨 권한을 설정해야 합니다.

분류 라벨을 학습 라벨로 사용할 수 있나요?

아니요. 분류 라벨과 학습 라벨은 달라야 합니다. 분류 라벨로 선택한 라벨은 학습 라벨로 사용할 수 없습니다.

Gemini 요청 사항을 통해 Google이 내 비공개 데이터를 사용하여 전역 모델을 학습할 수 있나요?

아니요. 모든 작업은 엄격한 격리 경계 내에서 발생합니다. 내부 Drive 콘텐츠와 연결된 프롬프트는 승인된 Workspace 환경 내에서 안전하게 격리되며 Google 모델을 학습하는 데 사용되지 않습니다. 개인 정보 보호 허브에서 개인 정보 보호 및 보안을 위한 Google의 노력에 대해 자세히 알아보세요.

학습 데이터 세트

모델 학습에 적합한 파일은 무엇인가요?

모델 학습에서 최상의 결과를 얻으려면 지정된 라벨러가 다음 가이드라인을 따라야 합니다.

  • 각 파일의 문자 수가 500자(영문 기준) 이상이어야 합니다.
  • 사용자가 조직에서 만들고 공유하고 사용하는 콘텐츠를 나타내는 파일을 선택합니다.
  • 각 옵션에 대해 100개 이상의 파일을 사용하여 라벨 옵션당 대략 동일한 양의 파일에 라벨을 지정합니다. 이렇게 하면 모델이 데이터를 종합적으로 이해하고 점수를 향상시키는 데 도움이 됩니다.
  • 각 옵션 유형에 대한 다양한 대표적인 파일을 포함합니다. 예를 들어 계약이 조직의 일반적인 일급 보안 정보 파일 형식이기도 한 경우 이력서 100개를 일급 기밀에 대한 전체 예시 파일 조합으로 라벨을 지정해서는 안 됩니다.
  • 조직이 소유한 파일에만 학습 라벨을 적용합니다. 사용자가 직접 소유한 파일 또는 공유 드라이브에 저장된 파일이 이에 해당합니다. AI 분류는 외부 사용자가 소유하거나 외부 공유 드라이브에 있는 파일을 처리하지 않습니다.

이전에 라벨이 지정된 파일로 모델을 학습시킬 수 있나요?

이전에 라벨이 지정된 파일에 대한 학습은 현재 불가능합니다. 모델에는 파일에 자동으로 적용할 라벨의 복제본인 학습 라벨이 필요하지만 동일한 라벨일 수는 없습니다.

모델을 여러 언어로 학습시킬 수 있나요?

이 모델은 여러 언어를 지원합니다. 하지만 각 옵션 유형과 언어에 대한 대표 샘플 파일이 학습 데이터에 포함되어야 합니다. 이렇게 하면 모델을 성공적으로 학습시키는 데 필요한 파일 수가 늘어납니다. 라틴 문자 기반 언어만 지원됩니다.

학습 중에 점수는 어떻게 계산되나요?

학습 중에 AI 모델은 입력 데이터의 75%를 파일에 라벨을 지정하는 방법을 학습하는 데 사용하고, 주기적으로 자체 성능을 테스트하기 위해 25%를 사용합니다. 즉, 라벨이 지정된 파일 중 25% 에서 모델은 어떤 라벨이 적용되었는지 모르는 것처럼 해당 파일을 분석합니다. 그러면 AI 모델이 자체적으로 라벨을 선택하고 선택한 라벨을 지정된 라벨러가 적용한 실제 라벨과 비교합니다. 점수는 올바른 라벨이 바르게 할당된 예약된 파일의 비율을 보여줍니다.

모델을 학습시킨 후 자동으로 재학습되지 않도록 '고정'할 수 있나요?

AI 분류 모델은 Drive의 파일을 사용하여 학습합니다. 이러한 파일이 삭제되면(Google Vault를 통한 보관 일정에 따라) 파일의 콘텐츠가 어떤 방식으로든 유지되지 않도록 모델도 삭제해야 합니다. 따라서 모델 재학습은 계속 반복해서 실행되며 정지할 수 없습니다.

사용자가 라벨 및 필드 값을 변경하거나 수정할 수 있나요?

권한이 있는 사용자는 라벨 또는 필드 값을 업데이트할 수 있지만 AI 분류는 이러한 변경사항을 기반으로 분류 모델을 수정하지 않습니다. 모델이 라벨과 필드 값을 잘못 적용한 경우 지정된 라벨러에게 파일에 올바른 학습 라벨을 할당해 달라고 요청할 수 있습니다. 그러면 AI 분류가 이 데이터를 다음 모델 자체 학습 주기에 통합합니다.

자동 적용하기

AI 분류가 이미지, 동영상, 오디오 파일을 평가할 수 있나요?

AI 분류는 Drive DLP와 동일한 색인 생성 가능한 텍스트 처리를 사용합니다. Drive가 색인 생성 가능한 텍스트를 추출할 수 있는 모든 파일은 AI 분류가 적용된 라벨을 평가할 수 있습니다. 여기에는 이미지에서 텍스트를 추출하는 광학 문자 인식(OCR)이 포함됩니다. 하지만 AI 분류는 동영상 또는 오디오 파일을 평가하지 않습니다.

AI 분류는 민감한 콘텐츠에만 라벨을 지정하나요?

민감한 콘텐츠가 AI 분류의 주요 중점이지만 최대 4개의 옵션으로 모든 라벨을 자동 라벨 지정을 위해 학습시킬 수 있습니다. 분류 라벨은 감사, 검색성, 보관 관리에도 사용됩니다.

클라이언트 측 암호화 (CSE)가 사용 설정된 경우 AI 분류가 작동하나요?

Google은 CSE로 암호화된 파일을 복호화할 수 없으므로(비공개 암호화 키만 가능) AI 분류는 CSE로 암호화된 파일을 학습할 수 없으며 이러한 파일에 자동으로 라벨을 적용할 수 없습니다.

AI 분류는 언제 어떻게 자동 적용된 라벨을 수정하나요?

자동 적용이 사용 설정되면 AI 분류가 충분한 텍스트를 추출할 수 있는 모든 저장 파일을 스캔하고 분류합니다. 이 파일은 한 번 이상 스캔됩니다.

AI 분류는 콘텐츠가 수정될 때마다 파일을 주기적으로 다시 처리합니다. 콘텐츠가 변경되면 파일에 대한 예측이 달라질 수 있습니다. AI 분류에 파일에 대한 이전 및 새 예측 옵션이 모두 있는 경우 옵션 목록에서 더 높은 옵션이 우선적으로 선택됩니다. 라벨 관리자 필드에 세 가지 옵션이 있는 경우의 예

  • 기밀
  • 내부
  • 공개

AI 분류가 파일을 내부로 분류하고 콘텐츠가 변경되어 AI 분류 모델이 기밀을 예측한다고 가정해 보겠습니다. 이 경우 파일의 분류가 기밀로 변경됩니다. 하지만 AI 분류 모델이 공개로 예측하면 파일의 분류는 내부로 유지됩니다.

AI 분류는 사용자가 검토하거나 수정한 자동 적용 라벨 및 필드 값을 수정하지 않습니다.

모델이 변경되면 모델이 기존 파일을 자동으로 재평가하나요?

파일이 생성되거나 수정되면 최신 모델에 의해 처리됩니다. 새 모델 버전이 출시되어도 기존 파일이 자동으로 다시 처리되지는 않습니다. 하지만 모델은 특정 모델 업데이트나 재학습과 관계없이 최신 버전으로 모든 파일을 주기적으로 다시 처리할 수 있습니다.

여러 분류가 활성화된 경우 AI 분류가 다른 분류 방법보다 우선 적용되나요?

데이터 분류는 재정의할 수 있습니다. 데이터 분류는 다음 순서로 수행됩니다.
  1. 사용자 덮어쓰기가 없는 DLP 규칙
  2. 수동 분류
  3. 사용자 덮어쓰기가 포함된 DLP 규칙
  4. AI 분류
  5. 기본 분류
라벨 또는 필드를 삭제하면 하위 계층 분류 메커니즘이 적용될 수 있습니다. 예를 들어 사용자가 라벨을 삭제한 파일에 나중에 AI 분류에 의해 동일한 라벨이 자동 적용될 수 있습니다.

AI 분류가 라벨을 적용할 수 있는 파일 유형은 무엇인가요?

  • AI 분류는 Drive DLP와 동일한 색인 생성 가능한 텍스트 처리를 사용합니다. 자세한 내용은 DLP에서 검사하는 파일 형식 목록을 참고하세요. 오디오 및 동영상 파일은 지원되지 않습니다.
  • AI 분류에서 라벨을 적용하려면 파일에 최소한의 텍스트가 있어야 합니다. 따라서 매우 짧은 문서나 텍스트가 적은 이미지와 같은 일부 파일은 분류되지 않을 수 있습니다.

자동 적용 옵션을 사용 중지하면 어떻게 되나요?

스캔 중에 파일에 자동 적용이 사용 중지된 옵션이 있을 것으로 예상되는 경우 AI 분류는 파일에 라벨 또는 필드 값을 적용하지 않습니다.

AI 분류가 이전에 라벨을 지정한 파일은 옵션이 사용 중지된 후에도 적용된 라벨 및 옵션 값을 유지합니다.

자동 적용된 라벨을 롤백할 수 있나요?

라벨 적용을 실행취소할 수 없습니다. 광범위하게 배포하기 전에 소규모 잠재고객을 대상으로 모델을 개선하고 테스트하는 것이 좋습니다. 예를 들어 임시 라벨로 모델을 학습시킬 수 있습니다. 그런 다음 모델 성능이 만족스러우면 모델을 삭제하고 동일한 학습 라벨(동일한 학습 데이터 세트)을 사용하되 영구 라벨을 사용하는 새 모델을 만들어 모델을 '재설정'할 수 있습니다.

Gemini 및 맞춤 모델

Gemini 안내를 사용한 AI 분류가 기존 맞춤 모델을 완전히 대체하나요?

아니요. Gemini 요청 사항은 보완적인 대안으로 작동합니다. 클래식 모델은 이전 데이터 패턴에 맞게 맞춤설정된 격리된 고객별 모델을 빌드하는 반면, Gemini 명령어는 사전 학습된 파운데이션 모델을 사용하여 사용자가 작성한 맞춤 텍스트 기반 규칙에 따라 콘텐츠를 평가합니다.

Gemini 안내 또는 클래식 모델을 언제 사용해야 하나요?

조직에서 단일 아키텍처만 선택할 필요는 없습니다. 두 모드를 함께 사용하여 조직의 요구사항에 따라 데이터 분류의 다양한 단계를 지원할 수 있습니다.

데이터 분류 안내는 어떤 요소로 구성되나요?

분류 요청 사항은 Gemini에 제공되는 구조화된 청사진입니다. Gemini가 데이터를 분류하는 데 도움이 되도록 옵션이 나타내는 내용, Gemini가 옵션을 식별하는 방법, 예외를 처리하는 방법 등 모든 라벨 옵션에 명확하고 포괄적인 요청 사항 세부정보를 입력하세요.

Gemini AI 분류 동작

Gemini가 동일하거나 거의 동일한 파일에 서로 다른 라벨 옵션을 할당하는 이유는 무엇인가요?

LLM은 본질적으로 결정론적이기보다는 확률적입니다. 기존 코드는 고정된 논리에 따라 특정 입력에 대해 동일한 출력을 생성하지만, LLM은 통계적 확률에 따라 대답을 생성합니다. 이 프로세스는 모델의 선택에 어느 정도의 변동성을 도입하는 '온도'와 같은 내부 매개변수의 영향을 받을 수 있습니다. 또한 여러 외부 변수가 모델의 내부 추론을 변경하여 동일하거나 거의 동일한 파일에 대해 다른 결과가 나올 수 있습니다. 이러한 요인에는 기본 모델 버전 업데이트, 시스템 수준 안내 개선, 분류 요청의 구체적인 날짜와 시간 등이 포함됩니다. 따라서 이러한 동적 요소를 통해 Gemini는 고유한 컨텍스트 창 내에서 각 파일을 평가하며, 이로 인해 라벨이 다르게 할당되는 경우가 있습니다.