AI 분류를 사용하여 Google Drive 파일에 자동으로 라벨 지정하기

이 기능은 Frontline Plus 및 Enterprise Plus에 포함되어 있습니다. Gemini Enterprise–Legacy, Gemini Education Premium, AI Security 부가기능에도 포함되어 있습니다. 부가기능 비교하기

AI 분류는 조직에서 학습시킨 맞춤형 AI 모델을 사용하여 프로그래밍 없이 Google Drive에서 조직의 민감한 콘텐츠에 자동으로 라벨을 지정할 수 있습니다. 관리자는 모델이 학습한 데이터를 관리하므로 각 모델은 조직별로 고유하며 해당 조직에서만 사용할 수 있습니다. 조직에 최대 5개의 고유한 AI 분류 모델을 만들 수 있습니다.

데이터 보호 규칙, Vault 등의 보안 정책에서 AI가 분류한 파일을 활용할 수 있습니다.

참고: AI 분류로 라벨을 지정하려면 파일이 공유 드라이브에 있거나 분류 라벨을 지원하는 라이선스를 보유한 사용자가 소유해야 합니다.

AI 분류 개요

Drive에서 새 파일과 기존 파일에 자동으로 라벨을 지정하도록 AI 분류를 설정하는 기본 단계는 다음과 같습니다.

1. 모델 만들기: 먼저 AI 모델이 학습 후 파일에 자동으로 적용할 분류 라벨을 선택하거나 만듭니다. 조직의 민감한 콘텐츠를 식별하도록 모델을 학습시키는 데 사용되는 학습 라벨도 만듭니다. 그런 다음 이러한 라벨을 사용할 AI 모델을 만듭니다.

2. 모델 학습시키기: 라벨을 만든 후 지정된 라벨러가 학습 라벨로 Drive 파일을 분류하여 학습 데이터 세트를 만듭니다. 그런 다음 모델은 데이터 세트를 사용하여 민감한 파일을 분류하는 방법을 학습합니다.

3. AI 분류 사용 설정하기: 모델이 학습되면 자동 적용이라는 파일 자동 라벨 지정을 설정할 수 있습니다. 설정 과정에서 사용 설정할 라벨 옵션과 AI 분류를 통해 라벨을 적용할 파일의 소유자를 선택합니다. 그러면 모델이 민감한 파일에 자동으로 라벨을 지정하기 시작합니다.

4. 모델 모니터링하기: Drive 이벤트 로그를 사용하여 분류된 파일 수와 자동 적용된 라벨을 수락하거나 수정 (권한이 있는 경우)한 사용자 수를 모니터링할 수 있습니다.

시작하기 전에

  • 분류 라벨의 작동 방식과 생성 방법을 알아봅니다. 자세한 내용은 분류 라벨 관리자로 시작하기를 참고하세요.
  • 지정된 라벨러를 선택합니다. 민감한 파일에 학습 라벨을 수동으로 올바르게 적용할 수 있는 조직의 사용자 그룹입니다.
  • 지정된 라벨러 전용으로 구성 적용 그룹을 만듭니다. 자세한 안내는 구성 적용 그룹으로 서비스 설정 맞춤설정하기를 참고하세요.
  • 관리자 계정에서 분류 라벨 관리, DLP 규칙 관리, DLP 규칙 보기 권한을 사용 설정합니다.

모델 만들기

모델을 만들려면 먼저 기존 분류 라벨을 선택하거나 새 분류 라벨을 만들어야 합니다. 다음으로 지정된 라벨러가 사용할 일치하는 학습 라벨을 만들어야 합니다. 자동으로 (권장) 또는 라벨 관리자를 사용하여 수동으로 만들 수 있습니다.

분류 라벨 선택 또는 만들기

Drive 및 Docs에서 분류가 사용 설정되어 있어야 합니다. 학습이 완료되면 AI 모델이 민감한 Drive 파일에 분류 라벨을 자동으로 적용합니다. 모델은 라벨당 하나의 필드만 사용하여 학습되며, 이 필드는 배지 목록 또는 옵션 목록이어야 합니다.

문서에 눈에 띄게 표시되므로, 배지가 있는 민감도 라벨을 사용하는 것이 좋습니다.

분류 라벨에 옵션 목록 또는 배지 목록 필드를 사용하는 경우 다음 조건을 충족해야 합니다.

  • 옵션이 2개 이상 7개 이하여야 합니다.
  • 게시되어야 합니다.

이러한 요구사항을 충족하는 기존 라벨이 있는 경우 이를 분류 라벨로 사용할 수 있습니다. 그렇지 않은 경우 라벨 관리자를 사용하여 모델을 설정하기 전이나 설정할 때 라벨을 만듭니다 (이 페이지의 뒷부분 참고). 자세한 내용은 조직의 분류 라벨 만들기를 참고하세요.

학습 라벨 만들기

학습 라벨은 분류 라벨과 거의 동일하며 지정된 라벨러가 학습 목적으로만 사용합니다. 모델을 만들 때 (이 페이지의 뒷부분 참고) 학습 라벨을 자동으로 만들어 분류 라벨과 일치하는지 확인할 수 있습니다.

모델을 설정하기 전이나 설정할 때 라벨 관리자를 사용하여 학습 라벨을 수동으로 만들 수도 있습니다. 자세한 내용은 이 페이지 뒷부분의 학습 라벨을 직접 만들려면 어떻게 해야 하나요?를 참고하세요.

모델 만들기

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 모델 만들기를 클릭합니다.
  3. 분류 라벨 목록에서 모델을 학습시킬 기존 분류 라벨과 필드를 선택하거나 라벨 만들기를 클릭한 다음 라벨 관리자를 사용하여 라벨을 만듭니다.

    라벨 관리자에서 라벨을 만든 경우 모델 만들기 페이지로 돌아갑니다. 목록에 새 라벨이 표시되려면 페이지를 새로고침해야 할 수 있습니다.

  4. 분류 라벨의 경우 필드 이름 목록에서 사용 가능한 필드를 선택합니다.
  5. 계속을 클릭합니다.
  6. (선택사항) 다음과 같이 분류 라벨과 일치하는 학습 라벨을 자동으로 만들어 게시합니다.
    1. 학습 라벨 만들기를 클릭합니다.
    2. 표시되는 메시지에서 라벨 권한 업데이트를 클릭합니다. 별도의 탭에서 라벨 관리자의 수정 모드로 라벨이 열립니다.
    3. 권한다음수정을 클릭한 다음 라벨러가 포함된 구성 적용 그룹에 라벨을 적용하고 값을 설정할 수 있음 권한을 부여합니다.
    4. 저장을 클릭하고 라벨 관리자 탭을 닫습니다.

      참고: 나중에 라벨 권한을 설정할 수도 있습니다. 하지만 라벨러만 학습 라벨에 액세스할 수 있어야 합니다.

  7. (선택사항) 이미 학습 라벨을 만든 경우 학습 라벨 목록에서 해당 라벨을 선택합니다.
  8. (선택사항) 지금 라벨 관리자로 이동을 클릭하여 직접 학습 라벨을 만듭니다.

    중요: 라벨이 학습 라벨 기준을 충족하는지 확인하고 라벨러만 액세스할 수 있도록 라벨 권한을 설정하세요. 자세한 내용은 이 페이지 뒷부분의 학습 라벨 가이드라인을 참고하세요.

    모델 만들기 페이지로 돌아갑니다. 목록에 새 학습 라벨이 표시되지 않으면 페이지를 새로고침해야 할 수 있습니다.

  9. 모델 만들기 페이지에서 계속을 클릭합니다.
  10. 모델을 설명하는 이름을 입력합니다.
  11. 모델 만들기를 클릭합니다.

모델을 만든 후 모델 세부정보 페이지에 선택한 학습 라벨과 분류 라벨이 표시됩니다.

모델 학습

AI 모델을 학습시키려면 학습 데이터 세트를 만든 다음 초기 학습 실행을 시작해야 합니다. 학습 실행 중에 모델은 데이터 세트의 예시를 기반으로 학습합니다.

자동 재학습: 초기 학습이 실행된 이후 모델은 정확도를 개선하거나 유지하기 위해 2주마다 재학습됩니다. 언제든지 모델을 직접 재학습시킬 수 있습니다. 학습이 실행될 때마다 새 모델이 출시되고 2주의 자동 재학습 일정이 재설정됩니다.

학습 데이터 세트 만들기

학습 데이터 세트를 만들려면 지정 라벨러가 라벨 옵션당 최소 100개의 파일에 학습 라벨을 적용해야 합니다. 예를 들어 라벨에 '알아야 함', '기밀', '공개'의 3가지 옵션이 있는 경우 학습 파일이 300개 이상 필요합니다. 하지만 일부 파일은 학습 데이터 세트에 적합하지 않을 수 있으므로 라벨 옵션당 100개 이상의 파일을 준비하는 것이 좋습니다. 학습을 위해 고품질 예에 라벨을 지정하는 방법에 대해 자세히 알아보세요.

참고: 학습 데이터 세트에는 최대 100만 개의 파일이 포함될 수 있습니다.

모델을 만들면 약 24시간 후에 학습을 위해 라벨이 지정된 파일 수를 자동으로 확인합니다. 그 후에는 하루 종일 지속적으로 확인합니다.

라벨이 지정된 파일 수를 확인하려면 다음 안내를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델의 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 패널에 있는 활성 모델의 학습 파일에서 라벨이 지정된 파일 수를 확인합니다.

모델에 학습을 위한 파일이 충분한 경우 학습 준비됨으로 표시됩니다.

학습 실행 시작

학습 실행은 일반적으로 4~6시간이 걸리지만 데이터 세트가 클수록 더 오래 걸릴 수 있습니다. 모델이 파일에 정확하게 라벨을 지정하는 방법을 학습하려면 학습을 여러 번 실행해야 할 수 있습니다.

학습 실행 중에 모델은 파일에 적용된 학습 라벨과 파일에 대해 선택한 분류를 비교하여 점수를 생성합니다. 자세한 내용은 점수는 어떻게 계산되나요?를 참고하세요.

학습 실행 후 모델의 정확도를 확인할 수 있습니다.

학습 실행을 시작하려면 다음 단계를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 학습 패널에서 학습 실행 시작을 클릭합니다.

    참고: 이 버튼은 라벨러가 최소 개수의 학습 파일에 라벨을 지정한 경우에만 사용할 수 있습니다.

학습 후: 모델 점수 확인하기

학습 실행 후 각 라벨 옵션에 대한 백분율 점수와 함께 모델이 출시됩니다. 각 점수(재현율 점수라고 함)는 자체 테스트 후 모델이 올바르게 분류한 학습 예시의 비율입니다.

  • 50%미만: 정확도가 낮습니다. 모델에 더 나은 데이터가 필요하며 아직 준비가 완료되지 않았습니다.
  • 50~80%: 정확도가 보통입니다. 모델이 제한적으로 준비되어 있을 수 있습니다.
  • 80%이상: 정확도가 높습니다. 모델이 조직의 파일을 분류할 준비가 되었습니다.

학습 실행 후 모델의 정확도를 확인하려면 다음 안내를 따르세요.

모델 세부정보 페이지에서 모델 점수를 확인할 수 있습니다.

  • 페이지 상단의 학습 결과 패널에 있는 현재 사용된 파일 및 점수
  • 현재 학습 데이터 세트 패널

AI 분류 사용 설정

AI 모델이 최소 수준의 정확도 (50% 이상)를 달성하도록 학습되면 라벨 옵션을 선택하고 파일 라벨 자동 지정 또는 자동 적용을 사용 설정할 수 있습니다. 하지만 최상의 결과를 얻으려면 모든 라벨 옵션의 모델 점수가 80% 이상에 도달할 때까지 기다리는 것이 좋습니다.

자동 적용을 사용 설정하려면 다음 단계를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 학습 패널에서 자동 적용 설정을 클릭합니다.

    참고: 이 버튼은 1개 이상의 라벨 옵션이 50% 의 정확도에 도달한 경우에만 사용할 수 있습니다.

    또는 이전에 자동 적용을 설정한 경우 AI 라벨이 지정된 파일에서 자동 적용 수정을 클릭합니다.

  5. AI 모델이 자동 적용하도록 허용하려는 라벨 옵션의 체크박스를 선택합니다.
  6. 저장하고 계속하기를 클릭하여 모델이 라벨을 자동 적용할 파일의 소유자인 조직 단위 또는 그룹을 선택합니다. 기본 설정은 최상위 상위 조직입니다.

    또는 저장을 클릭하여 나중에 사용자를 선택합니다.

  7. 사용자를 선택한 경우 옆에서 조직 단위 또는 구성 적용 그룹을 선택합니다.

    그룹 설정은 조직 단위보다 우선 적용됩니다. 자세히 알아보기

  8. 사용: 아래 옵션 중 하나로 라벨이 자동 적용됨을 클릭합니다.
  9. 저장을 클릭합니다.

    모델 세부정보 페이지에서 규칙의 현재 자동 적용 상태사용으로 표시됩니다.

참고: Drive 이벤트 로그를 사용하여 AI 분류를 모니터링할 수 있습니다. 자세한 내용은 이 페이지 뒷부분의 AI 분류 라벨 이벤트 모니터링하기를 참고하세요.

AI 분류가 파일을 스캔하는 경우

사용자가 소유한 파일 및 공유 드라이브에 자동 적용이 사용 설정되면 AI 분류가 1~2주 이내에 저장 파일을 한 번 이상 스캔합니다. AI 분류는 파일이 업로드되거나 수정될 때마다 파일을 스캔하며, 적용된 라벨은 파일의 콘텐츠 변경사항에 따라 변경할 수 있습니다.

자동 적용 충돌이 처리되는 방법

데이터 보호 규칙

데이터 보호 규칙으로 설정된 라벨 값은 AI 분류보다 우선하며, 둘 다 기본 분류보다 우선 적용됩니다.

여러 규칙

2개 이상의 동일한 유형의 규칙이 동일한 파일에 서로 다른 라벨 옵션을 적용하려는 경우 라벨의 옵션 목록에서 더 높은 옵션이 적용됩니다. 예를 들어 라벨 관리자 필드에 다음의 세 가지 옵션이 있는 라벨이 있을 수 있습니다.

  1. 기밀
  2. 내부
  3. 공개

규칙 1이 라벨을 기밀로 설정하려고 하고 동일한 파일에 규칙 2가 라벨을 공개로 설정하려는 경우 기밀이 적용됩니다. 규칙을 설정하기 전에 라벨의 필드 옵션이 원하는 우선순위로 나열되어 있는지 확인하세요.

사용자가 적용한 라벨

사용자가 파일에 적용하는 라벨은 AI 적용 라벨보다 우선합니다. 즉, AI 분류는 사용자가 이전에 설정한 라벨을 수정하지 않습니다.

모델 모니터링

Drive 이벤트 로그에서 AI 분류가 파일에 라벨을 지정하는 방법에 대한 세부정보를 확인합니다. 각 라벨 옵션에 대해 로그에는 자동 적용을 사용하여 분류된 파일 수와 자동 적용된 라벨을 수락하거나 수정한 사용자 수가 표시됩니다. 사용자가 자동 적용된 라벨에 대해 작업을 실행하려면 권한이 있어야 합니다.

자동 적용된 라벨과 상호작용하는 데 필요한 사용자 권한

사용자가 자동 적용된 라벨과 상호작용하려면 파일 및 라벨 권한이 필요합니다. 라벨 관리자에서 분류 라벨에 대한 권한을 설정할 수 있습니다. 자세한 내용은 조직의 분류 라벨 만들기를 참고하세요.

  • 자동 적용된 라벨을 보려면 사용자에게 분류 라벨에 대한 이 라벨을 볼 수 있음 권한이 있어야 합니다.
  • 자동 적용된 라벨을 수락하고 수정하려면 분류 라벨에 대한 라벨을 적용하고 값을 설정할 수 있음 권한이 있어야 하며 파일의 편집자 또는 소유자여야 합니다.

Drive 이벤트 로그에서 AI 분류 이벤트 보기

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 AI 라벨이 지정된 파일에서 이벤트를 볼 라벨 옵션의 파일 보기를 선택합니다.

    보안 조사 도구가 새 탭에서 열리고 두 개의 AI 분류 관련 이벤트(라벨 적용됨라벨 필드 값 변경됨)에 대한 Drive 이벤트 로그 검색 결과가 표시됩니다.

  4. 이벤트 설명을 클릭하면 다음과 같은 추가 세부정보를 확인할 수 있습니다.
    • 라벨이 지정된 문서의 이름 및 유형
    • 문서에 할당된 라벨 필드 값 (예: 기밀 또는 제한됨)

모델 관리

분류 라벨의 자동 적용 사용 중지하기

모든 라벨 옵션 또는 특정 라벨 옵션의 자동 적용을 사용 중지하려면 다음 안내를 따르세요.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. AI 라벨이 지정된 파일에서 자동 적용 수정을 클릭합니다.
  5. 자동 적용을 사용 중지하려는 라벨 옵션의 체크박스를 선택 해제합니다.

    자동 적용을 완전히 중지하려면 모든 옵션을 선택 해제하세요.

특정 조직 단위 또는 그룹에 대한 자동 적용을 완전히 사용 중지하려면 다음 안내를 따르세요.

특정 조직 단위 또는 그룹의 사용자가 소유한 콘텐츠에 대해 자동 적용을 완전히 사용 중지할 수 있습니다.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 페이지 상단의 추가 작업 메뉴에서 자동 적용 관리다음사용 설정된 OU/그룹 업데이트를 클릭합니다.
  5. 왼쪽의 조직 단위 또는 그룹을 클릭하여 선택합니다.
  6. 사용 중지: 라벨이 자동 적용되지 않음을 선택합니다.
  7. 저장을 클릭합니다.

모델 삭제

모델 정확도가 개선되지 않는 등의 이유로 모델을 삭제해야 할 수도 있습니다. 모델을 삭제하면 모든 AI 분류 설정이 영구 삭제됩니다. 참고:

  • 이 모델에서만 사용된 라벨이 분류 설정에서 삭제되고 모델의 모든 버전이 삭제됩니다.
  • 학습 라벨은 파일에 그대로 유지됩니다. 모델을 삭제한 후 동일한 학습 라벨 (또는 다른 라벨)을 사용하도록 새 모델의 구성을 선택할 수 있습니다.
  • 이 모델에 대해 사용 설정한 모든 라벨 자동 적용은 즉시 중지되지만 이전에 자동 적용된 라벨은 파일에 계속 남아 있게 됩니다.
  • 기존 학습 라벨 및 학습 파일로 다시 학습시키면 모델 결과가 비슷해집니다.
  • 새 모델에 동일한 분류 라벨을 다시 만들면 AI 분류 기능이 이전 모델의 분류를 무시하고 덮어씁니다. 이러한 방식으로 조직의 Drive 파일을 '다시 처리'할 수 있습니다. 이는 초기 배포 이후 모델 품질을 크게 개선한 경우에 유용할 수 있습니다.

모델을 삭제하려면 다음 단계를 따릅니다.

  1. Google 관리 콘솔에서 메뉴 다음 보안다음액세스 및 데이터 관리다음데이터 분류로 이동합니다.

    분류 라벨 관리 관리자 권한이 있어야 합니다.

  2. AI 분류 섹션에서 nn 모델 보기를 클릭합니다.
  3. 모델 세부정보 페이지의 모델에 대한 작업에서 세부정보 보기를 선택합니다.
  4. 모델 세부정보 페이지의 오른쪽에 있는 작업에서 모델 삭제를 클릭합니다.

    모델 삭제 대화상자에 모델 삭제가 미치는 영향이 나열됩니다.

  5. 계속하려면 모델 삭제를 클릭합니다.

FAQ

학습 및 분류 라벨

학습 및 분류 라벨의 요구사항은 무엇인가요?

분류 라벨과 학습 라벨은 모두 다음 기준을 충족해야 합니다.

  • 최소 2개에서 최대 7개의 옵션이 있어야 합니다.
  • 옵션이 동일한 순서로 정렬되어 있어야 합니다.

    예를 들어 분류 라벨에 다음 순서로 옵션이 있는 경우

    1. 옵션 1
    2. 옵션 2
    3. 옵션 3

    학습 라벨 옵션은 다음과 같은 순서가 될 수 없습니다.

    1. 옵션 2
    2. 옵션 1
    3. 옵션 3
  • 게시되어야 합니다.
  • 라벨별로 액세스 권한이 달라야 합니다. 학습 라벨은 모델을 학습시킬 수 있는 지정된 라벨러만 사용할 수 있어야 합니다. 분류 라벨은 더 광범위한 액세스 권한을 가질 수 있습니다.

학습 라벨을 직접 만들려면 어떻게 해야 하나요?

모델을 설정할 때 학습 라벨을 자동으로 만드는 것이 좋지만 다음 가이드라인에 따라 라벨 관리자에서 직접 만들 수도 있습니다.
  • 라벨이 필수 라벨 기준을 충족하는지 확인합니다.
  • 학습 라벨을 '학습'이라는 단어로 식별하여 지정된 라벨러가 학습 데이터 세트를 만들 때 라벨을 쉽게 인식하고 적용할 수 있도록 합니다.
  • 학습 라벨에 설명 필드를 추가하여 지정된 라벨러가 목적을 더 쉽게 이해할 수 있도록 합니다.
  • 라벨러용으로 만든 구성 적용 그룹을 사용하여 모델 학습을 위해 파일을 식별할 지정된 라벨러에게만 라벨 권한을 설정해야 합니다. 라벨러에게는 라벨을 적용하고 값을 설정할 수 있음 권한이 필요합니다. 자세한 내용은 조직의 분류 라벨 만들기를 참고하세요.

분류 라벨을 학습 라벨로 사용할 수 있나요?

아니요. 분류 라벨과 학습 라벨은 달라야 합니다. 분류 라벨로 선택한 라벨은 학습 라벨로 사용할 수 없습니다.

데이터 세트 학습

모델 학습에 적합한 파일은 무엇인가요?

모델 학습에서 최상의 결과를 얻으려면 지정된 라벨러가 다음 가이드라인을 따라야 합니다.

  • 각 파일의 문자 수는 500자(영문 기준) 이상이어야 합니다.
  • 사용자가 조직에서 만들고 공유하고 사용하는 콘텐츠를 나타내는 파일을 선택합니다.
  • 각 옵션에 대해 100개 이상의 파일을 사용하여 라벨 옵션당 대략 동일한 양의 파일에 라벨을 지정합니다. 이렇게 하면 모델이 데이터를 종합적으로 이해하고 점수를 향상시키는 데 도움이 됩니다.
  • 각 옵션 유형에 대한 다양한 대표적인 파일을 포함합니다. 예를 들어 계약이 조직의 일반적인 일급 기밀 파일 형식이기도 한 경우 이력서 100개를 일급 기밀에 대한 전체 예시 파일 조합으로 라벨을 지정해서는 안 됩니다.
  • 조직이 소유한 파일에만 학습 라벨을 적용합니다. 사용자가 직접 소유한 파일 또는 공유 드라이브에 저장된 파일이 이에 해당합니다. AI 분류는 외부 사용자가 소유하거나 외부 공유 드라이브에 있는 파일을 처리하지 않습니다.

이전에 라벨이 지정된 파일로 모델을 학습시킬 수 있나요?

이전에 라벨이 지정된 파일에 대한 학습은 현재 불가능합니다. 모델에는 파일에 자동으로 적용할 라벨의 복제본인 학습 라벨이 필요하지만 동일한 라벨일 수는 없습니다.

모델을 여러 언어로 학습시킬 수 있나요?

이 모델은 여러 언어를 지원합니다. 하지만 각 옵션 유형과 언어에 대한 대표 샘플 파일이 학습 데이터에 포함되어야 합니다. 이렇게 하면 모델을 성공적으로 학습시키는 데 필요한 파일 수가 늘어납니다. 라틴 문자 기반 언어만 지원됩니다.

학습 중에 점수는 어떻게 계산되나요?

학습 중에 AI 모델은 입력 데이터의 75% 를 파일에 라벨을 지정하는 방법을 학습하는 데 사용하고, 주기적으로 자체 성능을 테스트하기 위해 25% 를 사용합니다. 즉, 라벨이 지정된 파일 중 25% 에서 모델은 어떤 라벨이 적용되었는지 모르는 것처럼 해당 파일을 분석합니다. 그러면 AI 모델이 자체적으로 라벨을 선택하고 선택한 라벨을 지정된 라벨러가 적용한 실제 라벨과 비교합니다. 점수는 올바른 라벨이 바르게 할당된 예약된 파일의 비율을 보여줍니다.

모델을 학습시킨 후 자동으로 재학습되지 않도록 '고정'할 수 있나요?

AI 분류 모델은 Drive의 파일을 사용하여 학습합니다. 이러한 파일이 삭제되면 (Google Vault를 통한 보관 일정에 따라) 파일의 콘텐츠가 어떤 방식으로든 유지되지 않도록 모델도 삭제해야 합니다. 따라서 모델 재학습은 계속 반복해서 실행되며 정지할 수 없습니다.

사용자가 라벨 및 필드 값을 변경하거나 수정할 수 있나요?

권한이 있는 사용자는 라벨 또는 필드 값을 업데이트할 수 있지만 AI 분류는 이러한 변경사항을 기반으로 분류 모델을 수정하지 않습니다. 모델이 라벨과 필드 값을 잘못 적용한 경우 지정된 라벨러에게 파일에 올바른 학습 라벨을 할당해 달라고 요청할 수 있습니다. 그러면 AI 분류가 이 데이터를 다음 모델 자체 학습 주기에 통합합니다.

자동 적용

AI 분류가 이미지, 동영상, 오디오 파일을 평가할 수 있나요?

AI 분류는 Drive DLP와 동일한 색인 생성 가능한 텍스트 처리를 사용합니다. Drive가 색인 생성 가능한 텍스트를 추출할 수 있는 모든 파일은 AI 분류가 적용된 라벨을 평가할 수 있습니다. 여기에는 이미지에서 텍스트를 추출하는 광학 문자 인식 (OCR)이 포함됩니다. 하지만 AI 분류는 동영상 또는 오디오 파일을 평가하지 않습니다.

AI 분류는 민감한 콘텐츠에만 라벨을 지정하나요?

민감한 콘텐츠가 AI 분류의 주요 중점이지만 최대 4개의 옵션으로 모든 라벨을 자동 라벨 지정을 위해 학습시킬 수 있습니다. 분류 라벨은 감사, 검색성, 보관 관리에도 사용됩니다.

클라이언트 측 암호화 (CSE)가 사용 설정된 경우 AI 분류가 작동하나요?

Google은 CSE로 암호화된 파일을 복호화할 수 없으므로 (비공개 암호화 키만 가능) AI 분류는 CSE로 암호화된 파일을 학습할 수 없으며 이러한 파일에 자동으로 라벨을 적용할 수 없습니다.

AI 분류는 언제 어떻게 자동 적용된 라벨을 수정하나요?

자동 적용을 사용 설정하면 AI 분류가 충분한 텍스트를 추출할 수 있는 모든 저장 파일을 스캔하고 분류합니다. 이 파일은 한 번 이상 스캔됩니다.

AI 분류는 콘텐츠가 수정될 때마다 파일을 주기적으로 다시 처리합니다. 콘텐츠가 변경되면 파일에 대한 예측이 달라질 수 있습니다. AI 분류에 파일에 대한 이전 및 새 예측 옵션이 모두 있는 경우 옵션 목록에서 더 높은 옵션이 우선적으로 선택됩니다. 예를 들어 라벨 관리자 필드에 세 가지 옵션이 있는 경우:

  • 기밀
  • 내부
  • 공개

AI 분류가 파일을 내부로 분류하고 콘텐츠가 변경되어 AI 분류 모델이 기밀을 예측한다고 가정해 보겠습니다. 이 경우 파일의 분류가 기밀로 변경됩니다. 하지만 AI 분류 모델이 공개로 예측하면 파일의 분류는 내부로 유지됩니다.

AI 분류는 사용자가 검토하거나 수정한 자동 적용 라벨 및 필드 값을 수정하지 않습니다.

모델이 변경되면 모델이 기존 파일을 자동으로 재평가하나요?

파일이 생성되거나 수정되면 최신 모델에 의해 처리됩니다. 새 모델 버전이 출시되어도 기존 파일이 자동으로 다시 처리되지는 않습니다. 하지만 모델은 특정 모델 업데이트나 재학습과 관계없이 최신 버전으로 모든 파일을 주기적으로 다시 처리할 수 있습니다.

여러 분류가 활성화된 경우 AI 분류가 다른 분류 방법보다 우선 적용되나요?

데이터 분류는 재정의할 수 있습니다. 데이터 분류는 다음 순서로 수행됩니다.
  1. 사용자 덮어쓰기가 없는 DLP 규칙
  2. 수동 분류
  3. 사용자 덮어쓰기가 포함된 DLP 규칙
  4. AI 분류
  5. 기본 분류
라벨 또는 필드를 삭제하면 하위 계층 분류 메커니즘이 적용될 수 있습니다. 예를 들어 사용자가 라벨을 삭제한 파일에 나중에 AI 분류에 의해 동일한 라벨이 자동 적용될 수 있습니다.

AI 분류가 라벨을 적용할 수 있는 파일 유형은 무엇인가요?

  • AI 분류는 Drive DLP와 동일한 색인 생성 가능한 텍스트 처리를 사용합니다. 자세한 내용은 DLP에서 검사하는 파일 형식 목록을 참고하세요. 오디오 및 동영상 파일은 지원되지 않습니다.
  • AI 분류에서 라벨을 적용하려면 파일에 최소한의 텍스트가 있어야 합니다. 따라서 매우 짧은 문서나 텍스트가 적은 이미지와 같은 일부 파일은 분류되지 않을 수 있습니다.

자동 적용 옵션을 사용 중지하면 어떻게 되나요?

스캔 중에 파일에 자동 적용이 사용 중지된 옵션이 있을 것으로 예상되는 경우 AI 분류는 파일에 라벨 또는 필드 값을 적용하지 않습니다.

AI 분류가 이전에 라벨을 지정한 파일은 옵션이 사용 중지된 후에도 적용된 라벨 및 옵션 값을 유지합니다.

자동 적용된 라벨을 롤백할 수 있나요?

라벨 적용을 실행취소할 수는 없습니다. 모델을 광범위하게 배포하기 전에 소규모 잠재고객을 대상으로 모델을 개선하고 테스트하는 것이 좋습니다. 예를 들어 임시 라벨로 모델을 학습시킬 수 있습니다. 그런 다음 모델 성능이 만족스러우면 모델을 삭제하고 동일한 학습 라벨 (동일한 학습 데이터 세트)을 사용하되 영구 라벨을 사용하는 새 모델을 만들어 모델을 '재설정'할 수 있습니다.

라이선스

요건을 충족하는 라이선스가 없는 사용자는 이 기능을 어떻게 사용할 수 있나요?

조직의 관리자가 AI 분류를 지원하는 라이선스를 보유하고 있다면 모델을 학습시킬 수 있습니다. 지정된 라벨러 (학습 라벨을 적용하는 사용자)에게는 AI 분류가 포함된 라이선스가 필요하지 않습니다.

학습 라벨이 있는 파일은 Drive 분류 라벨을 지원하는 라이선스가 있는 모든 사용자가 소유할 수 있습니다. 하지만 AI 분류는 공유 드라이브에 있거나 AI 분류를 지원하는 라이선스를 보유한 사용자가 소유한 파일에만 라벨을 지정합니다. 지원되는 라이선스가 없는 사용자가 소유한 파일은 AI 분류가 처리하지 않습니다.

AI 분류를 지원하는 라이선스를 보유한 사용자가 없으면 자동 적용이 사용 중지되고 분류 모델이 삭제됩니다. 하지만 학습 라벨과 AI 분류에 의해 적용된 라벨은 파일에 유지됩니다.

보관처리된 사용자는 이 기능을 어떻게 사용할 수 있나요?

Google Workspace Enterprise Plus - 사용자 아카이브 라이선스가 있는 사용자의 파일에는 AI 분류 라벨이 지정됩니다.

Drive 라벨 관리자로 시작하기