Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

AI 分類を使用した Google ドライブファイルの自動ラベル付け

この機能は、Frontline Plus と Enterprise Plus に含まれています。また、Gemini Enterprise–Legacy、Gemini Education Premium、AI Security の各アドオンにも含まれています。アドオンを比較する

Google ドライブのデータ分類ラベルは、ファイルの記述メタデータとして機能します。このラベルは、データ保護、監査調査、保持などのさまざまな機能に使用できます。Google ドライブの AI 分類では、プログラミングを行うことなく、ファイルのラベル付けタスクを自動化できます。

AI 分類の方法は 2 つあります。

カスタムモデル - 組織のトレーニングデータセットに基づいて、組織固有の特殊な ML モデルを構築します。管理者は、モデルのトレーニングに使用するデータを制御します。モデルは組織に固有です。
Gemini（ベータ版）を使用する: Gemini 大規模言語モデル（LLM）を使用してファイルの内容を検査し、定義したカスタマイズ可能な平易な言語の指示に基づいてラベルを自動的に適用します。この方法では、事前のデータの収集やモデルのトレーニングは必要ありません。

合計で最大 5 個の一意の AI 分類カスタムモデルまたは Gemini 指示を作成できます。この上限内であれば、両方の方法を柔軟に組み合わせることができます。

注: AI 分類によってラベル付けされるには、ファイルが共有ドライブに保存されているか、分類ラベルをサポートするライセンスを持つユーザーが所有している必要があります。

AI 分類を使用する

ドライブ内の新規および既存のファイルに自動的にラベルを付けるように AI 分類を設定する基本的な手順は次のとおりです。

1. カスタムモデルを作成するか、Gemini の指示を作成する: ファイルに自動的に適用する分類ラベルを選択または作成します。

注: カスタムモデルを作成する場合は、トレーニングラベルも作成します。これは、モデルがデータの分類方法を学習するために使用するサンプルファイルをマークするために使用されます。

2. （カスタムモデルのみ）モデルをトレーニングする: ラベルを作成したら、指定されたラベル付け担当者がトレーニングラベルを使用してドライブのファイルを分類し、トレーニングデータセットを作成します。モデルは、このデータセットを使用して機密ファイルを分類する方法を学習します。

3. AI 分類をオンにする: モデルのトレーニングが完了するか、Gemini の指示が設定されると、自動適用と呼ばれるファイルの自動ラベル付けを設定できます。設定時に、有効にするラベルオプションと、AI 分類でラベルを適用するファイルの所有者を指定します。モデルまたは手順が機密ファイルのラベル付けを開始します。

4. モデルをモニタリングする: ドライブのイベントログを使用して、分類されたファイルの数と、自動適用されたラベルを承認または変更したユーザーの数（権限がある場合）をモニタリングできます。

始める前に

分類ラベルの仕組みと作成方法について理解します。詳しくは、分類ラベル管理者としての作業を開始するをご覧ください。
指定されたラベル付け担当者を選択する - 機密性の高いファイルにトレーニングラベルを手動で正しく適用できる組織内のユーザーのグループ。
指定したラベル付け担当者専用の設定グループを作成します。手順については、設定グループを使用してサービスの設定をカスタマイズするをご覧ください。
管理者アカウントで、[分類ラベルの管理]、[DLP ルールの管理]、[DLP ルールの表示] の次の権限を有効にします。

モデルを作成する

モデルを作成するには、まず既存の分類ラベルを選択するか、新しい分類ラベルを作成する必要があります。次に、一致するトレーニングラベルを作成する必要があります。これは、自動（推奨）またはラベルマネージャーを使用した手動のいずれかで行います。指定されたラベル付け担当者がこのラベルを使用します。

分類ラベルを選択または作成する

ドライブとドキュメントで分類が有効になっている必要があります。トレーニング後、AI モデルはドライブ内の機密ファイルに分類ラベルを自動的に適用します。モデルはラベルごとに 1 つのフィールドのみでトレーニングされます。このフィールドは、バッジリストまたはオプションリストのいずれかである必要があります。

バッジ機密性ラベルをおすすめします。これはドキュメント上で目立つように表示されます。

分類ラベルにオプションリストフィールドまたはバッジリストフィールドを使用する場合は、次の要件を満たしている必要があります。

オプションの数が 2 ～ 7 個である
公開されている

これらの要件を満たすラベルがすでにある場合は、それを分類ラベルとして使用できます。そうでない場合は、ラベルマネージャーを使用して、モデルの設定前または設定時（後述）にラベルを作成します。詳しくは、組織の分類ラベルを作成するをご覧ください。

トレーニングラベルを作成する

トレーニングラベルは分類ラベルとほぼ同じもので、指定されたラベル付け担当者がトレーニング目的でのみ使用します。モデルの作成時（後述）に、分類ラベルと一致するトレーニングラベルを自動的に作成できます。

ラベルマネージャーを使用して、モデルの設定前または設定時に、独自のトレーニングラベルを手動で作成することもできます。詳しくは、後述するトレーニングラベルを手動で作成するにはどうすればよいですか？をご覧ください。

モデルを作成する

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[モデルを作成] をクリックします。
[分類ラベル] リストで、モデルのトレーニングに使用する既存の分類ラベルとフィールドを選択するか、[ラベルを作成] をクリックしてラベルマネージャーを使用して作成します。
ラベルマネージャーでラベルを作成した場合は、[モデルを作成] ページに戻ります。リストに新しいラベルを表示するには、ページの更新が必要になる場合があります。
分類ラベルの [フィールド名] リストで、使用する対象フィールドを選択します。
[続行] をクリックします。
（省略可）分類ラベルと一致するトレーニングラベルを自動的に作成して公開します。
1. [トレーニングラベルを作成] をクリックします。
2. 表示されたメッセージで [ラベルの権限を更新] をクリックします。別のタブでラベルマネージャーにラベルが編集モードで開きます。
3. [権限] [編集] をクリックして、ラベル付け担当者が含まれる設定グループに [ラベルの適用と値の設定が可能] 権限を付与します。
4. [保存] をクリックして、ラベルマネージャータブを閉じます。
  注: ラベルの権限は後で設定することもできます。ただし、トレーニングラベルにアクセスできるのはラベル付け担当者のみにすることが重要です。
（省略可）トレーニングラベルをすでに作成している場合は、[トレーニングラベル] リストでそれを選択します。
（省略可）[ラベルマネージャーに移動] をクリックして、独自のトレーニングラベルを今すぐ作成します。
重要: ラベルがトレーニングラベルの条件を満たしていること、ラベル付け担当者のみがアクセスできるようにラベルの権限を設定していることを確認してください。詳しくは、後述するトレーニングラベルのガイドラインをご覧ください。

[モデルの作成] ページに戻ります。新しいトレーニングラベルをリストに表示するには、ページの更新が必要になる場合があります。
[モデルの作成] ページで、[続行] をクリックします。
モデルのわかりやすい名前を入力します。
[モデルを作成] をクリックします。

モデルを作成すると、[モデルの詳細] ページに、選択したトレーニングラベルと分類ラベルが表示されます。

モデルをトレーニングする

AI モデルをトレーニングするには、トレーニングデータセットを作成してから、最初のトレーニング実行を開始する必要があります。トレーニング実行中に、モデルはデータセット内の例から学習します。

再トレーニングは自動: 最初のトレーニング実行後、モデルは精度を向上または維持できるように 2 週間ごとに再トレーニングされます。モデルはいつでも手動で再トレーニングできます。トレーニングが実行されるたびに、新しいモデルがリリースされ、2 週間の自動再トレーニングのスケジュールがリセットされます。

トレーニングデータセットを作成する

トレーニングデータセットを作成するには、指定されたラベル付け担当者がラベルオプションごとに少なくとも 100 個のファイルにトレーニングラベルを適用する必要があります。たとえば、ラベルに「必知事項」、「Confidential」、「Public」の 3 つのオプションがある場合は、少なくとも 300 個のトレーニングファイルが必要です。ただし、一部のファイルはトレーニングデータセットの対象にならない可能性があるため、ラベルオプションごとに 100 個以上のファイルを用意することをおすすめします。詳細については、高品質なトレーニングサンプルのラベル付けをご覧ください。

注: トレーニング用データセットには、最大 100 万個のファイルを含めることができます。

モデルを作成すると、約 24 時間後にトレーニング用にラベル付けされたファイルの数が自動的にチェックされます。その後、一日を通して継続的にチェックされます。

ラベルが付けられたファイルの数を確認するには:

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
モデルの [アクション] で、[詳細を表示] を選択します。
ページ上部のパネルの [アクティブなモデルのトレーニングファイル数] で、ラベル付けされたファイルの数を確認します。

モデルにトレーニングファイルが十分にあれば、トレーニングの準備は完了です。

トレーニング実行を開始する

通常、トレーニング実行には 4 ～ 6 時間かかりますが、大規模なデータセットの場合はさらに時間がかかることがあります。ファイルに正確にラベル付けする方法を学習するには、モデルのトレーニングが複数回必要になる場合があります。

トレーニング実行中、モデルはファイルに選択した分類とファイルに適用されたトレーニングラベルを比較してスコアを生成します。詳しくは、スコアはどのように算出されるのですか？をご覧ください。

トレーニング実行後、モデルの精度を確認できます。

トレーニング実行を開始するには:

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルの詳細] ページのモデルの [アクション] で、[詳細を表示] を選択します。
ページ上部のトレーニングパネルで、[トレーニング実行を開始] をクリックします。
注: このボタンは、ラベル付け担当者が最小数のトレーニングファイルにラベル付けしている場合にのみ使用できます。

トレーニング後: モデルスコアを確認する

トレーニング実行後、モデルは各ラベルオプションのパーセンテージスコアとともにリリースされます。各スコア（再現率スコア）は、モデルがテスト後に正しく分類したトレーニングサンプルの割合です。

50%未満 - 低精度。モデルに適切なデータがないため、まだ準備ができていません。
50～80% - 中程度の精度。モデルの準備が限定的に整っている可能性があります。
80%超 - 高精度。このモデルは組織のファイルを分類する準備が整っています。

トレーニング実行後にモデルの精度を確認するには:

[モデルの詳細] ページの以下の場所で、モデルスコアを確認できます。

ページ上部のトレーニング結果パネルの [現在使用しているファイルとスコア] で
[現在のトレーニングデータセット] パネル

Gemini のカスタム指示を作成する

Gemini の指示セットを作成するには、まず指示を含む事前定義ラベルを選択するか、既存の分類ラベルを選択する必要があります。開始する前に、既存のラベルが必要な設定条件を満たしていることを確認してください。詳しくは、このページの分類ラベルを選択または作成するをご覧ください。

Gemini のカスタム指示を作成するには:

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[Gemini を使用する] をクリックします。
[Gemini が適用するラベルを選択] ページで、次のいずれかを選択します。
- [事前定義されたラベルを適用する] を選択して、編集可能なテンプレートの手順を含む事前定義されたラベルを使用します。
- 組織の既存のラベルを使用するには、[独自のラベルを適用する] を選択します。
新しいラベルが必要な場合は、[ラベルを作成] をクリックして、新しいブラウザタブでラベルマネージャーを開きます。
- 注: ラベルマネージャーのタブで新しいラベルを作成して公開したら、[Gemini を使用してラベルを適用する] タブに戻り、ページを更新して選択肢を更新します。
[独自のラベルを適用する] を選択した場合は、[分類ラベル] プルダウンからラベルを選択します。
[フィールド名] プルダウンをクリックし、フィールドを選択します。
[続行] をクリックします。
[Gemini への指示の詳細を確認する] ページで、Gemini が組織のデータを分類するうえで役立つように、各ラベルオプションについて明確で包括的な指示を入力します。各オプションについて、次の詳細情報を記載します。
- オプションが表すもの（カテゴリ、タイプ、特性など）
- Gemini がオプションを特定する方法（探す手がかりやキーワードなど）
- オプションを適用すべきでない状況など、Gemini が例外を処理する方法
[続行] をクリックします。
[自動適用の対象となるラベルオプションを選択する] ページで、Gemini が自動的に適用する特定のラベルオプションのチェックボックスをオンにします。
- 注: Gemini は、オフになっているオプションをドライブ内のファイルに適用しません。
[続行] をクリックします。
[確認してカスタム指示に名前を付ける] ページで、[名前*] フィールドにカスタム指示のわかりやすい名前を入力します。詳細を確認して、正確であることを確認します。
[保存] または [保存して自動適用を設定] をクリックします。

AI 分類をオンにする

Gemini の手順を設定するか、カスタムモデルをトレーニングして最低限の精度（50% 以上）を達成したら、ラベルオプションを選択して、ファイルの自動ラベル付け（自動適用）を有効にできます。カスタムモデルで最適な結果を得るには、すべてのラベルオプションのモデルスコアが 80% 以上になるまで待つことをおすすめします。

自動適用を有効にするには

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルの詳細] ページのモデルの [アクション] で、[詳細を表示] を選択します。
トレーニングパネルで、[自動適用を設定] をクリックします。
注: このボタンは、1 つ以上のラベルオプションの精度が 50% に達した場合にのみ使用できます。

または、以前に自動適用を設定したことがある場合は、[AI がラベルを付けたファイル] で [自動適用を編集] をクリックします。
AI モデルに自動適用を許可するラベルオプションのチェックボックスをオンにします。
[保存して次へ] をクリックして、モデルがラベルを自動適用するファイルの所有者となる組織部門またはグループを選択します。デフォルトの設定は、最上位の親組織です。
または、[保存] をクリックして、後でユーザーを選択します。
ユーザーを選択するように選択した場合は、横にある組織部門または設定グループを選択します。
グループの設定は組織部門の設定をオーバーライドします。詳細
オンをクリック- 次のいずれかのオプションでラベルが自動適用されます。
[保存] をクリックします。
[モデルの詳細] ページで、ルールの [現在の自動適用のステータス] が [オン] になります。

注: ドライブのイベントログを使用して、AI 分類をモニタリングできます。詳しくは、後述する AI 分類ラベルのイベントをモニタリングするをご覧ください。

AI 分類がファイルをスキャンするタイミング

ユーザーが所有するファイルと共有ドライブで自動適用が有効になると、AI 分類は 1 ～ 2 週間以内に少なくとも 1 回は（保存中の）それらのファイルをスキャンします。AI 分類は、ファイルのアップロード時や変更時にもファイルをスキャンします。また、ファイルの内容が変更された場合は、適用されたラベルが変更されることがあります。

注: Gemini の手順で AI 分類を使用する場合は、非アクティブなファイルのスキャンを手動で有効にする必要があります。この機能を有効にするには、[手順] ページで [非アクティブなファイルにラベルを適用する] をクリックします。

自動適用の競合の処理方法

データ保護ルール

データ保護ルールで設定されたラベル値は AI 分類よりも優先され、どちらもデフォルトの分類よりも優先されます。

複数のカスタムモデルまたは Gemini の指示

同じファイルに対して、2 つ以上の AI 分類ソースが同じラベルフィールドの異なるラベルオプションを適用しようとした場合、ラベルのオプションリストの上位にあるオプションが適用されます。たとえば、ラベルマネージャーに次の 3 つのオプションを含む項目を持つラベルがあるとします。

機密
内部
一般公開

同じファイルに対して、AI 分類ソース 1 がラベルを [機密] に設定し、ソース 2 がラベルを [公開] に設定した場合、ラベルのオプションリストの上位にある [機密] が適用されます。ルールを設定する前に、ラベルの項目が優先度の高い順にリストされていることを確認してください。

ユーザーが適用したラベル

ユーザーがファイルに適用したラベルは、AI が適用したラベルよりも優先されます。つまり、AI 分類では、ユーザーが以前に設定したラベルは変更されません。

注: ユーザーが AI ラベル付きファイルを承認または変更すると、そのラベルは「ユーザーが適用した」と見なされ、AI 分類でその値が変更されることはなくなります。

モデルをモニタリングする

ドライブイベントログで、AI 分類によるファイルのラベル付けの詳細を確認します。各ラベルオプションについて、ログには自動適用を使用して分類されたファイルの数と、自動適用されたラベルを承認または変更したユーザーの数が表示されます。自動適用されたラベルに対してアクションを実行するには、権限が必要です。

自動適用されたラベルを操作するために必要な権限

自動適用されたラベルを操作するには、ファイルとラベルの権限が必要です。分類ラベルの権限は、ラベルマネージャーで設定できます。詳しくは、組織の分類ラベルを作成するをご覧ください。

自動適用されたラベルを表示するには、分類ラベルに対する [このラベルの表示が可能] 権限が必要です。
自動適用されたラベルを承認して変更するには、分類ラベルに対する [ラベルの適用と値の設定が可能] 権限が必要です。また、ファイルの編集者またはオーナーである必要があります。

ドライブのイベントログで AI 分類イベントを表示する

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルの詳細] ページの [AI ラベル付きファイル] で、イベントを表示するラベルオプションの [ファイルを表示] を選択します。
新しいタブでセキュリティ調査ツールが開き、[ラベルの適用] と [ラベルフィールドの値の変更] という AI 分類関連の 2 つのイベントに関するドライブのログの検索結果が表示されます。
イベントの [説明] をクリックすると、次のような詳細情報が表示されます。
- ラベル付けされたドキュメントの名前とタイプ
- ドキュメントに割り当てられたラベルフィールドの値（例: [機密]、[制限付き]）

Gemini へのカスタム指示のユーザー承諾率を確認する

AI 分類の [モデルの詳細] ページにある [ユーザーの承認] グラフには、過去 180 日間のユーザーフィードバックから得られた指示のパフォーマンスデータが表示されます。

指標には次のものがあります。

ユーザーが確認済み - Gemini で適用されたラベルオプションを承認または変更するために、自動ラベルバナーを操作したユーザーの合計数。
ユーザーが承認 - Gemini が提案した特定のラベルを保持することを選択したユーザーの合計数。

モデルの管理

分類ラベルの自動適用を無効にする

すべてのラベルオプションまたは特定のラベルオプションの自動適用をオフにするには:

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルの詳細] ページのモデルの [アクション] で、[詳細を表示] を選択します。
[AI がラベルを付けたファイル] で [自動適用を編集] をクリックします。
自動適用を無効にするラベルオプションのチェックボックスをオフにします。
または、自動適用を完全に停止するには、すべてのオプションのチェックボックスをオフにします。

特定の組織部門またはグループに対して自動適用を完全にオフにするには

特定の組織部門またはグループのユーザーが所有するコンテンツに対して自動適用を完全に無効にできます。

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルの詳細] ページのモデルの [アクション] で、[詳細を表示] を選択します。
ページ上部の [その他の操作] メニューで、[自動適用を管理] [有効な組織部門/グループを更新] をクリックします。
左側の組織部門またはグループをクリックして選択します。
[オフ - ラベルは自動適用されません] を選択します。
[保存] をクリックします。

カスタムモデルまたは Gemini へのカスタム指示を削除する

たとえば、精度が許容できない場合は、カスタムモデルや Gemini の指示を削除する必要があります。カスタムモデルまたは Gemini へのカスタム指示を削除すると、そのすべての AI 分類設定が完全に削除されます。注:

モデルまたは Gemini へのカスタム指示で使用されているラベルが AI 分類設定からリンク解除され、モデルまたは Gemini へのカスタム指示の履歴が削除されます。ただし、ラベル自体は削除されず、ラベルマネージャーで引き続き管理できます。
（カスタムモデルのみ）トレーニングラベルはファイルに残ります。モデルを削除した後、同じトレーニングラベルを使用するように新しいカスタムモデルを構成できます。既存のトレーニングラベルとトレーニングファイルを使用して再トレーニングすると、モデルのパフォーマンスは同様になります。
モデルに対して有効にした自動適用のラベル付けは直ちに停止します。ユーザーが承認または変更していないファイルに以前自動適用されたラベルを削除するか、保持するかを選択できます。
同じ分類ラベルを使用して新しいモデルまたは Gemini の指示を再作成すると、AI 分類機能は以前の分類の結果を上書きします。これにより、組織のドライブファイルを再処理できます。これは、モデルや指示の品質が使用開始時から大幅に向上した場合に便利です。

モデルまたは手順を削除するには:

Google 管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] に移動します。

データ分類に移動

DLP ルールを表示および管理する管理者権限が必要です。
[AI 分類] セクションで、[保存済みモデルを表示] をクリックします。
[モデルリスト] ページで、モデルまたは手順の横にある [アクション] をクリックし、[モデルを削除] または [手順を削除] を選択します。ダイアログには、削除の影響が一覧表示され、以前に適用されたラベルを保持するか破棄するかを決定できます。
- 適用されたラベルを保持 - これらの指示のいずれかのバージョンで以前に適用されたラベルは、ファイルに残ります。
- 適用されたラベルを削除する - これらの指示のいずれかのバージョンで以前に適用されたラベルは、ファイルから削除されます。ラベルが削除されるまでに最長で 2 週間ほどかかることがあります。ユーザー、ルール、別の AI モデル、Gemini へのカスタム指示によって変更されたラベルは削除されません。
チェックボックスをオンにして、続行すると、この操作は元に戻せないことを了承したことになります。に同意します。
続行するには、[モデルを削除] または [カスタム指示を削除] をクリックします。

よくある質問

トレーニングラベルと分類ラベル

トレーニングラベルと分類ラベルにはどのような要件がありますか？

分類ラベルとトレーニングラベルの両方が次の条件を満たしている必要があります。

オプションの数は 2～7 個にする必要があります。
オプションの順序は同じである必要があります。
公開している必要があります。
ラベルに異なるアクセス権限が設定されている。トレーニングラベルを使用できるのは、モデルをトレーニングできる指定されたラベル付け担当者のみにする必要があります。分類ラベルへのアクセス権限はもっと広範に設定できます。

トレーニングラベルを手動で作成するにはどうすればよいですか？

モデルの設定時にトレーニングラベルを自動的に作成するのがベストプラクティスですが、次のガイドラインに沿ってラベルマネージャーで手動で作成することもできます。

ラベルが必要なラベルの条件を満たしていることを確認します。
トレーニングラベルに「トレーニング」という言葉を付けておけば、指定されたラベル付け担当者がトレーニングデータセットの作成時にそのラベルを認識し、適用しやすくなります。
トレーニングラベルに説明フィールドを追加しておくことで、指定されたラベル付け担当者にそのラベルの目的を理解してもらいやすくなります。
ラベルの権限は、指定されたラベル付け担当者のみ、つまりモデルのトレーニング用のファイルを識別する担当者のみに設定してください。このためにはラベル付け担当者用に作成した設定グループを使用します。

分類ラベルをトレーニングラベルとして使用することは可能ですか？

いいえ。分類ラベルとトレーニングラベルは分ける必要があります。分類ラベルとして選択したラベルは、トレーニングラベルとして使用できません。

Gemini の指示により、Google が私の個人データを使用してグローバルモデルをトレーニングすることはありますか？

いいえ。すべてのオペレーションは厳密な分離境界内で実行されます。内部のドライブのコンテンツと関連するプロンプトは、承認された Workspace 環境内で安全に分離され、Google のモデルのトレーニングに使用されることはありません。プライバシーとセキュリティに対する Google の取り組みについて詳しくは、プライバシーハブをご覧ください。

トレーニングデータセット

モデルのトレーニングに適しているのはどのようなファイルですか？

モデルのトレーニングで最良の結果を得るには、指定されたラベル付け担当者が次のガイドラインに沿うようにしてください。

各ファイルの文字数を 500 文字以上にする。
組織内でユーザーが作成、共有、使用するコンテンツを表すファイルを選択する。
各ラベルオプションでラベル付けするファイルをほぼ同数にする。各オプションにつき少なくとも 100 ファイルを選択します。こうすることで、モデルがデータを包括的に理解しやすくなり、スコアが向上します。
オプションのタイプごとに代表的な各種ファイルを含める。たとえば、契約書も組織内で一般的に機密扱いになっているのであれば、100 通の履歴書のみを機密ファイル形式の代表例とすることは避けてください。
トレーニングラベルは、組織が所有するファイル（ユーザーが直接所有しているファイル、または共有ドライブに保存されているファイル）にのみ適用する。AI 分類では、外部ユーザーが所有しているファイルや、外部の共有ドライブに格納されているファイルは処理されません。

以前にラベル付けされたファイルでモデルをトレーニングできますか？

以前にラベル付けされたファイルでのトレーニングは現時点ではできません。モデルでは、ファイルに自動適用するラベルのレプリカとしてトレーニングラベルが必要ですが、同じラベルにすることはできません。

モデルは複数の言語でトレーニングできますか？

このモデルは複数の言語をサポートしていますが、トレーニングデータには、オプションのタイプと言語ごとにファイルの代表サンプルを含める必要があります。これにより、モデルを正常にトレーニングするために必要なファイルの数が増えます。ラテン文字ベースの言語のみがサポートされています。

トレーニング中にスコアはどのように計算されますか？

トレーニング中、AI モデルは入力データの 75% を使用してファイルにラベルを付ける方法をトレーニングし、25% を自身のパフォーマンスを定期的にテストするために確保します。つまり、ラベル付きファイルの 25% については、どのラベルが適用されているのかを知らないかのようにファイルを分析します。次に、AI モデルは独自のラベル選択を行い、ラベル付け担当者によって適用された実際のラベルと比較します。スコアは、リザーブされているファイルのうち適切なラベルが正しく割り当てられた割合を示しています。

モデルをトレーニングした後、再トレーニングを自動的に停止するようにモデルを「フリーズ」できますか？

AI 分類モデルは、ドライブ内のファイルを使用してトレーニングされます。これらのファイルが削除されると（多くの場合、Google Vault の保持スケジュールに従って）、ファイルのコンテンツが何らかの形で残らないように、モデルも削除する必要があります。そのため、モデルの再トレーニングは継続的なループで行われ、一時停止することはできません。

ユーザーはラベルやフィールドの値を変更または修正できますか？

権限を持つユーザーはラベルまたはフィールドの値を更新できますが、その変更に基づいて AI 分類で分類モデルが変更されることはありません。モデルがラベルとフィールド値を誤って適用していることに気付いた場合は、指定されたラベル付け担当者に、ファイルに正しいトレーニングラベルを割り当てるよう依頼できます。AI 分類は、このデータを次のモデルのセルフトレーニングサイクルに組み込みます。

自動適用

AI 分類で画像、動画、音声ファイルを評価できますか？

AI 分類では、ドライブの DLP と同じインデックス登録可能なテキスト処理が使用されます。ドライブがインデックス登録可能なテキストを抽出できるファイルには、AI 分類ラベルを適用できます。これには、画像からテキストを抽出する光学式文字認識（OCR）が含まれます。ただし、AI 分類では動画ファイルや音声ファイルは評価されません。

AI 分類は、デリケートなコンテンツのみにラベルを付けるために使用できますか？

デリケートなコンテンツは AI 分類器の主要な焦点ですが、付いているオプションが 4 つまでのラベルであればどれでも、自動ラベル付け用にトレーニングできます。分類ラベルは、監査、見つけやすさ、保持管理のためにも使用されます。

クライアントサイド暗号化（CSE）が有効になっている場合、AI 分類は機能しますか？

Google は CSE で暗号化されたファイルを復号できないため（復号できるのはユーザーの秘密暗号鍵のみ）、AI 分類では CSE で暗号化されたファイルでトレーニングを行うことができず、これらのファイルにラベルを自動的に適用することもできません。

AI 分類は、自動適用されたラベルをどのように、いつ修正しますか？

自動適用が有効になると、AI 分類は、十分なテキストを抽出できるすべての保存済みファイルをスキャンして分類します。これらのファイルは少なくとも 1 回スキャンされます。

AI 分類は、コンテンツの変更に伴い、ファイルを定期的に再処理します。コンテンツが変更されると、ファイルの予測結果が異なる場合があります。AI 分類にファイルの予測オプションが古いものと新しいものの両方がある場合、オプションリストの上位にあるオプションが優先されます。たとえば、ラベルマネージャーのフィールドに次の 3 つのオプションがあるとします。

機密
内部
一般公開

AI 分類がファイルを [内部] として分類しており、AI 分類モデルが [機密] と予測されるようなコンテンツの変更があったとします。この場合、ファイルの分類は [機密] に変更されます。ただし、AI 分類モデルが [公開] を予測した場合、ファイルの分類は [内部] のままになります。

自動適用されたラベルと、ユーザーが確認または変更したフィールド値は、AI 分類では変更されません。

モデルが変更された場合、既存のファイルは自動的に再評価されますか？

ファイルは、作成または変更されると、最新のモデルで処理されます。新しいモデルバージョンがリリースされても、既存のファイルが自動的に再処理されることはありません。ただし、モデルは特定のモデルの更新や再トレーニングとは関係なく、最新バージョンを使用してすべてのファイルを定期的に再処理することがあります。

複数の分類方法が有効になっている場合、AI 分類は他の分類方法よりも優先されますか？

データ分類はオーバーライドできます。データ分類は次の順序で行われます。

ユーザーによる上書きを許可しない DLP ルール
手動による分類
ユーザーによる上書きが可能な DLP ルール
AI 分類
デフォルトの分類

ラベルまたはフィールドを削除すると、下位階層の分類メカニズムが有効になります。たとえば、ユーザーがラベルを削除したファイルに、後で AI 分類によって同じラベルが自動的に適用されることがあります。

どのような形式のファイルに AI 分類でラベルを適用できますか？

AI 分類では、ドライブの DLP と同じインデックス登録可能なテキスト処理が使用されます。詳しくは、DLP でスキャンされるファイル形式の一覧をご覧ください。音声ファイルと動画ファイルはサポートされていません。
AI 分類でラベルを適用するには、ファイルに最低限のテキストが必要です。そのため、非常に短いドキュメントやテキスト量の少ない画像など、一部のファイルは分類されない場合があります。

自動適用が無効になっているオプションを変更するとどうなりますか？

スキャン中に、自動適用が無効になっているオプションがファイルに含まれていると予測された場合、AI 分類はラベルまたはフィールドの値をファイルに適用しません。

AI 分類で以前にラベルが付けられたファイルでは、オプションが無効になった後も、適用されたラベルとオプションの値が保持されます。

自動適用されたラベルをロールバックできますか？

ラベルの適用を元に戻すことはできません。広範囲にデプロイする前に、少数のユーザーでモデルを調整してテストすることをおすすめします。たとえば、一時的なラベルを使用してモデルをトレーニングできます。その後、モデルのパフォーマンスが満足のいくものになったら、モデルを削除して同じトレーニングラベル（同じトレーニングデータセット）で新しいモデルを作成し、永続ラベルを適用してモデルを「リセット」できます。

Gemini モデルとカスタムモデル

Gemini の指示による AI 分類は、既存のカスタムモデルを完全に置き換えますか？

いいえ。Gemini の手順は、補完的な代替手段として機能します。Classic モデルは、過去のデータパターンに合わせて調整された、顧客固有の絶縁モデルを構築しますが、Gemini の指示では、事前トレーニング済みの基盤モデルを使用して、ユーザーが作成したカスタムテキストベースのルールに照らしてコンテンツを評価します。

Gemini の指示と従来のモデルのどちらを使用するかは、どのように判断すればよいですか？

組織は単一のアーキテクチャのみを選択する必要はありません。組織のニーズに基づいて、両方のモードを組み合わせて使用し、データ分類のさまざまなフェーズに対応できます。

データ分類手順はどのような要素で構成されていますか？

分類指示は、Gemini に提供される構造化された設計図です。Gemini がデータを分類するうえで役立つように、各ラベルオプションについて明確で包括的な指示の詳細を入力してください。オプションが表す内容、Gemini がオプションを識別する方法、例外の処理方法などを入力します。

Gemini AI の分類動作

Gemini が同じファイルまたはほぼ同じファイルに異なるラベルオプションを割り当てることがあるのはなぜですか？

LLM は本質的に決定論的ではなく、確率論的です。従来のコードは固定されたロジックに従って、特定の入力に対して同じ出力を生成しますが、LLM は統計的確率に基づいてレスポンスを生成します。このプロセスは、「Temperature」などの内部パラメータの影響を受ける可能性があり、モデルの選択にばらつきが生じます。また、いくつかの外部変数によってモデルの内部推論が変化し、同一またはほぼ同一のファイルに対して異なる結果が生じる可能性があります。これらの要因には、基盤となるモデルバージョンの更新、システムレベルの指示の改善、分類リクエストの特定の日時などが含まれます。そのため、これらの動的要素により、Gemini は一意のコンテキストウィンドウ内で各ファイルを評価します。これにより、ラベルの割り当てが異なる場合があります。

AI 分類を使用した Google ドライブ ファイルの自動ラベル付け コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

AI 分類を使用する

始める前に

モデルを作成する

分類ラベルを選択または作成する

トレーニング ラベルを作成する

モデルを作成する

モデルをトレーニングする

トレーニング データセットを作成する

トレーニング実行を開始する

トレーニング後: モデルスコアを確認する

Gemini のカスタム指示を作成する

AI 分類をオンにする

自動適用を有効にするには

AI 分類がファイルをスキャンするタイミング

自動適用の競合の処理方法

モデルをモニタリングする

自動適用されたラベルを操作するために必要な権限

ドライブのイベントログで AI 分類イベントを表示する

Gemini へのカスタム指示のユーザー承諾率を確認する

モデルの管理

分類ラベルの自動適用を無効にする

カスタムモデルまたは Gemini へのカスタム指示を削除する

よくある質問

トレーニング ラベルと分類ラベル

トレーニング ラベルと分類ラベルにはどのような要件がありますか？

トレーニング ラベルを手動で作成するにはどうすればよいですか？

分類ラベルをトレーニング ラベルとして使用することは可能ですか？

Gemini の指示により、Google が私の個人データを使用してグローバル モデルをトレーニングすることはありますか？

トレーニング データセット

モデルのトレーニングに適しているのはどのようなファイルですか？

以前にラベル付けされたファイルでモデルをトレーニングできますか？

モデルは複数の言語でトレーニングできますか？

トレーニング中にスコアはどのように計算されますか？

モデルをトレーニングした後、再トレーニングを自動的に停止するようにモデルを「フリーズ」できますか？

ユーザーはラベルやフィールドの値を変更または修正できますか？

自動適用

AI 分類で画像、動画、音声ファイルを評価できますか？

AI 分類は、デリケートなコンテンツのみにラベルを付けるために使用できますか？

クライアントサイド暗号化（CSE）が有効になっている場合、AI 分類は機能しますか？

AI 分類は、自動適用されたラベルをどのように、いつ修正しますか？

モデルが変更された場合、既存のファイルは自動的に再評価されますか？

複数の分類方法が有効になっている場合、AI 分類は他の分類方法よりも優先されますか？

どのような形式のファイルに AI 分類でラベルを適用できますか？

自動適用が無効になっているオプションを変更するとどうなりますか？

自動適用されたラベルをロールバックできますか？

Gemini モデルとカスタムモデル

Gemini の指示による AI 分類は、既存のカスタムモデルを完全に置き換えますか？

Gemini の指示と従来のモデルのどちらを使用するかは、どのように判断すればよいですか？

データ分類手順はどのような要素で構成されていますか？

Gemini AI の分類動作

Gemini が同じファイルまたはほぼ同じファイルに異なるラベル オプションを割り当てることがあるのはなぜですか？

AI 分類を使用した Google ドライブファイルの自動ラベル付け

トレーニングラベルを作成する

トレーニングデータセットを作成する

トレーニングラベルと分類ラベル

トレーニングラベルと分類ラベルにはどのような要件がありますか？

トレーニングラベルを手動で作成するにはどうすればよいですか？

分類ラベルをトレーニングラベルとして使用することは可能ですか？

Gemini の指示により、Google が私の個人データを使用してグローバルモデルをトレーニングすることはありますか？

トレーニングデータセット

Gemini が同じファイルまたはほぼ同じファイルに異なるラベルオプションを割り当てることがあるのはなぜですか？