使用 AI 分類功能自動為 Google 雲端硬碟檔案加上標籤

Frontline Plus 和 Enterprise Plus 都提供這項功能。這項功能也包含在 Gemini Enterprise Legacy、Gemini Education Premium 和 AI Security 加購項目中。比較外掛程式

Google 雲端硬碟資料分類標籤可做為檔案的描述性中繼資料,用於資料保護、稽核調查和保留等各種功能。Google 雲端硬碟的 AI 分類功能可自動為檔案加上標籤,不必進行程式設計。

AI 分類方法有 2 種:

  • 自訂模型:根據一組機構訓練資料,建構機構專屬的機器學習模型。管理員可以控管模型訓練時使用的資料。模型專屬於貴機構。
  • 使用 Gemini (Beta 版):使用 Gemini 大型語言模型 (LLM) 檢查檔案內容,並根據您定義的自訂純文字指令自動套用標籤。這種方法不需要預先收集資料或訓練模型。

您最多可建立 5 個專屬的 AI 分類自訂模型或 Gemini 指令,並可彈性地在總數限制內同時使用這兩種方法。

注意:如要讓 AI 分類功能為檔案加上標籤,檔案必須位於共用雲端硬碟中,或擁有者須具備支援分類標籤的授權。

使用 AI 分類

請按照以下基本步驟設定 AI 分類功能,自動為雲端硬碟中的新舊檔案加上標籤。

1. 建立自訂模型或 Gemini 指令:選擇或建立要自動套用至檔案的分類標籤

注意:如要建立自訂模型,您也需要建立訓練標籤。用於標記範例檔案,模型會使用這些檔案學習如何分類資料。

2. (僅限自訂模型) 訓練模型建立標籤後,指定的標籤人員會使用訓練標籤分類雲端硬碟檔案,建立訓練資料集。接著,模型會使用資料集,學習如何分類機密檔案。

3. 啟用 AI 分類功能模型訓練完成或設定 Gemini 指令後,您可以設定自動為檔案加上標籤,也就是所謂的自動套用。設定時,請選取要啟用哪些標籤選項,以及要讓 AI 分類功能為哪些使用者擁有的檔案套用標籤。模型或指令就會開始標記機密檔案。

4. 監控模型您可以使用雲端硬碟事件記錄,監控分類的檔案數量,以及接受或修改自動套用標籤的使用者人數 (如果他們有權限的話)。

事前準備

  • 瞭解分類標籤的運作方式和建立方式。詳情請參閱「以分類標籤管理員身分開始使用」。
  • 選擇指定標籤人員:這是貴機構的一組使用者,他們可以手動將訓練標籤正確套用至機密檔案。
  • 為指定的標籤人員建立專屬的配置群組。如需操作說明,請參閱「使用配置群組自訂服務設定」。
  • 在管理員帳戶中啟用下列權限:管理分類標籤、管理資料遺失防護規則,以及查看資料遺失防護規則。

建立模型

如要建立模型,請先選取現有的分類標籤或建立新標籤。接著,您需要建立相符的訓練標籤,可以自動建立 (建議),也可以手動使用標籤管理工具建立,然後供指定的標籤人員使用。

選擇或建立分類標籤

您必須為雲端硬碟和文件啟用分類功能。訓練完成後,AI 模型會自動為機密的雲端硬碟檔案套用分類標籤。模型訓練時,每個標籤只會用到一個欄位,且這必須是「標記清單」「選項清單」欄位。

建議使用標記為機密等級標籤,因為這類標籤會醒目顯示在文件中。

當您使用選項清單或標記清單欄位做為分類標籤時,必須符合下列規定:

  • 至少要有 2 個選項,最多 7 個
  • 必須完成發布

如果現有的標籤符合上述規定,即可做為分類標籤使用。否則,請在設定模型 (本頁稍後會說明) 之前或設定模型時,使用標籤管理工具建立標籤。詳情請參閱「為貴機構建立分類標籤」。

建立訓練標籤

訓練標籤與分類標籤幾乎相同,且僅供指定標籤人員用於訓練用途。建立模型時 (本頁稍後會說明),您可以自動建立訓練標籤,確保訓練標籤與分類標籤相符。

您也可以選擇在設定模型之前或設定模型時,使用標籤管理工具手動建立訓練標籤。詳情請參閱本頁下方的「如何手動建立訓練標籤?」。

建立模型

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「建立模型」
  3. 在「分類標籤」清單中,選取現有的分類標籤和欄位來訓練模型,或按一下「建立標籤」,使用標籤管理工具建立標籤。

    如果您在標籤管理工具中建立標籤,請返回「建立模型」頁面。你可能需要重新整理頁面,才能在清單中看到新標籤。

  4. 在「欄位名稱」清單中,選取要使用的分類標籤欄位。
  5. 按一下「繼續」
  6. (選用) 自動建立並發布與分類標籤相符的訓練標籤:
    1. 按一下「建立訓練標籤」
    2. 在顯示的訊息中按一下「更新標籤權限」。標籤管理工具隨即會在另一個分頁中,以編輯模式開啟標籤。
    3. 依序按一下「權限」接下來「編輯」,然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
    4. 按一下「儲存」,然後關閉「標籤管理工具」分頁。

      注意:您也可以日後再設定標籤權限。不過,請務必確保只有標籤人員能存取訓練標籤。

  7. (選用) 如果您已建立訓練標籤,請在「訓練標籤」清單中選取該標籤。
  8. (選用) 如要立即建立訓練標籤,請按一下「前往標籤管理工具」

    重要事項:請確保標籤符合訓練標籤條件,並設定標籤權限,確認只有標籤人員可以存取。詳情請參閱本頁下方的「訓練標籤指南」。

    返回「建立模型」頁面。您可能需要重新整理頁面,才能在清單中看到新的訓練標籤。

  9. 在「建立模型」頁面中,按一下「繼續」
  10. 輸入模型的描述性名稱。
  11. 按一下「建立模型」

建立模型後,「模型詳細資料」頁面會顯示您選取的訓練標籤和分類標籤。

訓練模型

如要訓練 AI 模型,請建立訓練資料集,然後開始執行初始訓練。在訓練期間,模型會從資料集中的樣本學習。

自動重新訓練:模型完成初始訓練後,每 2 週會重新訓練一次,以提升或維持準確度。您隨時可以手動重新訓練模型。每次執行訓練後,系統就會發布新模型,並重設每 2 週自動重新訓練的時間表。

建立訓練資料集

如要建立訓練資料集,指定的標籤人員必須依據各個標籤選項,將訓練標籤套用到至少 100 個檔案。舉例來說,假設標籤有 3 個選項 (例如「有知情必要」、「機密」和「公開」),則至少需要 300 個訓練檔案。不過,建議每個標籤選項都要有超過 100 個檔案,因為有些檔案可能不適用於訓練資料集。瞭解如何標記高品質訓練樣本

注意:訓練資料集最多可包含 100 萬個檔案。

建立模型後,系統會在約 24 小時內,自動檢查已加上標籤的訓練檔案數量。之後則會全天持續檢查。

如何查看已加上標籤的檔案數量:

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在模型的「動作」下方,選取「查看詳細資料」
  4. 在頁面頂端的面板中,查看「現有模型的訓練檔案數」下方加上標籤的檔案數量。

如果模型有足夠的檔案可用於訓練,即可準備開始訓練。

開始執行訓練

訓練執行通常需要 4 到 6 小時,但如果資料集較大,可能就需要更久。模型可能需多次訓練,才能學會如何準確標記檔案。

在訓練期間,模型會為檔案選取分類,並與套用至檔案的訓練標籤相比較,進而產生分數。詳情請參閱「分數如何計算」。

訓練執行後,您可以檢查模型準確度。

如何開始訓練:

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型詳細資料」頁面中,選取模型「動作」下方的「查看詳細資料」
  4. 在頁面頂端的訓練面板中,按一下「開始執行訓練」

    注意:只有在標籤人員標記的訓練檔案數量達到下限時,這個按鈕才會顯示。

訓練後:查看模型分數

訓練完畢後,模型就會發布,並以百分比顯示各標籤選項的分數。每個分數 (稱為召回分數) 都代表模型在自行測試後,正確分類的訓練樣本占比:

  • 低於 50%:準確度低。表示模型尚未就緒,需要更詳盡的資料。
  • 50% 至 80%:準確度中等。代表模型可能只在特定情況下準備就緒。
  • 超過 80%:準確度高。表示模型已準備就緒,可為貴組織分類檔案了。

如何在訓練執行後檢查模型準確度:

在「模型詳細資料」頁面中,您可以在以下位置查看模型分數:

  • 在頁面頂端的訓練結果面板中,「目前使用的檔案和分數」的下方
  • 在「目前使用的訓練資料集」面板中

建立 Gemini 指令

如要建立一組 Gemini 指令,請先選取含有指令的預先定義標籤,或選擇現有的分類標籤。開始前,請確認現有標籤符合必要的設定條件。詳情請參閱本頁的「選擇或建立分類標籤」。

如何建立 Gemini 指令:

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「使用 Gemini」
  3. 在「選取 Gemini 要套用的標籤」頁面,選擇下列任一選項:
    • 選取「套用預先定義的標籤」,即可使用預先定義的標籤和範本指令,並進行編輯。
    • 選取「套用自己的標籤」,使用貴機構現有的標籤。
  4. 如需新標籤,請按一下「建立標籤」,在新的瀏覽器分頁中開啟標籤管理工具。
    • 注意:在標籤管理工具分頁中建立並發布新標籤後,請返回「使用 Gemini 套用標籤」分頁,然後重新整理頁面,更新可用選項。
  5. 如果選擇套用自己的標籤,請選取「分類標籤」下拉式選單,然後選取標籤。
  6. 按一下「欄位名稱」下拉式選單,然後選取欄位。
  7. 按一下「繼續」
  8. 在「查看 Gemini 指令詳細資料」頁面中,為每個標籤選項輸入詳盡明確的指令,協助 Gemini 分類貴機構的資料。請提供每個選項的下列詳細資料:
    • 選項代表的內容,例如類別、類型或特徵
    • Gemini 應如何找出選項,例如要尋找的線索或關鍵字
    • Gemini 應如何處理例外狀況,例如不應套用選項的情況
  9. 按一下「繼續」
  10. 在「選取符合自動套用條件的標籤選項」頁面中,勾選 Gemini 應自動套用的特定標籤選項。
    • 注意:Gemini 不會將未勾選的選項套用至雲端硬碟檔案。
  11. 按一下「繼續」
  12. 在「查看並命名指令」頁面的「名稱*」欄位中,輸入指令的描述性名稱。檢查並確認詳細資料正確無誤。
  13. 按一下「儲存」或「儲存並設定自動套用」

開啟 AI 分類功能

設定 Gemini 指令或訓練自訂模型達到最低準確率 (至少 50%) 後,即可選擇標籤選項並啟用自動檔案標籤功能,或稱自動套用。如要讓自訂模型發揮最佳效果,建議等到所有標籤選項的模型分數都達到至少 80% 後,再開始使用。

如何啟用自動套用功能

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型詳細資料」頁面中,選取模型「動作」下方的「查看詳細資料」
  4. 在訓練面板中,按一下「設定自動套用」

    注意:只有在至少 1 個標籤選項的準確度達到 50% 時,這個按鈕才會顯示。

    或者,如果您先前已設定自動套用功能,請在「由 AI 加上標籤的檔案」下方,按一下「編輯自動套用選項」

  5. 找出要允許 AI 模型自動套用的標籤選項,然後勾選旁邊的方塊。
  6. 按一下「儲存並繼續」,選取模型應自動為哪些組織單位或群組的檔案套用標籤。預設設定為頂層組織。

    或者按一下「儲存」,稍後再選取使用者。

  7. 如果您選擇選取使用者,請在側邊選取「組織單位」或「配置群組」

    群組設定會覆寫組織單位。瞭解詳情

  8. 點選「開啟 - 透過下列任一選項自動套用標籤」
  9. 按一下「儲存」

    在「模型詳細資料」頁面上,規則「目前的自動套用狀態」會顯示「開啟」

注意:您可以透過雲端硬碟事件記錄監控 AI 分類功能。詳情請參閱本頁下方的「監控 AI 分類標籤事件」。

AI 分類功能何時會掃描檔案

為使用者擁有的檔案和共用雲端硬碟啟用自動套用功能後,AI 分類功能在 1 到 2 週內,至少會掃描這些檔案 (靜態檔案) 一次。AI 分類功能也會在檔案上傳或修改時執行掃描,並在檔案內容變更時變更套用的標籤。

注意:使用 Gemini 指令搭配 AI 分類功能時,必須手動開啟非使用中檔案掃描功能。如要啟用這項功能,請按一下「說明」頁面上的「將標籤套用至閒置檔案」

自動套用功能發生衝突時的處理方式

資料保護規則

如果是資料保護規則設定的標籤值,優先順序會高於 AI 分類,但這兩者的優先順序都高於預設分類。

多個自訂模型或 Gemini 指令

當 2 個以上 AI 分類來源嘗試為同一個檔案套用相同標籤欄位的不同標籤選項時,系統會套用標籤選項清單中優先順序較高的選項。舉例來說,有一個標籤,其欄位在標籤管理工具中列出 3 個選項:

  1. 機密
  2. 內部
  3. 公開

如果 AI 分類來源 1 嘗試將標籤設為「機密」,來源 2 嘗試將同一檔案的標籤設為「公開」,則系統會套用「機密」,因為該選項在標籤選項清單中優先順序較高。因此設定規則前,請確認標籤欄位選項會按照您希望的優先順序列出。

使用者套用的標籤

如果是使用者套用至檔案的標籤,優先順序會高於 AI 套用的標籤,也就是說,AI 分類功能不會修改使用者先前設定的標籤。

注意:如果使用者接受或修改 AI 標籤檔案,系統會將標籤視為「使用者套用」,AI 分類功能也不會再修改標籤值。

監控模型

您可在雲端硬碟事件記錄中,詳細瞭解 AI 分類功能如何為檔案加上標籤。 記錄會依據各個標籤選項,顯示有多少檔案是以自動套用功能分類,以及有多少使用者接受或修改自動套用的標籤。使用者必須具備權限,才能對自動套用的標籤執行操作。

使用者調整自動套用標籤所需的權限

使用者必須具備檔案和標籤權限,才能調整自動套用的標籤。您可以在標籤管理工具中設定分類標籤的權限。詳情請參閱「為貴機構建立分類標籤」。

  • 如要查看自動套用的標籤,使用者必須具備分類標籤的「可查看這個標籤」權限
  • 如要接受及修改自動套用的標籤,使用者必須具備分類標籤的「可套用標籤及設定標籤值」權限,且是檔案的編輯者擁有者

在雲端硬碟事件記錄中查看 AI 分類事件

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型詳細資料」頁面的「AI 標籤檔案」下方,找到要查看事件的標籤選項,然後選取「查看檔案」

    安全調查工具會在新分頁中開啟,並按照下列兩項 AI 分類相關事件,顯示雲端硬碟事件記錄的搜尋結果:「已套用標籤」和「已變更標籤欄位值」

  4. 按一下事件「說明」,查看其他詳細資料,例如:
    • 已加上標籤的文件名稱和類型
    • 指派給文件的標籤欄位值 (例如「機密」或「受限」)

查看 Gemini 指令的使用者接受率

在 AI 分類的「模型詳細資料」頁面中,「使用者接受度」圖表會顯示過去 180 天內,系統根據使用者意見回饋得出的指令成效資料。

指標包括:

  • 使用者審查:與自動標籤橫幅互動的使用者總數,包括接受或修改 Gemini 套用的標籤選項。
  • 使用者接受:選擇保留 Gemini 建議特定標籤的使用者總數。

管理模型

停用分類標籤的自動套用功能

如何停用所有或特定標籤選項的自動套用功能:

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型詳細資料」頁面中,選取模型「動作」下方的「查看詳細資料」
  4. 在「由 AI 加上標籤的檔案」下方,按一下「編輯自動套用選項」
  5. 找到要停用自動套用功能的標籤選項,取消勾選相應的方塊。

    或者,如要完全暫停自動套用,請清除所有選項。

如何為特定組織單位或群組全面停用自動套用功能:

您可以對特定機構單位/群組內使用者擁有的內容,徹底停用自動套用功能。

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型詳細資料」頁面中,選取模型「動作」下方的「查看詳細資料」
  4. 在頁面頂端的「更多動作」選單中,依序點選「管理自動套用功能」接下來「更新已啟用的組織單位/群組」
  5. 按一下左側的組織單位或群組即可選取。
  6. 選取「關閉 - 不自動套用標籤」
  7. 按一下「儲存」

刪除自訂模型或 Gemini 指令

如果自訂模型或 Gemini 指令的準確度不盡理想,您可能需要刪除。刪除自訂模型或 Gemini 指令後,所有 AI 分類設定都會永久移除。注意:

  • 模型或 Gemini 指令中使用的標籤會與 AI 分類設定取消連結,模型或 Gemini 指令的記錄也會刪除。不過,標籤本身不會刪除,仍可在標籤管理工具中管理。
  • (僅限自訂模型) 訓練標籤仍會保留在檔案中。刪除模型後,您可以選擇設定新的自訂模型,使用相同的訓練標籤。如果使用現有的訓練標籤和檔案重新訓練模型,結果會很類似。
  • 模型若曾啟用自動套用標籤功能,該設定將立即停用。您可以選擇移除或保留先前自動套用至檔案的標籤,但使用者尚未接受或修改這些標籤。
  • 如果您使用相同的分類標籤重新建立新模型或 Gemini 指令,AI 分類功能會覆寫先前的分類結果。這樣一來,您就可以重新處理貴機構的雲端硬碟檔案。如果模型或指令的品質在您開始使用後大幅提升,這個方法就很有用。

如要刪除模型或指令:

  1. 在 Google 管理控制台中,依序點選「選單」圖示 接下來 「安全性」 接下來「存取權與資料控管」 接下來「資料分類」

    須具備「查看及管理資料遺失防護規則」的管理員權限。

  2. 在「AI 分類」部分,按一下「查看已儲存的模型」
  3. 在「模型清單」頁面中,按一下模型或指令旁的「動作」,然後選取「刪除模型」或「刪除指令」。對話方塊會列出刪除後的影響,並讓您決定是否要保留或捨棄先前套用的標籤:
    • 保留套用的標籤:檔案會保留這些指令 (不論版本) 先前套用的標籤。
    • 移除已套用的標籤:這些指令 (不論版本) 先前套用的標籤,都會從檔案移除,整個移除作業最多需要 2 週時間。不過,如果標籤曾由使用者、規則、其他 AI 模型或 Gemini 指令修改,就不會移除。
  4. 勾選方塊,確認您瞭解:繼續即表示您瞭解這項操作無法復原。
  5. 如要繼續,請按一下「刪除模型」或「刪除指令」

常見問題

訓練和分類標籤

訓練標籤和分類標籤需要符合哪些規定?

分類標籤和訓練標籤都必須符合下列條件:

  • 最少須有 2 個選項,最多 7 個。
  • 選項順序必須相同。
  • 必須完成發布。
  • 為標籤設定不同的存取權。訓練標籤應僅供可訓練模型的指定標籤人員使用。分類標籤的存取權設定則可較廣。

如何手動建立訓練標籤?

雖然最好能在設定模型時就自動建立訓練標籤,但您也可以按照下列指南,在標籤管理工具中手動建立標籤:
  • 確認標籤符合必要的標籤條件
  • 將訓練標籤標上「訓練」字樣,方便指定的標籤人員在建立訓練資料集時,辨識並套用標籤。
  • 新增訓練標籤的說明欄位,進一步協助指定的標籤人員瞭解用途。
  • 請務必使用您為標籤人員建立的配置群組,將標籤權限授予指定的標籤人員,他們會負責找出要用來訓練模型的檔案。

我可以將分類標籤當做訓練標籤使用嗎?

不行。分類標籤與訓練標籤不得相同。標籤一經選做分類標籤,就不會顯示為訓練標籤選項。

Gemini 指示會允許 Google 使用我的私人資料訓練全球模型嗎?

不會。所有作業都會在嚴格的隔離界線內進行。您的內部雲端硬碟內容和相關提示會安全地隔離在授權的 Workspace 環境中,不會用於訓練 Google 模型。如要進一步瞭解我們對隱私權和安全性的承諾,請前往隱私權專區

訓練資料集

哪些檔案適合用於訓練模型?

為確保訓練模型時能獲得最佳結果,請指示指定的標籤人員遵守下列規範:

  • 確認每個檔案至少有 500 個半形字元。
  • 所選檔案需反映使用者在貴組織中建立、共用和使用的內容。
  • 每個標籤選項標記的檔案數量需大致相同,且各選項至少要有 100 個檔案。這有利於模型全面解讀資料,進而提高分數。
  • 每種選項類型都要納入具代表性的檔案。舉例來說,如果合約在貴機構也是常見的「最高機密」檔案類型,「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。
  • 訓練標籤只能套用至貴組織擁有的檔案,包括使用者直接擁有的檔案,以及儲存在共用雲端硬碟中的檔案。AI 分類功能不會處理外部使用者擁有的檔案,或位於外部共用雲端硬碟中的檔案。

模型是否能使用先前加上標籤的檔案進行訓練?

目前無法使用先前加上標籤的檔案執行訓練。模型需要訓練標籤,才能複製要自動套用至檔案的標籤,但這兩個標籤不能相同。

模型可以使用多種語言訓練嗎?

這個模型支援多種語言,但請注意,訓練資料中的每種選項類型和語言,應包含各種具代表性的檔案。這麼做會增加成功訓練模型所需的檔案數量。系統僅支援以拉丁字元為基礎的語言。

訓練期間的分數如何計算?

在訓練期間,AI 模型會使用 75% 的輸入資料自我訓練,學習如何為檔案加上標籤,並保留 25% 的資料用於定期測試成效。也就是說,模型在分析這 25% 的檔案時,會將其視為不清楚套用何種標籤,但其實這些檔案皆已加上標籤。接著,模型會自行選擇標籤,並將這個標籤與指定標籤人員套用的實際標籤比較。最後,在保留的檔案中,有多少比例的檔案已分配到正確的標籤,就是分數的計算依據。

模型訓練完成後,是否可以「凍結」模型,停止自動重新訓練?

AI 分類模型會使用雲端硬碟中的檔案進行訓練。刪除這些檔案時 (通常是根據 Google 保管箱的保留時間表),模型也必須隨後刪除,確保檔案內容不會以某些形式保留。因此,模型會持續重新訓練,無法暫停。

使用者可否變更或修正標籤和欄位值?

具備權限的使用者可以更新標籤或欄位值,但 AI 分類功能不會根據這次異動來修改分類模型。如果您發現模型套用的標籤和欄位值有誤,可以請指定的標籤人員為檔案指派正確的訓練標籤。AI 分類功能隨後便會將這類資料納入,在模型的下一個自我訓練週期使用。

自動套用

AI 分類功能可以評估圖片、影片和音訊檔案嗎?

AI 分類功能與雲端硬碟資料遺失防護功能相同,採用可建立索引的文字處理技術。凡是可供雲端硬碟擷取並建立索引文字的檔案,都可以使用 AI 分類功能評估是否要套用標籤。光學字元辨識 (OCR) 功能可從圖片中擷取文字,因此也包含在內。不過,AI 分類功能不會評估影片或音訊檔案。

AI 分類功能是否只能用於為敏感內容加上標籤?

雖然 AI 分類功能的主要重心是在敏感內容,但只要標籤的選項不超過 4 個,在訓練後也能自動加上標籤。分類標籤也可用於稽核、尋獲度和保留管理。

開啟用戶端加密 (CSE) 時,AI 分類功能是否會運作?

由於 Google 無法解密以 CSE 加密的檔案 (只有您的私密加密金鑰可以),因此 AI 分類無法根據以 CSE 加密的檔案進行訓練,也無法自動將標籤套用至這些檔案。

AI 分類功能修改自動套用標籤的方式及時機為何?

啟用自動套用功能後,AI 分類功能會掃描並分類所有可擷取足夠文字的靜態檔案。系統會至少掃描這些檔案一次。

如果內容經過修改,AI 分類功能會定期重新處理檔案。內容變更可能會導致檔案出現不同的預測結果。如果 AI 分類功能針對某個檔案具備現有選項和新預測選項,系統會優先採用選項清單中優先順序較高的選項。假設某個欄位在標籤管理工具中列有三個選項:

  • 機密
  • 內部
  • 公開

假設 AI 分類功能將檔案歸類為「內部」,而在內容變更後,AI 分類模型預測為「機密」。這時檔案的分類就會變更為「機密」。不過,如果 AI 分類模型預測為「公開」,檔案的分類仍會保持為「內部」

AI 分類不會修改使用者已審查或修改過的自動套用標籤和欄位值。

如果模型有所變更,模型會自動重新評估現有檔案嗎?

系統會在檔案建立或修改時,使用最新模型處理檔案。新模型版本發布時,現有檔案不會自動重新處理。不過,模型可能會定期使用最新版本重新處理所有檔案,與特定模型更新或重新訓練無關。

如果採用多種分類方法,AI 分類是否會優先於其他方法?

資料分類方法可以覆寫。資料分類作業會按照以下順序執行:
  1. 沒有使用者覆寫的資料遺失防護規則
  2. 手動分類
  3. 有使用者覆寫的資料遺失防護規則
  4. AI 分類
  5. 預設分類
移除標籤或欄位可讓層級較低的分類機制生效。舉例來說,如果使用者移除含有標籤的檔案,之後依然可以透過 AI 分類功能自動套用相同標籤。

AI 分類功能可為哪些類型的檔案套用標籤?

  • AI 分類功能與雲端硬碟資料遺失防護功能相同,採用可建立索引的文字處理技術。詳情請參閱資料遺失防護功能掃描的檔案類型清單。系統不支援音訊和影片檔案。
  • 檔案必須包含一定數量的文字,AI 分類功能才能套用標籤。因此,系統可能不會分類某些檔案 (例如:非常短的文件和文字很少的圖片)。

停用自動套用選項會有甚麼影響?

掃描期間,如果 AI 分類功能預測檔案會有停用自動套用功能的選項,就不會為該檔案套用標籤或欄位值。

先前加上 AI 分類標籤的檔案,即使這個選項已停用,仍會保留已套用的標籤和選項值。

我可以復原自動套用的標籤嗎?

標籤一經套用就無法復原。建議您先對一小群目標對象測試及調整模型,再大規模部署。舉例來說,您可以使用臨時標籤訓練模型。接著,如果模型成效令人滿意,您可以「重設」模型,方法是刪除模型,然後使用相同的訓練標籤 (相同的訓練資料集) 建立新模型,但這次採用永久標籤。

Gemini 和自訂模型

使用 Gemini 指令進行 AI 分類是否會完全取代現有的自訂模型?

不會。Gemini 指令是互補的替代方案,雖然 Classic 模型會根據您的歷來資料模式,建構專為您量身打造的獨立客戶專屬模型,但 Gemini 指令會使用預先訓練的基礎模型,根據您編寫的自訂文字規則評估內容。

如何決定何時使用 Gemini 指令或傳統模型?

機構不必只選擇單一架構。您可以根據貴機構的需求,同時使用這兩種模式,在資料分類的不同階段提供支援。

資料分類指示由哪些元素組成?

分類指令是提供給 Gemini 的結構化藍圖。為協助 Gemini 分類資料,請為每個標籤選項輸入詳盡明確的指令詳細資料,包括選項代表的內容、Gemini 應如何識別選項,以及如何處理例外狀況。

Gemini AI 分類行為

為什麼 Gemini 有時會為相同或幾乎相同的檔案指派不同的標籤選項?

LLM 本質上是機率模型,而非決定性模型。傳統程式碼會遵循固定邏輯,針對特定輸入內容產生相同輸出內容,但 LLM 是根據統計機率生成回覆。這項程序會受到「溫度參數」等內部參數影響,這些參數會為模型的選擇引入一定程度的變異性。此外,多個外部變數可能會改變模型的內部推論,導致相同或幾乎相同的檔案產生不同結果。這些因素包括基礎模型版本更新、系統層級指令調整,甚至是分類要求的特定日期和時間。因此,Gemini 會在獨特的脈絡視窗中評估每個檔案,這有時可能會導致標籤指派結果不同。