AI 分類功能會使用貴機構訓練的自訂 AI 模型,自動為 Google 雲端硬碟中的機密內容加上標籤。即使不懂程式設計也無妨。管理員可以控管模型訓練時使用的資料,因此每個模型都是貴機構專屬,且只能由貴機構使用。您最多可為機構建立 5 個專屬的 AI 分類模型。
您可以在資料保護規則、保管箱等安全性政策的規範下,使用 AI 分類的檔案。
注意:如要讓 AI 分類功能為檔案加上標籤,檔案必須位於共用雲端硬碟中,或擁有者須具備支援分類標籤的授權。
AI 分類功能總覽
請按照以下基本步驟設定 AI 分類功能,自動為雲端硬碟中的新舊檔案加上標籤。
1. 建立模型:首先,請選擇或建立分類標籤,供 AI 模型在訓練完成後自動套用至檔案。您也可以建立訓練標籤,訓練模型識別貴機構的機密內容。接著,請建立 AI 模型來使用這些標籤。
2. 訓練模型:建立標籤後,指定的標籤人員會使用訓練標籤分類雲端硬碟檔案,建立訓練資料集。接著,模型會使用資料集,學習如何分類機密檔案。
3. 啟用 AI 分類功能:模型訓練完成後,您可以設定自動為檔案加上標籤,也就是所謂的自動套用。設定時,請選取要啟用哪些標籤選項,以及要讓 AI 分類功能為哪些使用者擁有的檔案套用標籤。這樣一來,模型就會開始自動標記機密檔案。
4. 監控模型:您可以使用雲端硬碟事件記錄,監控分類的檔案數量,以及接受或修改自動套用標籤的使用者人數 (如果他們有權限的話)。
事前準備
- 瞭解分類標籤的運作方式和建立方法。詳情請參閱「以分類標籤管理員身分開始使用」。
- 選擇指定標籤人員:這是貴機構的一組使用者,他們可以手動將訓練標籤正確套用至機密檔案。
- 為指定的標籤人員建立專屬的配置群組。如需操作說明,請參閱「使用配置群組自訂服務設定」。
- 在管理員帳戶中啟用下列權限:管理分類標籤、管理資料遺失防護規則和查看資料遺失防護規則。
建立模型
如要建立模型,請先選取現有的分類標籤或建立新標籤。接著,您需要建立相符的訓練標籤,可以自動建立 (建議),也可以手動使用標籤管理工具建立,然後供指定的標籤人員使用。
選擇或建立分類標籤
您必須為雲端硬碟和文件啟用分類功能。訓練完成後,AI 模型會自動為機密的雲端硬碟檔案套用分類標籤。模型訓練時,每個標籤只會用到一個欄位,且這必須是「標記清單」或「選項清單」欄位。
建議使用標記為機密等級標籤,因為這類標籤會醒目顯示在文件中:
當您使用選項清單或標記清單欄位做為分類標籤時,必須符合下列規定:
- 至少要有 2 個選項,最多 7 個
- 必須完成發布
如果現有的標籤符合上述規定,即可做為分類標籤使用。否則,請在設定模型 (本頁稍後會說明) 之前或設定模型時,使用標籤管理工具建立標籤。詳情請參閱「為貴機構建立分類標籤」。
建立訓練標籤
訓練標籤與分類標籤幾乎相同,且僅供指定標籤人員用於訓練用途。建立模型時 (本頁稍後會說明),您可以自動建立訓練標籤,確保訓練標籤與分類標籤相符。
您也可以選擇在設定模型之前或設定模型時,使用標籤管理工具手動建立訓練標籤。詳情請參閱本頁下方的「如何手動建立訓練標籤?」。
建立模型
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「建立模型」。
- 在「分類標籤」清單中,選取現有的分類標籤和欄位來訓練模型,或按一下「建立標籤」,使用標籤管理工具建立標籤。
如果您在標籤管理工具中建立標籤,請返回「建立模型」頁面。您可能需要重新整理頁面,才能在清單中看到新標籤。
- 在「欄位名稱」清單中,選取要使用的分類標籤欄位。
- 按一下「繼續」。
- (選用) 自動建立並發布與分類標籤相符的訓練標籤:
- 按一下「建立訓練標籤」。
- 在顯示的訊息中按一下「更新標籤權限」。標籤管理工具隨即會在另一個分頁中,以編輯模式開啟標籤。
- 依序按一下「權限」
「編輯」,然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
- 按一下「儲存」,然後關閉「標籤管理工具」分頁。
注意:您也可以日後再設定標籤權限。不過,請務必確保只有標籤人員能存取訓練標籤。
- (選用) 如果您已建立訓練標籤,請在「訓練標籤」清單中選取該標籤。
- (選用) 如要立即建立訓練標籤,請按一下「前往標籤管理工具」。
重要事項:請確保標籤符合訓練標籤條件,並設定標籤權限,確認只有標籤人員可以存取。詳情請參閱本頁下方的「訓練標籤指南」。
返回「建立模型」頁面。您可能需要重新整理頁面,才能在清單中看到新的訓練標籤。
- 在「建立模型」頁面中,按一下「繼續」。
- 輸入模型的描述性名稱。
- 按一下「建立模型」。
建立模型後,「模型詳細資料」頁面會顯示您選取的訓練標籤和分類標籤。
訓練模型
如要訓練 AI 模型,請建立訓練資料集,然後開始執行初始訓練。在訓練期間,模型會從資料集中的樣本學習。
自動重新訓練:模型完成初始訓練後,每 2 週會重新訓練一次,以提升或維持準確度。您隨時可以手動重新訓練模型。每次執行訓練後,系統就會發布新模型,並重設每 2 週自動重新訓練的時間表。
建立訓練資料集
如要建立訓練資料集,指定的標籤人員必須依據各個標籤選項,將訓練標籤套用到至少 100 個檔案。舉例來說,假設標籤有 3 個選項 (例如「需要瞭解」、「機密」和「公開」),則至少需要 300 個訓練檔案。不過,建議每個標籤選項都要有超過 100 個檔案,因為有些檔案可能不適用於訓練資料集。瞭解如何標記高品質訓練樣本。
注意:訓練資料集最多可包含 100 萬個檔案。
建立模型後,系統會在約 24 小時內,自動檢查已加上標籤的訓練檔案數量。之後則會全天持續檢查。
如何查看已加上標籤的檔案數量:
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在模型「動作」下方,選取「查看詳細資料」。
- 在頁面頂端的面板中,查看「現有模型的訓練檔案數」下方加上標籤的檔案數量。
如果模型有足夠的檔案可用於訓練,即可準備開始訓練。
開始執行訓練
訓練通常需要 4 到 6 小時,但如果資料集較大,可能就需要更久。模型可能需多次訓練,才能學會如何準確標記檔案。
在訓練期間,模型會為檔案選取分類,並與套用至檔案的訓練標籤相比較,進而產生分數。詳情請參閱「分數如何計算」。
訓練執行後,您可以檢查模型的準確度。
如何開始訓練:
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在「模型詳細資料」頁面的模型「動作」下方,選取「查看詳細資料」。
- 在頁面頂端的訓練面板中,按一下「開始執行訓練」。
注意:只有在標籤人員標記的訓練檔案數量達到下限時,這個按鈕才會顯示。
訓練後:查看模型分數
訓練完畢後,模型就會發布,並以百分比顯示各標籤選項的分數。每個分數 (稱為召回分數) 都代表模型在自行測試後,正確分類的訓練樣本占比:
- 低於 50%:準確度低。表示模型尚未就緒,需要更詳盡的資料。
- 50% 至 80%:準確度中等。代表模型可能只在特定情況下準備就緒。
- 超過 80%:準確度高。表示模型已準備就緒,可為貴機構分類檔案了。
如要在訓練執行後檢查模型準確度,請按照下列步驟操作:
在「模型詳細資料」頁面中,您可以在以下位置查看模型分數:
- 在頁面頂端的訓練結果面板中,「目前使用的檔案和分數」的下方
- 在「目前使用的訓練資料集」面板中
開啟 AI 分類功能
將 AI 模型訓練達到最低準確度 (至少 50%) 後,即可選擇標籤選項並啟用自動檔案標籤功能,(或稱自動套用)。不過,為獲得最佳結果,建議等到所有標籤選項的模型分數都達到至少 80% 再啟用。
如何啟用自動套用功能
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在「模型詳細資料」頁面的模型「動作」下方,選取「查看詳細資料」。
- 在訓練面板中,按一下「設定自動套用」。
注意:只有在至少 1 個標籤選項的準確度達到 50% 時,這個按鈕才會顯示。
或者,如果您先前已設定自動套用功能,請在「由 AI 加上標籤的檔案」下方,按一下「編輯自動套用選項」。
- 找出要允許 AI 模型自動套用的標籤選項,然後勾選旁邊的方塊。
- 按一下「儲存並繼續」,選取模型應自動為哪些組織單位或群組的檔案套用標籤。預設設定為頂層組織。
或者按一下「儲存」,稍後再選取使用者。
- 如果您選擇選取使用者,請在側邊選取「組織單位」或「配置群組」。
群組設定會覆寫機構單位。瞭解詳情
- 點選「開啟 - 透過下列任一選項自動套用標籤」。
- 按一下 [儲存]。
在「模型詳細資料」頁面上,規則「目前的自動套用狀態」會顯示「開啟」。
注意:您可以透過雲端硬碟事件記錄監控 AI 分類功能。詳情請參閱本頁下方的「監控 AI 分類標籤事件」。
AI 分類功能何時會掃描檔案
為使用者擁有的檔案和共用雲端硬碟啟用自動套用功能後,AI 分類功能在 1 到 2 週內,至少會掃描這些檔案 (靜態檔案) 一次。AI 分類功能也會在檔案上傳或修改時執行掃描,並在檔案內容變更時變更套用的標籤。
自動套用功能發生衝突時的處理方式
資料保護規則
如果是資料保護規則設定的標籤值,優先順序會高於 AI 分類,但這兩者的優先順序都高於預設分類。
多項規則
當 2 個以上相同規則嘗試為同一個檔案套用不同的標籤選項時,系統會套用標籤選項清單中優先順序較高的選項。舉例來說,有一個標籤,其欄位在標籤管理工具中列出 3 個選項:
- 機密
- 內部
- 公開
如果規則 1 嘗試將標籤設為「機密」,規則 2 嘗試將同一檔案的標籤設為「公開」,則系統會套用「機密」。因此設定規則前,請確認標籤欄位選項會按照您希望的優先順序列出。
使用者套用的標籤
如果是使用者套用至檔案的標籤,優先順序會高於 AI 套用的標籤,也就是說,AI 分類功能不會修改使用者先前設定的標籤。
監控模型
您可在雲端硬碟事件記錄中,詳細瞭解 AI 分類功能如何為檔案加上標籤。記錄會依據各個標籤選項,顯示有多少檔案是以自動套用功能分類,以及有多少使用者接受或修改自動套用的標籤。使用者必須具備權限,才能對自動套用的標籤執行操作。
使用者調整自動套用標籤所需的權限
使用者必須具備檔案和標籤權限,才能調整自動套用的標籤。您可以在標籤管理工具中設定分類標籤的權限。詳情請參閱「為貴機構建立分類標籤」。
- 如要查看自動套用的標籤,使用者必須具備分類標籤的「可查看這個標籤」權限。
- 如要接受及修改自動套用的標籤,使用者必須具備分類標籤的「可套用標籤及設定標籤值」權限,且是檔案的編輯者或擁有者。
在雲端硬碟事件記錄中查看 AI 分類事件
管理模型
停用分類標籤的自動套用功能
如何停用所有或特定標籤選項的自動套用功能:
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在「模型詳細資料」頁面的模型「動作」下方,選取「查看詳細資料」。
- 在「由 AI 加上標籤的檔案」下方,按一下「編輯自動套用選項」。
- 找到要停用自動套用功能的標籤選項,取消勾選相應的方塊。
或者,如要完全暫停自動套用,請取消勾選所有選項。
如何為特定機構單位或群組全面停用自動套用功能:
您可以對特定機構單位/群組內使用者擁有的內容,徹底停用自動套用功能。
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在「模型詳細資料」頁面的模型「動作」下方,選取「查看詳細資料」。
- 在頁面頂端的「更多動作」選單中,依序點選「管理自動套用功能」
「更新已啟用的組織單位/群組」。
- 按一下左側的組織單位或群組即可選取。
- 選取「關閉 - 不自動套用標籤」。
- 按一下 [儲存]。
刪除模型
有時候,您可能需要刪除模型,例如模型準確度未提升時。刪除模型後,所有 AI 分類設定都會永久移除。注意:
- 僅用於這個模型的標籤會從分類設定中移除,所有模型版本也會刪除。
- 訓練標籤仍會保留在檔案中。您可以在刪除模型後,選擇設定新模型,使用相同 (或不同) 的訓練標籤。
- 此模型若曾啟用自動套用標籤功能,該設定將立即停用,但先前自動套用的標籤仍會保留在檔案中。
- 如果使用現有的訓練標籤和檔案重新訓練模型,結果會很類似。
- 如果您為新模型重新建立相同的分類標籤,AI 分類功能會忽略並覆寫先前模型的分類結果。這樣一來,您就可以「重新處理」貴機構的雲端硬碟檔案。如果您在初次部署後曾大幅提升模型品質,這個方法就很有用。
如要刪除模型:
-
在 Google 管理控制台中,依序點選「選單」圖示
「安全性」
「存取權與資料控管」
「資料分類」。
必須具備「管理分類標籤」管理員權限。
- 在「AI 分類」部分,按一下「查看 nn 個模型」。
- 在「模型詳細資料」頁面的模型「動作」下方,選取「查看詳細資料」。
- 在「模型詳細資料」頁面的「動作」部分,按一下右側的「刪除模型」。
「刪除模型」對話方塊會列出刪除模型後的影響。
- 如要繼續,請按一下「刪除模型」。
常見問題
訓練和分類標籤
訓練標籤和分類標籤需要符合哪些規定?
分類標籤和訓練標籤都必須符合下列條件:
- 最少須有 2 個選項,最多 7 個。
- 選項順序必須相同。
舉例來說,如果分類標籤的選項順序如下:
- 選項 1
- Option 2
- 選項 3
訓練標籤選項的順序就不能像下面這樣:
- 選項 2
- 選項 1
- 選項 3
- 必須完成發布。
- 為標籤設定不同的存取權。訓練標籤應僅供可訓練模型的指定標籤人員使用。分類標籤的存取權設定則可較廣。
如何手動建立訓練標籤?
- 確認標籤符合必要的標籤條件。
- 將訓練標籤標上「訓練」字樣,方便指定的標籤人員在建立訓練資料集時,辨識並套用標籤。
- 新增訓練標籤的說明欄位,進一步協助指定的標籤人員瞭解用途。
- 請務必使用您為標籤人員建立的配置群組,僅將標籤權限授予指定的標籤人員,他們會負責找出要用來訓練模型的檔案。標籤人員需要「可套用標籤及設定標籤值」權限。詳情請參閱「為貴機構建立分類標籤」。
我可以將分類標籤當做訓練標籤使用嗎?
訓練資料集
哪些檔案適合用於訓練模型?
為確保訓練模型時能獲得最佳結果,請指示指定的標籤人員遵守下列規範:
- 確認每個檔案至少有 500 個半形字元。
- 所選檔案需反映使用者在貴機構中建立、共用和使用的內容。
- 每個標籤選項標記的檔案數量需大致相同,且各選項至少要有 100 個檔案。這有利於模型全面解讀資料,進而提高分數。
- 每種選項類型都要納入具代表性的檔案。舉例來說,如果合約在貴機構也是常見的「最高機密」檔案類型,「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。
- 訓練標籤只能套用至貴機構擁有的檔案,包括使用者直接擁有的檔案,以及儲存在共用雲端硬碟中的檔案。AI 分類功能不會處理外部使用者擁有的檔案,或位於外部共用雲端硬碟中的檔案。
模型是否能使用先前加上標籤的檔案進行訓練?
模型可以使用多種語言訓練嗎?
訓練期間的分數如何計算?
訓練模型後,我是否可以「凍結」模型,停止自動重新訓練?
使用者可否變更或修正標籤和欄位值?
自動套用
AI 分類功能可以評估圖片、影片和音訊檔案嗎?
AI 分類功能是否只能用於為機密內容加上標籤?
開啟用戶端加密 (CSE) 時,AI 分類功能是否會運作?
AI 分類功能修改自動套用標籤的方式及時機為何?
啟用自動套用功能後,AI 分類功能會掃描並分類所有可擷取足夠文字的靜態檔案。系統會至少掃描這些檔案一次。
如果內容經過修改,AI 分類功能會定期重新處理檔案。內容變更可能會導致檔案出現不同的預測結果。如果 AI 分類功能針對某個檔案具備現有選項和新預測選項,系統會優先採用選項清單中優先順序較高的選項。舉例來說,假設某個欄位在標籤管理工具中列有三個選項:
- 機密
- 內部
- 公開
假設 AI 分類功能將檔案歸類為「內部」,而在內容變更後,AI 分類模型預測為「機密」。這時檔案的分類就會變更為「機密」。不過,如果 AI 分類模型預測為「公開」,檔案的分類仍會保持為「內部」。
AI 分類不會修改使用者已審查或修改過的自動套用標籤和欄位值。
如果模型有所變更,模型會自動重新評估現有檔案嗎?
系統會在建立或修改檔案時,使用最新模型處理檔案。新模型版本發布時,現有檔案不會自動重新處理。不過,模型可能會定期使用最新版本重新處理所有檔案,與特定模型更新或重新訓練無關。
如果採用多種分類方法,AI 分類是否會優先於其他方法?
- 沒有使用者覆寫的資料遺失防護規則
- 手動分類
- 有使用者覆寫的資料遺失防護規則
- AI 分類
- 預設分類
AI 分類功能可為哪些類型的檔案套用標籤?
- AI 分類功能與雲端硬碟資料遺失防護功能相同,採用可建立索引的文字處理技術。詳情請參閱資料遺失防護功能掃描的檔案類型清單。系統不支援音訊和影片檔案。
- 檔案必須包含一定數量的文字,AI 分類功能才能套用標籤。因此,系統可能不會分類某些檔案 (例如:非常短的文件和文字很少的圖片)。
停用自動套用選項會有甚麼影響?
先前加上 AI 分類標籤的檔案,即使這個選項已停用,仍會保留已套用的標籤和選項值。
我可以復原自動套用的標籤嗎?
授權
對於沒有合格授權的使用者,這項功能會如何運作?
只要使用者具備支援雲端硬碟分類標籤的授權,就能擁有標有訓練標籤的檔案。不過,AI 分類功能只會標記共用雲端硬碟中的檔案,或是擁有者具備支援授權的檔案。如果檔案擁有者沒有支援 AI 分類功能的授權,該功能就不會處理這類檔案。
當沒有任何使用者具備支援 AI 分類的授權時,系統會停用自動套用功能並刪除分類模型。不過,訓練標籤和 AI 分類套用的標籤仍會保留在檔案中。