Google 如何協助 Gemini 使用者防範惡意內容和提示詞注入攻擊

本文專供 Google Workspace 管理員參考。Gemini 使用者請參閱其他文章,瞭解使用 Gemini 應用程式或 Workspace 應用程式 (Gmail文件編輯器雲端硬碟Chat) 中的 Gemini 時,Google 提供哪些保護措施。

Gemini 已是 Google Workspace 企業使用者的重要協作夥伴。許多組織都會用 Gemini 製作內容、匯總資料、發想點子和提高工作效率。但與此同時,生成式 AI 平台也開始成為新興威脅的攻擊目標。

為防範這些威脅,Google 採用了強大的安全措施架構。本文將說明這些安全措施採行後的運作機制,以及 Google Workspace with Gemini 和 Gemini 系列應用程式的使用者體驗可能受到哪些影響。

本頁內容

新興生成式 AI 威脅簡介

新興生成式 AI 威脅包含可疑網址和惡意提示詞。這和惡意軟體和網路釣魚詐騙類似,使用者往往難以察覺。攻擊者會嘗試將惡意提示詞藏在正常的電子郵件訊息或文件當中,意圖讓生成式 AI 執行非預期或有害的動作。

舉例來說,惡意提示詞可能要求生成式 AI 分享個人資訊,或是執行未經授權的工作。

Gemini 如何保護使用者

當使用者要求匯總文件或電子郵件訊息等內容時,Gemini 會先分析內容是否含有威脅,再執行動作。若發現威脅,Gemini 就不會將這些內容用來生成回覆。

例如:

  • 如果您要求 Gemini 匯總電子郵件訊息,而有封郵件包含惡意提示詞,生成的摘要就會排除該封郵件。
  • 如果您要求使用文件或其他檔案的內容,Gemini 處理要求前,會先檢查檔案是否有可疑連結或提示詞。

使用者可能遇到的情況

偵測到威脅時,Gemini 會向使用者顯示以下幾類通知:

威脅 給使用者的通知
提示詞中提及的所有文件/電子郵件訊息都含有可疑內容,或對話中包含試圖發起提示詞注入式攻擊的惡意指示 偵測到安全風險,已封鎖
部分郵件/文件含有可疑內容 基於安全考量,已排除部分內容

使用者應採取的行動

如果使用者對生成式 AI 的安全風險有疑慮,或認為 Gemini 出錯,可以向 Google 傳送意見回饋。

如需操作說明,請參閱以下文章:


Google、Google Workspace 和其他相關符號及標誌均為 Google LLC 的商標。所有其他公司名稱和產品名稱則為相關公司的商標。