悪意のあるコンテンツやプロンプトインジェクションから Gemini ユーザーを保護するための Google の取り組み

この記事は Google Workspace 管理者を対象としています。ここでは、Gemini アプリ、または Gemini in Workspace アプリ（Gmail、ドキュメントエディタ、ドライブ、Chat）における Gemini 機能に対する Google の保護策について説明します。

Gemini は、いまや Google Workspace ビジネスユーザーの強力なコラボレーションパートナーとなりました。数多くの組織が Gemini を活用してコンテンツの作成やデータの要約、ブレインストーミングを行い、生産性を高めています。しかし一方で、生成 AI プラットフォームを標的とする新しい脅威も次々に登場しています。

Google は、こうした脅威からユーザーを保護するために、堅牢なセキュリティ対策のフレームワークを採用しています。この記事では、これらのセキュリティ対策が適用された際のシステムの挙動や、Google Workspace with Gemini および Gemini アプリのユーザーエクスペリエンスにどのような影響が及ぶのかについて説明します。

生成 AI を取り巻く新たな脅威

生成 AI に対する脅威は、疑わしい URL や悪意のあるプロンプトなど、さまざまです。これらはマルウェアやフィッシング詐欺と同様、ユーザーが気づきにくい種類の脅威で、攻撃者は、一見何の変哲もないメールメッセージやドキュメントに悪意のあるプロンプトを仕込み、生成 AI にユーザーの意図に反した有害な動作をさせようとします。

悪意のあるプロンプトが生成 AI に個人情報の共有や不正なタスクの実行を求めるといったことも、その一例です。

Gemini がユーザーを保護する仕組み

ユーザーが Gemini にメールメッセージやドキュメントなどのコンテンツの要約をリクエストすると、Gemini はアクションを実行する前にコンテンツを分析して脅威を探します。Gemini が脅威を特定すると、その脅威を含むコンテンツは回答の生成に使用されなくなります。

例:

メールメッセージの要約を Gemini にリクエストしたとき、メッセージの一部に悪意のあるプロンプトが含まれている場合、Gemini はそのメッセージを要約の対象から除外します。
ドキュメントなどのファイル内のコンテンツを使用するよう Gemini にリクエストすると、Gemini はリクエストを処理する前に、対象のファイルに不審なリンクやプロンプトがないかどうかを確認します。

ユーザーへの影響

脅威を検出すると、Gemini はユーザーに以下の通知を表示します。

脅威	ユーザーへの通知
プロンプト内で参照されているメールメッセージやドキュメントすべてに不審な点がある、または会話にプロンプトインジェクション攻撃を試みる悪意のある指示が含まれている	セキュリティリスクを検出し、ブロックしました
メッセージやドキュメントに不審なものがある	セキュリティ上の理由により一部のコンテンツを除外しました

ユーザーが行うべき対応

生成 AI のセキュリティリスクに懸念がある場合や、Gemini に誤りがあると思われる場合は、Google にフィードバックをお送りください。

詳しい手順については、以下をご覧ください。

悪意のあるコンテンツやプロンプト インジェクションから Gemini ユーザーを保護するための Google の取り組み コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。