正規表現を使用する際のガイドライン

正規表現を使用して、コンテンツ コンプライアンス の設定を行うことができます。正規表現は、 ルーティング 設定など、Gmail のその他の高度な設定にも役立ちます。

正規表現とは、regexとも呼ばれ、 パターンに一致するテキストを見つけるための手段です。たとえば、正規表現は、メールアドレス、URL、電話番号、従業員 ID 番号、社会保障番号、クレジット カード番号のパターンなどを表すことができます。

正規表現の使用は、多くのシステムやスクリプト言語で標準的なツールとなっています。簡単に使用することも、非常に複雑な形で使用することもできます。この記事では、コンテンツ コンプライアンス ポリシーを作成する際に正規表現を使用する方法について説明します。チュートリアルや例などの詳細については、次のウェブサイトをご覧ください。

正規表現の用途

正規表現を使用すると、次のものを検出できるコンテンツ フィルタを作成できます。

テキスト パターン : このオプションを使用すると、文字、数字、またはその両方の組み合わせのパターンについてメッセージをスキャンできます。たとえば、電話番号、住所、従業員番号、口座番号に一致する正規表現を作成できます。また、football、footb@ll、fo0tb@ll など、単語のさまざまなバリエーションを検出できる正規表現を 1 つ作成することもできます。

完全な単語 : このオプションを使用すると、より具体的なフィルタを作成できます。たとえば、 単語「foot」には一致するが 「football」には一致しない正規表現を作成できます。この場合、正規表現を使用すると、フィルタがキャプチャする正当なメッセージの数を減らすことができます。

可変文字を含むテキスト : このオプションを使用すると、特定のテキストと可変のテキストを含むパターンについてメッセージをスキャンできます。たとえば、www.[variable].com というパターン(www.abc1.com、www.abc2.com、www.abc3.com など)の URL に一致する正規表現を 1 つ作成できます。

正規表現を作成する際のベスト プラクティス

非効率的な正規表現を作成すると、コンテンツ コンプライアンス フィルタの実行速度が遅くなることがあります。受信者が 1 人だけのメッセージの場合、メッセージの配信が数秒遅れる可能性があります。ただし、メッセージに複数の受信者がいる場合は、影響が大きくなり、メッセージの遅延(メッセージがタイムアウトして、宛先の受信者に配信されない)が発生する可能性があります。

実行速度が遅い正規表現を作成しないようにするには、次のことをおすすめします。

  • 個々の単語のリストに正規表現を使用するのではなく、 不適切なコンテンツ ポリシーを使用します。
  • 繰り返される要素を統合して、正規表現をできるだけ短くシンプルにします。たとえば、複数のフレーズに基づいてフィルタを作成するには、次の正規表現を変更します。

    (\W|^)phrase 1(\W|$)|(\W|^)phrase 2(\W|$)|(\W|^)phrase 3(\W|$)

    次のようにします。

    (\W|^)(phrase 1|phrase 2|phrase 3)(\W|$)

詳細な手順とガイドラインについては、RE2 構文正規表現の 例をご覧ください。コンテンツ コンプライアンスの設定についてのページもあわせてご確認ください。