正则表达式使用准则

您可以使用正则表达式设置内容合规性 设置。正则表达式对于 其他 Gmail 高级设置(例如 路由 设置)也很有用。

正则表达式也称为 regex,是一种将文本与 格式进行匹配的方法。例如,正则表达式可以描述电子邮件地址、网址、电话号码、员工 ID 号、社会保障号或信用卡号的格式。

在许多系统和脚本语言中,使用正则表达式是一种标准工具。正则表达式可繁可简。本文介绍了在创建内容合规性政策时如何使用正则表达式。您可以在以下网站上找到详细信息,包括教程和示例:

正则表达式的用途

您可以使用正则表达式创建内容过滤条件,以查找以下内容:

文本格式 :使用此选项扫描邮件中是否存在字母、数字或字母与数字的组合格式。例如,您可以创建与电话号码、地址、员工编号和账号匹配的正则表达式。或者,您可以创建一个正则表达式,以查找某个字词的多种不同变体,例如 football、footb@ll、fo0tb@ll 等。

完整字词 :使用此选项可创建更具体的过滤条件。例如, 您可以创建一个与字词 foot 匹配但不与 football 匹配的正则表达式。在这种情况下,正则表达式有助于减少过滤条件捕获的合法邮件数量。

包含可变字符的文本 :使用此选项扫描邮件中是否存在包含特定文本以及可变文本的格式。例如,您可以创建一个正则表达式,以匹配格式为 www.[variable].com 的网址,例如 www.abc1.com、www.abc2.com 和 www.abc3.com。

关于创建正则表达式的最佳做法

如果您创建的正则表达式效率低下,内容合规性过滤条件可能会运行缓慢。对于仅包含单个收件人的邮件,这可能会导致邮件递送速度减慢几秒钟。但是,如果邮件包含多个收件人,这种影响会放大,并可能导致邮件延迟(邮件超时且未递送给预期收件人)。

为避免创建运行缓慢的正则表达式,我们建议您执行以下操作:

  • 避免对单个字词列表使用正则表达式;而应使用 不良内容 政策。
  • 通过合并重复元素,使正则表达式尽可能简短。例如,如需根据多个短语创建过滤条件,请将以下正则表达式:

    (\W|^)phrase 1(\W|$)|(\W|^)phrase 2(\W|$)|(\W|^)phrase 3(\W|$)

    更改为:

    (\W|^)(phrase 1|phrase 2|phrase 3)(\W|$)

如需详细说明和准则,请参阅 RE2 语法正则表达式 示例。另请参阅配置 内容合规性设置