Рекомендации по использованию регулярных выражений

Вы можете настроить параметры соответствия контента с помощью регулярных выражений. Регулярные выражения также полезны для других расширенных настроек Gmail, таких как настройки маршрутизации .

Регулярное выражение, также называемое regex , — это метод сопоставления текста с шаблонами. Например, регулярное выражение может описывать шаблон адресов электронной почты, URL-адресов, номеров телефонов, идентификационных номеров сотрудников, номеров социального страхования или номеров кредитных карт.

Использование регулярных выражений — стандартный инструмент во многих системах и языках сценариев. Регулярные выражения могут быть простыми или очень сложными. В этой статье представлена ​​информация о том, как использовать регулярные выражения при создании политик соответствия контента. Подробную информацию, включая руководства и примеры, можно найти на следующих веб-сайтах:

Применение регулярных выражений

Используя регулярные выражения, вы можете создавать фильтры контента, которые смогут находить следующее:

Шаблоны текста. Используйте эту опцию для сканирования сообщений на наличие шаблонов из букв, цифр или их комбинации. Например, вы можете создавать регулярные выражения, которые соответствуют номерам телефонов, адресам, номерам сотрудников и номерам счетов. Или вы можете создать одно регулярное выражение, которое может найти множество различных вариантов слова, например, football, footb@ll, fo0tb@ll и так далее.

Используйте эту опцию для создания более точных фильтров. Например, вы можете создать регулярное выражение, которое соответствует слову foot (фут ), но не football (футбол) . В этом случае регулярное выражение может помочь уменьшить количество допустимых сообщений, которые фильтр отфильтрует.

Текст с изменяющимися символами. Используйте эту опцию для сканирования сообщений на наличие шаблонов, содержащих определенный текст наряду с изменяющимся текстом. Например, вы можете создать одно регулярное выражение, которое соответствует URL-адресу в шаблоне www.[variable].com, например, www.abc1.com, www.abc2.com и www.abc3.com.

Рекомендации по созданию регулярных выражений

Фильтр соответствия содержимого может работать медленно, если вы используете неэффективное регулярное выражение. Для сообщений с одним получателем это может замедлить доставку сообщения на несколько секунд. Однако, если у сообщения несколько получателей, эффект усиливается и может привести к задержкам доставки сообщения (сообщение истекает по времени и не доставляется адресатам).

Чтобы избежать создания медленно работающих регулярных выражений, мы рекомендуем следующее:

  • Избегайте использования регулярных выражений для списков отдельных слов; вместо этого используйте политику в отношении неприемлемого контента .
  • Сделайте регулярное выражение максимально коротким и простым, объединив повторяющиеся элементы. Например, чтобы создать фильтр на основе нескольких фраз, измените следующее регулярное выражение:

    (\W|^)фраза 1(\W|$)|(\W|^)фраза 2(\W|$)|(\W|^)фраза 3(\W|$)

    к этому:

    (\W|^)(фраза 1|фраза 2|фраза 3)(\W|$)

Подробные инструкции и рекомендации см. в разделах «Синтаксис RE2» и «Примеры регулярных выражений ». См. также раздел «Настройка параметров соответствия содержимого» .