Примеры регулярных выражений

Приведенные ниже примеры иллюстрируют использование и построение простых регулярных выражений. Каждый пример включает тип текста для сопоставления, одно или несколько регулярных выражений, соответствующих этому тексту, а также примечания, поясняющие использование специальных символов и форматирования.

Дополнительные инструкции и рекомендации см. также в разделе «Рекомендации по использованию регулярных выражений и синтаксиса RE2» . См. также раздел «Настройка правил соответствия содержимого» .

Важно: Мы поддерживаем только синтаксис RE2 , который немного отличается от PCRE. Регулярные выражения по умолчанию чувствительны к регистру.

Сопоставление только точной фразы

Сопоставление только точной фразы
Пример использования Сопоставьте фразу с советами по акциям .
Примеры регулярных выражений Пример 1: (\W|^)stock\stips(\W|$)

Пример 2: (\W|^)stock\s{0,3}tips(\W|$)

Пример 3: (\W|^)stock\s{0,3}tip(s){0,1}(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры или подчеркивания. Он предотвращает совпадение символов до или после фразы в регулярном выражении.
  • В примере 2 символ \s соответствует пробелу, а {0,3} указывает, что между словами stock и tip может быть от 0 до 3 пробелов.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти фразу, если она находится в начале строки и перед ней нет других символов.
  • Символ $ обозначает конец строки. Позволяет регулярному выражению найти фразу, если она находится в конце строки и после неё нет других символов.
  • В примере 3 (s) соответствует букве s , а {0,1} указывает, что эта буква может встречаться 0 или 1 раз после слова tip. Таким образом, регулярное выражение соответствует stock tip и stock tips . В качестве альтернативы можно использовать символ ? вместо {0,1}.

Сопоставьте слово или фразу в списке.

Сопоставьте слово или фразу в списке.
Пример использования Сопоставьте любое слово или фразу из следующего списка:
  • чушь
  • черт
  • драт
  • фуи
  • Чёрт возьми!
  • черт
Пример регулярного выражения (?i)(\W|^)(ерунда|черт|черт|фуи|боже мой|черт)(\W|$)
Примечания
  • (...) группирует все слова таким образом, что класс символов \W применяется ко всем словам внутри скобок.

  • (?i) делает сопоставление содержимого нечувствительным к регистру.

  • Символ \W соответствует любому символу, кроме буквы, цифры или подчеркивания. Он предотвращает совпадение символов до или после слов или фраз в списке.

  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти слово, если оно находится в начале строки и перед ним нет других символов.

  • Символ $ обозначает конец строки. Позволяет регулярному выражению найти слово, если оно находится в конце строки и после него нет других символов.

  • Символ "|" обозначает "или", поэтому регулярное выражение соответствует любому из слов в списке.

  • Символ \s соответствует пробелу. Используйте этот символ для разделения слов во фразе.

Сопоставьте слово с разными вариантами написания или специальными символами.

Сопоставьте слово с разными вариантами написания или специальными символами.

Пример использования

Сопоставьте слова «быстрые деньги» и некоторые приемы, используемые спамерами для запутывания информации, например:
  • быстрые деньги
  • f@$tc@$h
  • толстые деньги
Пример регулярного выражения

f[a4@][s5\$][t7] +c[a4@][s5\$]h

Примечания
  • Символ \W не включен, поэтому другие символы могут появляться до или после любого из вариантов слова «fast cash» . Например, регулярное выражение по-прежнему соответствует слову «fast cash» в следующем тексте:

Быстрые деньги!! или ***быстрые деньги***

  • [a4@] соответствует символам a, 4 или @ на второй позиции в слове, отражая распространенные замены букв, которые спамеры используют для обхода простых текстовых совпадений.

Найти любой адрес электронной почты из определенного домена

Найти любой адрес электронной почты из определенного домена
Пример использования Найдите любой адрес электронной почты из доменов yahoo.com , hotmail.com и gmail.com .
Пример регулярного выражения (\W|^)[\w.\-]{0,25}@(yahoo|hotmail|gmail)\.com(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры или подчеркивания. Он предотвращает совпадение символов до или после адреса электронной почты в регулярном выражении.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти адрес, если он находится в начале строки и перед ним нет других символов.
  • Символ $ обозначает конец строки. Это позволяет регулярному выражению найти адрес, если он находится в конце строки и после него нет других символов.
  • [\w.\-] соответствует любому символу слова (az, AZ, 0-9 или подчеркивание), точке или дефису. Это наиболее часто используемые допустимые символы в первой части адреса электронной почты. Символ \- (обозначающий дефис) должен стоять последним в списке символов внутри квадратных скобок.
  • Символ \ перед тире и точкой «экранирует» эти символы — то есть указывает на то, что тире и точка сами по себе не являются специальными символами регулярных выражений. Нет необходимости экранировать точку внутри квадратных скобок.
  • Форматирование (...) группирует домены, а символ |, разделяющий их, обозначает «или».

Сопоставьте любой IP-адрес в заданном диапазоне.

Сопоставьте любой IP-адрес в заданном диапазоне.
Пример использования Сопоставьте любой IP-адрес в диапазоне от 192.168.1.0 до 192.168.1.255 .
Примеры регулярных выражений Пример 1: 192\.168\.1\.
Пример 2: 192\.168\.1\.\d{1,3}
Примечания
  • Символ \ перед каждой точкой «экранирует» точку, то есть указывает на то, что точка сама по себе не является специальным символом регулярного выражения.
  • В примере 1 после последней точки не следуют никакие символы, поэтому регулярное выражение соответствует любому IP-адресу, начинающемуся с 192.168.1 , независимо от следующей за ним цифры.
  • В примере 2 символ \d соответствует любой цифре от 0 до 9 после последней точки, а {1,3} указывает, что цифры от 1 до 3 могут появляться после этой последней точки. В этом случае регулярное выражение соответствует любому полному IP-адресу, начинающемуся с 192.168.1 . Это регулярное выражение также соответствует недействительным IP-адресам, таким как 192.168.1.999 .

Сопоставьте буквенно-цифровой формат

Сопоставьте буквенно-цифровой формат
Пример использования Сопоставьте номера заказов на покупку для вашей компании. Этот номер может иметь различные форматы, например:
  • PO nn-nnnnn
  • ПО-нн-нннн
  • PO# nn nnnn
  • PO#nn-nnnn
  • ПО ннннн
Пример регулярного выражения (\W|^)po[#\-]{0,1}\s{0,1}\d{2}[\s-]{0,1}\d{4}(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры и подчеркивания. Он предотвращает совпадение символов до или после цифры в регулярном выражении.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти число, если оно находится в начале строки и перед ним нет других символов.
  • Символ $ обозначает конец строки. Это позволяет регулярному выражению найти число, если оно находится в конце строки и после него нет других символов.
  • [#\-] соответствует знаку решетки или дефису после букв po, а {0,1} указывает, что один из этих символов может встречаться ноль или один раз. Символ - (обозначающий дефис) должен стоять последним в списке символов внутри квадратных скобок.
  • \s обозначает пробел, а {0,1} указывает, что пробел может встречаться ноль или один раз.
  • \d соответствует любой цифре от 0 до 9, а {2} указывает, что в этой позиции числа должно быть ровно 2 цифры.