Примеры регулярных выражений

Приведенные ниже примеры иллюстрируют использование и построение простых регулярных выражений. Каждый пример включает тип текста для сопоставления, одно или несколько регулярных выражений, соответствующих этому тексту, а также примечания, поясняющие использование специальных символов и форматирования.

Дополнительные инструкции и рекомендации см. также в разделе «Рекомендации по использованию регулярных выражений и синтаксиса RE2» . См. также раздел «Настройка правил соответствия содержимого» .

Важно: Мы поддерживаем только синтаксис RE2 , который немного отличается от PCRE. Регулярные выражения по умолчанию чувствительны к регистру.

Сопоставление только точной фразы

Сопоставление только точной фразы
Пример использования Сопоставьте фразу с советами по акциям .
Примеры регулярных выражений Пример 1: (\W|^)stock\stips(\W|$)

Пример 2: (\W|^)stock\s{0,3}tips(\W|$)

Пример 3: (\W|^)stock\s{0,3}tip(s){0,1}(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры или подчеркивания. Он предотвращает совпадение символов до или после фразы в регулярном выражении.
  • В примере 2 символ \s соответствует пробелу, а {0,3} указывает, что между словами stock и tip может быть от 0 до 3 пробелов.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти фразу, если она находится в начале строки и перед ней нет других символов.
  • Символ $ обозначает конец строки. Это позволяет регулярному выражению найти фразу, если она находится в конце строки и после неё нет других символов.
  • В примере 3 (s) соответствует букве s , а {0,1} указывает, что эта буква может встречаться 0 или 1 раз после слова tip. Таким образом, регулярное выражение соответствует stock tip и stock tips . В качестве альтернативы можно использовать символ ? вместо {0,1}.

Сопоставьте слово или фразу в списке.

Сопоставьте слово или фразу в списке.
Пример использования Сопоставьте любое слово или фразу из следующего списка:
  • чушь
  • черт
  • драт
  • фуи
  • Чёрт возьми!
  • черт
Пример регулярного выражения (?i)(\W|^)(ерунда|черт|черт|фуи|боже мой|черт возьми)(\W|$)
Примечания
  • (...) группирует все слова таким образом, что класс символов \W применяется ко всем словам внутри скобок.

  • (?i) делает сопоставление содержимого нечувствительным к регистру.

  • Символ \W соответствует любому символу, кроме буквы, цифры или подчеркивания. Он предотвращает совпадение символов до или после слов или фраз в списке.

  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти слово, если оно находится в начале строки и перед ним нет других символов.

  • Символ $ обозначает конец строки. Позволяет регулярному выражению найти слово, если оно находится в конце строки и после него нет других символов.

  • Символ "|" обозначает "или", поэтому регулярное выражение соответствует любому из слов в списке.

  • Символ \s соответствует пробелу. Используйте этот символ для разделения слов во фразе.

Сопоставьте слово с разными вариантами написания или специальными символами.

Match word with different spellings or special characters

Пример использования

Сопоставьте слова «быстрые деньги» и некоторые приемы, используемые спамерами для запутывания информации, например:
  • быстрые деньги
  • f@$tc@$h
  • быстрые деньги
Пример регулярного выражения

f[a4@][s5\$][t7] +c[a4@][s5\$]h

Примечания
  • Символ \W не включен, поэтому другие символы могут появляться до или после любого из вариантов слова «fast cash» . Например, регулярное выражение по-прежнему соответствует слову «fast cash» в следующем тексте:

Быстрые деньги!! или ***быстрые деньги***

  • [a4@] соответствует символам a, 4 или @ на второй позиции в слове, отражая распространенные замены букв, которые спамеры используют для обхода простого сопоставления текста.

Сопоставление с любым адресом электронной почты из определенного домена.

Сопоставление с любым адресом электронной почты из определенного домена.
Пример использования Найдите любой адрес электронной почты из доменов yahoo.com , hotmail.com и gmail.com .
Пример регулярного выражения (\W|^)[\w.\-]{0,25}@(yahoo|hotmail|gmail)\.com(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры и подчеркивания. Он предотвращает совпадение символов до или после адреса электронной почты в регулярном выражении.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти адрес, если он находится в начале строки и перед ним нет других символов.
  • Символ $ обозначает конец строки. Это позволяет регулярному выражению найти адрес, если он находится в конце строки и после него нет других символов.
  • [\w.\-] соответствует любому символу слова (az, AZ, 0-9 или подчеркивание), точке или дефису. Это наиболее часто используемые допустимые символы в первой части адреса электронной почты. Символ \- (обозначающий дефис) должен стоять последним в списке символов внутри квадратных скобок.
  • Символ \ перед тире и точкой «экранирует» эти символы — то есть указывает на то, что тире и точка сами по себе не являются специальными символами регулярных выражений. Нет необходимости экранировать точку внутри квадратных скобок.
  • Форматирование (...) группирует домены, а символ |, разделяющий их, обозначает «или».

Сопоставьте любой IP-адрес в заданном диапазоне.

Сопоставьте любой IP-адрес в заданном диапазоне.
Пример использования Сопоставьте любой IP-адрес в диапазоне от 192.168.1.0 до 192.168.1.255 .
Примеры регулярных выражений Пример 1: 192\.168\.1\.
Пример 2: 192\.168\.1\.\d{1,3}
Примечания
  • Символ \ перед каждой точкой «экранирует» точку, то есть указывает на то, что точка сама по себе не является специальным символом регулярного выражения.
  • В примере 1 после последней точки не следуют никакие символы, поэтому регулярное выражение соответствует любому IP-адресу, начинающемуся с 192.168.1 , независимо от следующей за ним цифры.
  • В примере 2 символ \d соответствует любой цифре от 0 до 9 после последней точки, а {1,3} указывает, что цифры от 1 до 3 могут появляться после этой последней точки. В этом случае регулярное выражение соответствует любому полному IP-адресу, начинающемуся с 192.168.1 . Это регулярное выражение также соответствует недействительным IP-адресам, таким как 192.168.1.999 .

Сопоставьте буквенно-цифровой формат

Сопоставьте буквенно-цифровой формат
Пример использования Сопоставьте номера заказов на покупку для вашей компании. Этот номер может иметь различные форматы, например:
  • PO nn-nnnnn
  • ПО-нн-нннн
  • PO# nn nnnn
  • PO#nn-nnnn
  • ПО ннннн
Пример регулярного выражения (\W|^)po[#\-]{0,1}\s{0,1}\d{2}[\s-]{0,1}\d{4}(\W|$)
Примечания
  • Символ \W соответствует любому символу, кроме буквы, цифры и подчеркивания. Он предотвращает совпадение символов до или после цифры в регулярном выражении.
  • Символ ^ обозначает начало новой строки. Позволяет регулярному выражению найти число, если оно находится в начале строки и перед ним нет других символов.
  • Символ $ обозначает конец строки. Позволяет регулярному выражению найти число, если оно находится в конце строки и после него нет других символов.
  • [#\-] соответствует знаку решетки или дефису после букв po, а {0,1} указывает, что один из этих символов может встречаться ноль или один раз. Символ - (обозначающий дефис) должен стоять последним в списке символов внутри квадратных скобок.
  • \s обозначает пробел, а {0,1} указывает, что пробел может встречаться ноль или один раз.
  • \d соответствует любой цифре от 0 до 9, а {2} указывает, что в этой позиции числа должно быть ровно 2 цифры.