Какой стандарт регулярных выражений используется в grep?

Используется ли стандарт регулярных выражений в grep POSIX + ASCII или что-то еще?

1 ответ

Решение

Все зависит от того, какие флаги вы передаете grep.

Обычный grep без флага (который совпадает с передачей -G) использует "Базовые регулярные выражения":

-G, --basic-regexp
    Interpret PATTERN as a basic regular expression (BRE, see 
    below).  This is the default.

Если вы укажете -E, он использует "Расширенные" регулярные выражения:

-E, --extended-regexp
    Interpret PATTERN as an extended regular expression (ERE, 
    see below).  (-E is specified by POSIX.)

И тогда у вас есть -P для регулярных выражений Perl (PCRE):

-P, --perl-regexp
    Interpret PATTERN as a Perl regular expression.  This is highly 
    experimental and grep -P may warn  of  unimplemented features.

Основные против расширенных регулярных выражений

В основных регулярных выражениях метасимволы?, +, {, |, (И) теряют свое особое значение; вместо этого используйте версии с обратной косой чертой \?, +, {, \|, (и).

Традиционный egrep не поддерживает {метасимвол, а некоторые реализации egrep поддерживают {вместо этого, поэтому переносимые скрипты должны избегать {в шаблонах grep -E и использовать [{] для соответствия литералу {.

GNU grep -E пытается поддерживать традиционное использование, предполагая, что {не является особенным, если это будет началом неверной спецификации интервала. Например, команда grep -E '{1' ищет двухсимвольную строку {1 вместо сообщения о синтаксической ошибке в регулярном выражении. POSIX.2 допускает такое поведение как расширение, но переносимые сценарии должны избегать этого.

Поэтому, хотя grep стремится быть как можно ближе к POSIX, в нем все же есть некоторые недостатки.

Другие вопросы по тегам