Файл grep только для части строки

Question

Файл grep только для части строки

У меня есть файл RTF, на котором я использую grep, как это

 grep "Order Number" 'Extract Text Output.rtf'

в результате чего строки выглядят так

\b\fs28 \cf2 Fab Order Number : FAB00772450\

и я хочу, чтобы результат был просто FAB00772450

Я знаю, если я использую -o, он просто вернет слово "Номер заказа", но это мне не поможет

4

linux grep extract text-processors

Источник

mcgrailm 23 мар '12 в 02:28

4 ответа

Решение

Это работает для меня:

grep "Order Number" test.txt | awk {'print $7'} | tr "\\\ " " "

выход:

FAB00772450

3

Источник

user1200129 23 мар '12 в 02:44

Если этот формат всегда соблюдается, но количество токенов не всегда одинаково, вы можете передать его через что-то вроде

sed 's/.*: //' | sed 's#\##'

Это также дает "FAB00772450"

0

Источник

Scott C Wilson 24 мар '12 в 20:20

Я бы сказал, что это лучший и более чистый подход, чем любой из предыдущих ответов:

grep -oP 'Order Number :\s*\K[^\r\n]*' 'Extract Text Output.rtf'

или

grep -oP 'Order Number :\s*\K[A-Z0-9]*' 'Extract Text Output.rtf'

\Kотбрасывает все, что было сопоставлено до этого момента.

0

Источник

TheStoryCoder 27 апр '22 в 12:04

Другие вопросы по тегам linux grep extract text-processors

TWiStErRob 18 сен '12 в 13:59 2012-09-18 13:59 · Accepted Answer · 2012-09-18 13:59

cat 'Extract Text Output.rtf' | sed -n 's/Order Number : \(.*\)\\/\1/gp'

Выдает именно то, что вы хотите.

Объяснение:

sed -n подавить вывод по умолчанию sed
s/.../.../g поиск и замена, г: все / глобально
Order Number : \(.*\)\\ Ищу "Order Number : "Строка и backslash и сохранить что-либо между группой 1; (Недостатком использования sed является необходимость избежать оператора группировки regex: (...) с \(...\))
\1 использовать группу 1 в качестве замены
p замена печати, если есть совпадение

Это более гибкий и общий способ, чем использование жестко закодированных групп awk (7 долларов).

Примечание 1: использовать.*? если у вас есть строки, отформатированные так:

 \cf2 Fab Order Number : FAB00772450\ \b \cf2

Это предотвращает жадность регулярных выражений и останавливается на первом обратном слэше. Не проверено, поддерживает ли sed *? и +? операторы, но будем надеяться.

Примечание 2: Если у вас есть несколько частей, которые вы хотите извлечь из строки, используйте несколько групп, и в строке замены вы даже можете переключать их с форматированием, например .../\2 - \1/