Соответствие только числам, которые идут в числовом порядке
У меня есть цифры в [.], Обозначающие номер страницы оригинального печатного документа, который я переписываю. Однако документ также содержит другие цифры в [.], Которые не соответствуют номерам страниц.
Например:
Lorem Ipsum Dolor Sit Amet, Concetetur Adipiscing Elit. Donec a diam lectus. Sed sit amet ipsum mauris. Maecenas congue ligula ac quam viverra nec consectetur ante hendrerit. Donec et mollis dolor. Praesent et diam eget libero egestas mattis sit amet vitae augue. Nam tincidunt congue enim, ut porta lorem lacinia consectetur. Donec ut libero sed arcu vehicleula обвиняет не мучителей. Lorem Ipsum Dolor Sit Amet, Concetetur Adipiscing [267] Элит. Aenean Ut Gravida Lorem. Ut turpis felis, pulvinar semper sed, adipiscing id dolor. Pellentesque auctor Nisi ID Magna Conquat Сагиттис. Curabitur dapibus enim sit amet elit pharetra tincidunt feugiat nisl imperdiet. Ut convallis libero в урне ultrices accumsan. Donec sed odio eros. Donec viverra mi quis quam pulvinar at malesuada arcu rhoncus. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. В рутрум аккумсан язвах. Mauris vitae nisi at sem facilisis semper ac in est.
Vivamus Fermentum Semper Porta. Nunc Diam Velit, Adipiscing U Tristique Vitae, Сагиттис Вел Одио. Maecenas convallis ullamcorper ultricies. Curabitur ornare, Ligula Semper Concectetur Sagittis, Nisi Diam Iaculis Velit, ID [1] Fringilla Sem Nunc Vel Mi. Nam dictum, odio nec pretium volutpat, arcu ante placerat erat, non-tristique elit urna et turpis. Quisque mi metus, ornare sit amet fermentum et al., Tincidunt et orci. Fusce eget orci a orci congue vestibulum. Ut dolor diam, elementum et vestibulum eu, porttitor vel elit. Curabitur venenatis pulvinar tellus gravida ornare. Sed et erat faucibus nunc euismod ultricies ut id justo. Nullam cursus suscipit nisi, et ultrices justo sodales nec. Fusce venenatis facilisis lectus ac semper. Аликвам в Масса Ipsum. Quisque bibendum purus [2] ultrics ultrix convallis nulla. Nullam aliquam, mi eu aliquam tincidunt, purus Velit Laoreet Cortor, Viverra Pretium Nisi Quam Vitae MI. Fusce vel volutpat elit. Нам сагиттис ниси дуй.
Suspendisse lectus leo, consctetur in tempor sit amet, placerat quis neque. Etiam luctus porttitor [1] lorem, sed suscipit est rutrum non. Curabitur lobortis nisl aim congue semper. Энеевский коммодот ультрикс. [3] Vestibulum ut justo vel sapien venenatis tincidunt. Phasellus eget dolor sit amet ipsum dapibus condimentum vitae quis lectus. Аликвам ут масса в Turpis Dapibus Convallis. Praesent elit lacus, вестибюль у malesuada и др., Ornare и др. Ut augue nunc, sodales ut euismod non, adipiscing vitae orci. Mauris ut placerat justo. Морис в ультирецах еним. Quisque nec est eleifend nulla ultrices egestas quis ut quam. Donec sollicitudin lectus a mauris pulvinar id aliquam urna cursus. Cras quis ligula sem, vel elementum mi. Фазелла не ullamcorper урна. [24]
Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. При язвенной болезни. Vestibulum porta sapien adipiscing augue congue id pretium lectus molestie. Proin quis dictum nisl. Morbi id quam sapien, sed vestibulum sem. Duis elementum rutrum mauris sed convallis. Proin vestibulum magna mi. Aenean tristique hendrerit magna, [5] ac facilisis nulla hendrerit ut. Sed non tortor sodales quam auctor elementum. Donec hendrerit nunc eget elit pharetra pulvinar. Suspendisse ID Tempus Мистер. Aenean luctus, elit Goodso Laoreet Commodo, Justo Nisi Conquat Massa, Sed Vulputate Quam Urna Quis Eros. Донецк вел.
Я хотел бы последовательно заменить все [.], Которые являются номерами страниц, в TeX, \marginpar{[.]}
, но игнорируйте любые числа, которые не в последовательности.
Итак, я хотел бы sed
или же emacs
или другую подобную утилиту, чтобы соответствовать, например, тому, что я выделил здесь жирным шрифтом:
[267] [1] [2] [1] [3] [24] [5] …
Таким образом, я хотел бы сопоставить только то, что находится в числовом порядке.
Как я мог это сделать?
1 ответ
awk
конечно может сделать это. Например, скрипт subpar.awk
:
BEGIN {
maxgap = ARGV[1]
ARGV[1] = "-"
count = 0
}
{ i = count + 1
while (i <= count+maxgap) {
n = sub("\\[" i "\\]","\\marginpar{[" i++ "]}")
count += n
}
print
}
... может обработать текст примера как awk -f subpar.awk 2 <lorem.txt
где параметр 2
максимально допустимая разница в последовательности. sub()
возвращает количество выполненных замен (0 или 1), так count
увеличивается только тогда, когда в строке была сделана замена. Этот код имеет дело со случаем, когда в строке должно быть выполнено несколько замен.