Использование PowerShell для замены отдельных байтов в документе
Мы находимся в процессе преобразования справочной системы HTML в библиотеку документов SharePoint. У нас есть около 3000 отдельных HTML-документов, которые мы конвертируем в Word. Около 20% документов содержат гиперссылки на связанные документы, и все они являются относительными ссылками.
Мы пытаемся автоматизировать процесс разбора каждого документа, и в любом случае, где у нас есть гиперссылка, заменяя последние три байта строки -"htm"- на "doc".
Я видел несколько примеров PowerShell, где люди анализируют документы (обычно серверные журналы), ища определенные фрагменты информации, но не смогли найти ничего о замене определенных символов в файле перед его закрытием / сохранением.
У кого-нибудь есть советы по достижению этого с PowerShell? или идеи по поводу более подходящих инструментов?
1 ответ
Просто откройте файл, замените "htm" на "doc", затем сохраните и закройте этот файл:
Get-ChildItem -Path . -Recurse |
Where-Object {-not $_.PSIsContainer} |
Foreach-Object {
(Get-Content $_) -replace "htm", "doc" | Set-Content $_
}