Как извлечь вложение из тела письма (закодировано как base64)
Как я могу извлечь вложения из электронного письма, когда они приходят, закодированные в теле письма, например:
------ =_NEXTPART_FORMSCAPE_MAIL_message101122101615
Content-Type: application/octet-stream; name="MyFile_hasalongish
filename_22-NOV-2010.pdf"
Content-Transfer-Encoding: base64
Content-Disposition: attachment; filename="MyFile_hasalongishfilename_22-NOV-2010.pdf"
Content-Description: MyFile_hasalongishfilename_22-NOV-2010.pdf
JVBEDi0xLjMKJcfsj6IKNSAwIG9iago8PC9MZW5ndGggNiAwIFIvRmlsdGVyIC9GbGF0
ZFRGVSdsfSDF43N0cmVhbQp4nJ0b23IVN/LdXzG1D7vnbOUMo9tISiWpBduAN2CMbZJN
[...]
OUIwOEYxRDcyRjkwRDAxRUU1QzBDMjhEM0Y+XQo+PgpzdGFydHhyZWYKMTMwNDQKJSVF
T0YK
------ =_NEXTPART_FORMSCAPE_MAIL_message101122101615--
3 ответа
Сохранить письмо в текстовый файл с расширением .uue
и извлеките приложение с помощью де-архиватора.
Скопируйте только закодированный в base64 текст в новый текстовый файл foo.txt
,
base64 --decode foo.txt > bar.pdf
Я только что декодировал поток base64, у которого был дополнительный бит на конце, который мне пришлось удалить. Это выглядело так: --=_59494bda030d4629113a60ff13935d81--
, Прежде чем я удалил его, я получил ошибку: Invalid character in input stream.
После того, как я удалил его, никаких ошибок декодирования, и он открылся просто отлично.
Я смог восстановить файл, используя декодер base64 и скопировав только фактический текст, который был закодированным вложением, а не какие-либо окружающие элементы верхнего / нижнего колонтитула.