Подтвердить что ты не робот

Как запрограммировать текстовый поиск и заменить его в файлах PDF

Как я могу программно искать и заменять некоторый текст в большом количестве PDF файлов? Я хотел бы удалить URL-адрес, который был добавлен в набор файлов. Мне удалось удалить ссылку, используя javascript под Batch Processing в Adobe Pro, но текст ссылки остается. Я видел рекомендации по использованию текстового касания, который работает вручную, но я не хочу изменять 1300 файлов вручную.

4b9b3361

Ответ 1

Поиск текста в PDF может быть изначально затруднен из-за графического характера формата документа - буквы, которые вы ищете, не могут быть смежными в файле. Тем не менее, CAM :: PDF обладает некоторыми возможностями для поиска и эвристики. Дайте changepagestring.pl попробовать и посмотреть, работает ли он на ваших PDF файлах.

Ответ 2

Я тоже стал отчаянным. После 10 установок PDF Editor, которые все стоят денег и не имеют успеха:

pdftk + editor достаточно:

Заменить текст в файлах PDF

  • Используйте pdftk для распаковки страницы PDF Потоки

    pdftk original.pdf вывод оригинал .clear.pdf uncompress

  • Замените текст (иногда это работает, иногда это не так.)

  • Восстановить измененный (и теперь сломанный) PDF

    pdftk original.clear.pdf output original.clear.fixed.pdf

(от Джоэла Дар)

Ответ 4

Не уверен, что я хочу сделать всю работу, чтобы написать код для изменения ваших 1300 файлов, когда есть программа, которая может сделать это за вас. На днях я использовал профессиональную версию Infix для пакетной модификации почти 100 файлов, используя функцию "Найти и заменить в файлах". Он отлично работает. Я оценил другие программы, надеясь найти функциональность поиска и замены, похожую на Microsoft Word. Инфикс был единственным, кого я нашел, который может это сделать. Отъезд: http://www.iceni.com/infix-pro.htm

Ответ 5

Я только что закончил тестировать инфикс для текста, который состоит из текста, нагруженного диакритикой, с надеждой на создание другого текста, в котором символы с двойными и составленными диакритиками заменяются чередующимися с одиночными диакритическими знаками. Infix - это, безусловно, хорошее решение для тех, кто не заботится о понимании работы программных решений. Все изменения запроса были выполнены. Еще нужно понять, как произвести оплату слов, которые изменяют макет текста.

Ответ 6

Это всего лишь половина решения, но я использовал Touch up в сочетании с поддержкой AppleScript для отправки нажатий клавиш для замены строки в тысячах ячеек таблицы. В зависимости от того, как ваши страницы являются макетами, это может сработать для вас. В моем случае мне пришлось вручную вставить курсор в начале каждой таблицы (десятки таблиц - вполне управляемые для ручного процесса), но после этого я автоматически заменил тысячи ячеек.

Ответ 7

Вопрос заключается в программном решении, но я по-прежнему буду использовать этот бесплатный онлайн-инструмент, который помог бы мне заменить текст в некоторых файлах PDF:

http://www.pdfdu.com/pdf-replace-text.aspx

Я не заметил никаких объявлений или других модификаций в полученных PDF файлах после замены текста.

Я не смог внести изменения локально с помощью программного обеспечения, которое я пробовал. Я думаю, что основная проблема заключалась в том, что мне не хватало шрифта, который использовался в PDF файле, и он работал неправильно, даже с Acrobat Pro. Онлайновый инструмент не жаловался и дал отличный результат.

Ответ 8

Я предлагаю вам использовать программное обеспечение VeryPDF PDF Text Replacer Command Line для пакетной замены текста на страницах PDF, вы можете запустить pdftr.exe, чтобы легко заменить текст на страницах PDF, например

pdftr.exe -contentreplace "My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -searchandoverlaytext "My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -searchandoverlaytext "My Name= > D:\temp\myname.png * 20 * 20" D:\in.pdf D:\out.pdf

pdftr.exe -pagerange 1-3 -contentreplace "Старый текст = > Новый текст | VeryPDF = > VeryDOC || My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -searchtext "string" C:\in.pdf

pdftr.exe -pagerange 1 -searchtext "string" C:\in.pdf

pdftr.exe -pagerange 1 -searchandoverlaytext "Старый текст = > Новый текст VeryPDF = > VeryDOC || My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -overlaytextfontname "Arial" -overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext "Старый текст = > Новый текст VeryPDF = > VeryDOC || My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -opw 123 -upw 456 -contentreplace "Старый текст = > Новый текст \VeryPDF = > VeryDOC || My Name= > Ваше имя" D:\in.pdf D:\out.pdf

pdftr.exe -searchandoverlaytext "PDFcamp Printer = > VeryPDF Printer" -overlaytextfontsize 8 D:\in.pdf D:\out.pdf

pdftr.exe -searchandoverlaytext "PDFcamp Printer = > VeryPDF Printer" -overlaytextfontsize 80% D:\in.pdf D:\out.pdf