Мне нужно опубликовать несколько файлов PDF (PDF) в Интернете, но многие из них имеют жестко закодированный файл://ссылки и ссылки в непубличных местах. Мне нужно прочитать эти PDF файлы и обновить ссылки в соответствующих местах. Я начал писать приложение с помощью itextsharp для чтения каталогов и файлов, поиска PDF файлов и повторения каждой страницы. Что мне нужно сделать дальше - найти ссылки, а затем обновить неверные.
string path = "c:\\html";
DirectoryInfo rootFolder = new DirectoryInfo(path);
foreach (DirectoryInfo di in rootFolder.GetDirectories())
{
// get pdf
foreach (FileInfo pdf in di.GetFiles("*.pdf"))
{
string contents = string.Empty;
Document doc = new Document();
PdfReader reader = new PdfReader(pdf.FullName);
using (MemoryStream ms = new MemoryStream())
{
PdfWriter writer = PdfWriter.GetInstance(doc, ms);
doc.Open();
for (int p = 1; p <= reader.NumberOfPages; p++)
{
byte[] bt = reader.GetPageContent(p);
}
}
}
}
Совершенно откровенно, как только я получаю содержимое страницы, я скорее теряюсь на этом, когда дело доходит до iTextSharp. Я прочитал примеры itextsharp на sourceforge, но на самом деле не нашел то, что искал.
Любая помощь будет принята с благодарностью.
Спасибо.