Я использую iTextSharp
для чтения содержимого документов PDF:
PdfReader reader = new PdfReader(pdfPath);
using (StringWriter output = new StringWriter())
{
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
reader.Close();
pdfText = output.ToString();
}
В 99% случаев он работает отлично. Однако есть этот файл PDF, который иногда вызывает это исключение:
Подпись заголовка PDF не найдена. StackTrace: at iTextSharp.text.pdf.PRTokeniser.CheckPdfHeader() в iTextSharp.text.pdf.PdfReader.ReadPdf() в iTextSharp.text.pdf.PdfReader..ctor(String filename, Byte [] ownerPassword) в Reader.PDF.DownloadPdf(String url) в C:\Documents\Visual Studio
Что раздражает то, что я не всегда могу воспроизвести ошибку. Иногда это работает, иногда это не так. Кто-нибудь столкнулся с этой проблемой?