C#使用PDFBox类库操作PDF格式文件

.Net
引用动态链接库
解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
IKVM.GNU.Classpath.dll
PDFBox-0.7.3.dll
FontBox-0.1.0-dev.dll
IKVM.Runtime.dll

将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
using org.pdfbox.pdmodel;
using org.pdfbox.util;

public static void pdf2txt(FileInfo pdffile, FileInfo txtfile)
{
    PDDocument doc = PDDocument.load(pdffile.FullName);
    PDFTextStripper pdfStripper = new PDFTextStripper();
    string text = pdfStripper.getText(doc);
    StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));
    swPdfChange.Write(text);
    swPdfChange.Close();
}

我的博客,记录,笔记