专业网站建设品牌,十四年专业建站经验,服务6000+客户--广州京杭网络
免费热线:400-683-0016      微信咨询  |  联系我们

C#读取PDF ——PDFBox使用

当前位置:网站建设 > 技术支持
资料来源:网络整理       时间:2023/2/14 0:36:17       共计:3615 浏览

一、下载PDFBox

      访问网址http://sourceforge.net/projects/pdfbox/ (这个绝对是个好网站)


二、引用动态链接库

    解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
    IKVM.GNU.Classpath.dll
    PDFBox-0.7.3.dll
    FontBox-0.1.0-dev.dll
    IKVM.Runtime.dll

将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
    using org.pdfbox.pdmodel;
    using org.pdfbox.util;

三、API的使用方法

using System.IO;

using System.Text;

using org.pdfbox.pdmodel;

using org.pdfbox.util;

 

namespace PDFReader

{

    class Program

    {

 

        public static void pdf2txt(FileInfo pdffile, FileInfo txtfile)

        {

 

            PDDocument doc = PDDocument.load(pdffile.FullName);

 

            PDFTextStripper pdfStripper = new PDFTextStripper();

 

            string text = pdfStripper.getText(doc);

 

            StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));

 

            swPdfChange.Write(text);

 

            swPdfChange.Close();

 

        }

 

        static void Main(string[] args)

        {

            pdf2txt(new FileInfo(@"C:/Users/Susan/Desktop/完整稿__匆匆那年_九夜茴.pdf"), new FileInfo(@"C:/Users/Susan/Desktop/完整稿__匆匆那年_九夜茴.txt"));

        }

    }

}

转化中文是没有问题的,原因你应该知道。
版权说明:
本网站凡注明“广州京杭 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
欢迎扫描右侧微信二维码与我们联系。
·上一条:C# 将Word,Execl,PPT,Project, 文件转成PDF, 不依赖Office!! | ·下一条:mui下拉加载、上拉刷新(包括分页,vue.js)

Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有    粤ICP备16019765号 

广州京杭网络科技有限公司 版权所有