自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

利用C#將HTM轉(zhuǎn)換為PDF的幾個步驟

開發(fā) 后端
最近工作中遇到一個將HTM轉(zhuǎn)換為PDF的任務(wù),這是一個有很有用的功能塊,然而很遺憾,網(wǎng)上沒有現(xiàn)成可行(包括開源/免費、易用和可維護性的考慮)方案。既然沒有現(xiàn)成的解決方案就自己著手解決吧。

將HTM轉(zhuǎn)換為PDF大概可以分兩步實現(xiàn)

第一步,解析HTM,就是將HTM源文件中那一對文本轉(zhuǎn)換為瀏覽器最終呈現(xiàn)給我們那種圖文并茂的結(jié)果。這是一個不可完成的任務(wù),因為目前為止業(yè)界的軟件巨頭也沒有誰把HTM解析做得很好的。對比ID、Firefox等瀏覽器的顯示結(jié)果便可想而知。既然業(yè)界難題,我也就不去鉆牛角尖做技術(shù)攻關(guān)了,先跳過這步,考慮下一步的事情。

第二步,繪制PDF,這個簡單,網(wǎng)上有很多資料,有興趣的朋友可以研究PDF的文件格式,安裝二進制組裝PDF。我有興趣,然而沒有時間,我覺得軟件從業(yè)者時刻都應(yīng)該關(guān)注最有價值的事情。軟件從業(yè)者要提高效率的第一法門便是重用,網(wǎng)上有一個叫itextsharp的東西是用來繪制PDF的,可以免費使用而且開源。

下載itextsharp,試著用itextsharp繪制HTM看看效果,如您所料,繪制出的是HTM的源代碼。因為第一步的事情我們還沒有解決,下面來解決第一步的事情。

記得很久以前見過一個.NET寫的網(wǎng)頁snap工具,大概思路是利用webbrowser的DrawToBitmap方法將ie的顯示結(jié)果輸出到Sytem.Drawing.Bitmap對象。大概代碼如下:

  1. //WebBrowser wb=null;  
  2.  System.Drawing.Bitmap bmp = new System.Drawing.Bitmap(w, h);  
  3.  wb.DrawToBitmap(bmp, new System.Drawing.Rectangle(0,0, w, h)); 

ok,HTM可以解析了,現(xiàn)在重組剛才的代碼,HTM轉(zhuǎn)換為PDF思路如下:

使用webbrowser將HTM解析并轉(zhuǎn)換為圖片,使用itextsharp將剛才的圖片繪制成PDF。

有用是給公司開發(fā)的功能,暫時不便公開源碼,提供我編譯后的工具供下載使用,您也可以根據(jù)上面的思路定制:

使用方法,

1.將單個url轉(zhuǎn)換為PDF:PageToPDF.exe "http://www.g.cn/" "google.jpg"

2.將多個url轉(zhuǎn)換為PDF:pagetoPDF.exe task.txt "C:\PDFdir\"

 task.txt是任務(wù)里表,里面提供多行url,每個url以#文件名為后綴,如:http://www.baidu.com/#b表示將http://www.baidu.com/轉(zhuǎn)換為PDF文件名為b(擴展名系統(tǒng)自己會追加)

在ASP.NET環(huán)境下使用

將pagetoPDF上傳至網(wǎng)站中,設(shè)定好目錄權(quán)限,示例代碼:    

  1. public static bool CreatePPDF(string url,string path)  
  2.        {  
  3.            try  
  4.            {  
  5.                if (string.IsNullOrEmpty(url) || string.IsNullOrEmpty(path))  
  6.                    return false;  
  7.                Process p = new Process();  
  8.                string str = System.Web.HttpContext.Current.Server.MapPath("~/afafafasf/PageToPDF.exe ");  
  9.                if (!System.IO.File.Exists(str))  
  10.                    return false;  
  11.                p.StartInfo.FileName = str;  
  12.                p.StartInfo.Arguments = " \"" + url + "\" " + path;  
  13.                p.StartInfo.UseShellExecute = false;  
  14.                p.StartInfo.RedirectStandardInput = true;  
  15.                p.StartInfo.RedirectStandardOutput = true;  
  16.                p.StartInfo.RedirectStandardError = true;  
  17.                p.StartInfo.CreateNoWindow = true;  
  18.                p.Start();  
  19.                System.Threading.Thread.Sleep(500);  
  20.                return true;  
  21.            }  
  22.            catch(Exception ex)  
  23.            {  
  24.                Sys.Log.error("PDF create err.",ex);  
  25.            }  
  26.            return false;  
  27.        } 

HTM轉(zhuǎn)換為PDF特性

在使用任務(wù)形式工作時,系統(tǒng)會啟動多個進程,即任務(wù)管理器中會有多個pagetoPDF.exe的進程,這是系統(tǒng)調(diào)度程序自己啟動的,為了加個任務(wù)處理速度。進程數(shù)由調(diào)度程序自己控制,最多不會超過十個。

【編輯推薦】

  1. 在Visual Studio 2010中使用C# 4.0的動態(tài)類型
  2. C#3.0中Lambda表達式詳解
  3. 淺談C#泛型的用處
  4. 淺談C#如何實現(xiàn)多繼承
  5. C#實用基礎(chǔ)教程
責(zé)任編輯:彭凡 來源: cnblogs
相關(guān)推薦

2009-07-31 14:09:41

c#時間格式轉(zhuǎn)換

2009-09-24 15:10:54

C#調(diào)用COM組件

2023-08-26 16:06:10

COBOLJava數(shù)據(jù)

2024-09-18 08:00:05

C#編程

2021-10-29 15:13:21

LinuxPDF文件

2022-10-12 08:00:00

語音識別Node.js音頻質(zhì)量

2009-11-02 17:15:42

C#轉(zhuǎn)換為VB.NET

2009-08-31 13:41:24

C#創(chuàng)建PDF文件

2021-05-05 10:06:09

React應(yīng)用程序微前端

2009-08-19 16:50:32

Visual C#C#語言特性

2009-08-11 15:46:15

C#日歷控件

2023-08-25 14:47:56

TransFLACFLAC

2023-05-05 00:19:22

2009-08-24 09:55:26

C#接口轉(zhuǎn)換

2009-08-28 15:52:23

C#利用sharpzi

2009-08-25 17:13:57

C#串口編程

2021-04-13 05:36:18

C#null 可控

2009-08-13 17:15:44

C#屏幕保護程序

2009-07-30 16:23:07

C#日期格式化

2009-07-31 16:48:44

C#位運算
點贊
收藏

51CTO技術(shù)棧公眾號