自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

值得推薦的HTML文檔JS解析庫

開發(fā) 前端
HTML即一切,所有打算進(jìn)行Web編程的人都應(yīng)該熟悉HTML,并了解如何解析HTML。尤其對前端工程師來說這更是基礎(chǔ),本文我們就來介紹一下JS下常見的HTML解析庫。

HTML即一切,所有打算進(jìn)行Web編程的人都應(yīng)該熟悉HTML,并了解如何解析HTML。尤其對前端工程師來說這更是基礎(chǔ),本文我們就來介紹一下JS下常見的HTML解析庫。

DOMParser

JavaScript和jQuery的DOM操作功能非常適合簡單HTML片段的解析。在實際編程中,如果要以編程方式解析DOM完整HTML或XML,則需要一個更好的解決方案,那就是DOMParser,它是所有現(xiàn)代數(shù)瀏覽器都支持的功能。

通過使用DOMParser,可以輕松解析HTML文檔。但是,一般需要通過欺騙瀏覽器來實現(xiàn)解析,比如,通過向當(dāng)前文檔添加新元素。

DOMParser的用法非常簡單明了:

  1. let domParser = new DOMParser(); 
  2. let doc = domParser.parseFromString(stringContainingXMLSource, "application/xml"); 
  3. domParser = new DOMParser(); 
  4. doc = domParser.parseFromString(stringContainingSVGSource, "image/svg+xml"); 
  5. domParser = new DOMParser(); 
  6. doc = domParser.parseFromString(stringContainingHTMLSource, "text/html"); 

Cheerio

專為服務(wù)器設(shè)計的核心jQuery的快速,靈活和精致的實現(xiàn)。

Cheerio看起來像jQuery,但是不支持瀏覽器。Cheerio可以解析HTML并使其易于操作,但不會像瀏覽器中那樣解釋HTML,解析出與瀏覽器不同的內(nèi)容,并且解析的結(jié)果不會直接發(fā)送給用戶。

Cheerio實現(xiàn)了jQuery子集,去掉了jQuery中所有與DOM不一致或者是用來填補(bǔ)瀏覽器的東西,重現(xiàn)了jQuery最美妙的API

由于使用了極其簡潔而又標(biāo)準(zhǔn)的DOM模型, Cheerio對文檔的轉(zhuǎn)換,操作,渲染都極其的高效。

JavaScript開發(fā)人員都應(yīng)該熟悉Cheerio的語法和用法:

  1. var chro = require('cheerio'), 
  2. $ = chio.load('<h1 class="title">Hello World!</h1>'); 
  3. $('h1.title').text('Hello Chongchong!'); 
  4. $('h1').attr('id', 'welcome'); 
  5. $.html();結(jié)果:<h1 class="title" id=" welcome ">Hello Chongchong!</h1> 

jsdom

jsdom是很多Web標(biāo)準(zhǔn)(尤其是WHATWG DOM和 HTML 標(biāo)準(zhǔn))純JavaScript實現(xiàn),可與Node.js結(jié)合使用。jsdom項目的目標(biāo)是模擬Web瀏覽器的子集,從而滿足測試和抓取實際的Web應(yīng)用程序。

jsdom不僅僅是HTML解析器,它還可以當(dāng)成瀏覽器。在解析的上下文中,如果要解析的數(shù)據(jù)中省略了必要的標(biāo)記,它會自動添加必要的標(biāo)記。例如,如果沒有html標(biāo)簽,它將像瀏覽器一樣隱式地添加它。

還可以選擇指定一些屬性,例如文檔,引薦來源網(wǎng)址或用戶代理的URL。如果需要解析包含本地URL的鏈接,則該URL特別有用。

由于它實際上與解析無關(guān),因此只提到j(luò)sdom具有(虛擬)控制臺,對cookie的支持等。總之,需要模擬瀏覽器環(huán)境

它還可以處理外部資源。如有需求jsdom可以用來加載并執(zhí)行JS腳本。

  1. const jsdom = require("jsdom"); 
  2. const { JSDOM } = jsdom;const dom = new JSDOM('<!DOCTYPE html><p>Hello, Chongchong!</p>'); 
  3. console.log(dom.window.document.querySelector("p").textContent); 

結(jié)果:

  1. "Hello, Chongchong!" 

parse5

parse5提供了處理HTML時所需的幾乎所有內(nèi)容。Parse5庫,目標(biāo)是構(gòu)建其他工具,但也可以實現(xiàn)HTML解析以完成簡單任務(wù)。Parse5易于使用,但是并不提供瀏覽器為提供的操作DOM的方法(例如getElementById)。

parse5衍生出了一系列采用它的令人印象深刻的項目:jsdom,Angular2和Polymer。如果需求為對HTML的高級操作或解析的可靠基礎(chǔ),那么顯然這是一個不錯的選擇。

  1. const parse5 = require('parse5'); 
  2.  
  3. const document = parse5.parse('<!DOCTYPE html><html><head></head><body>Hello Chongchong!</body></html>'); 
  4.  
  5. console.log(document.childNodes[1].tagName); 

總結(jié)

本文我們介紹幾個JS下常見的Html解析庫。根據(jù)標(biāo)準(zhǔn),實際的HTML格式語法格式是需要容錯的。當(dāng)時這在庫很難簡單完美的實現(xiàn)。如果你有更好的推薦,歡迎和大家一起分享。

 

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2021-04-12 11:09:13

React開發(fā)

2022-08-05 09:25:27

React庫JavaScript工具

2021-06-17 09:00:00

人工智能機(jī)器學(xué)習(xí)開源

2020-10-28 09:37:08

React代碼數(shù)據(jù)

2023-12-28 07:39:58

C#項目框架

2023-03-29 08:00:00

PostgreSQL數(shù)據(jù)庫

2020-11-30 09:00:00

WebAngular開發(fā)

2019-08-02 10:00:03

數(shù)據(jù)庫圖形數(shù)據(jù)庫

2019-07-05 08:24:39

JavaScript動畫庫應(yīng)用程序

2021-12-26 09:22:44

前端Css圖標(biāo)

2025-02-03 00:35:00

框架程序Windows

2023-06-27 07:31:02

動畫庫React參數(shù)

2022-02-08 18:53:12

SpringBoot性能優(yōu)化

2019-10-11 09:59:55

開發(fā)者技能工具

2022-07-20 08:55:10

編輯器VueTiptap

2025-03-27 08:11:17

2022-04-24 08:00:00

開發(fā)UI組件

2011-09-08 15:06:33

HTML 5

2020-04-27 14:54:45

React開發(fā)

2020-06-08 14:19:24

DevOps自動化工具
點贊
收藏

51CTO技術(shù)棧公眾號