自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

淺談Python RSS處理問(wèn)題

開發(fā) 后端
Python RSS是目前為止最為成功的 XML 服務(wù)之一,盡管他的開源史比較復(fù)雜,但是已經(jīng)成為Web 站點(diǎn)交換內(nèi)容信息的社區(qū)標(biāo)準(zhǔn)了。

Python應(yīng)用程序作為一個(gè)很好的 RSS 處理工具,下面文章進(jìn)行介紹了一些可用于 RSS 處理的模塊,大多數(shù)Python RSS處理.py 的用戶本身只需要關(guān)心它所提供的兩個(gè)類。

RSS 是一個(gè)可用多種擴(kuò)展來(lái)表示的縮寫:“RDF 站點(diǎn)摘要(RDF Site Summary)”、“真正簡(jiǎn)單的辛迪加(Really Simple Syndication)”、“豐富站點(diǎn)摘要(Rich Site Summary)”。也許還能用其他擴(kuò)展來(lái)表示。在如此混亂的名稱背后,您會(huì)發(fā)現(xiàn)和這樣一個(gè)平凡的技術(shù)領(lǐng)域相關(guān)的故事多得令人吃驚。

Python RSS處理是用于分發(fā) Web 站點(diǎn)上的內(nèi)容的摘要的一種簡(jiǎn)單的 XML 格式。它能夠用于共享各種各樣的信息,包括(但不是僅限于)簡(jiǎn)訊、Web 站點(diǎn)更新、事件日歷、軟件更新、特色內(nèi)容集合和基于 Web 進(jìn)行拍賣的商品。RSS 是 Netscape 在 1999 年創(chuàng)建的,它允許將許多信息源中的內(nèi)容聚集到 Netcenter 門戶網(wǎng)站中(這個(gè)門戶網(wǎng)站現(xiàn)在已經(jīng)不存在了)。

UserLand 社區(qū)中的 Web 狂熱愛好者們成為了 RSS 早期的支持者,RSS 很快就成為了一種非常流行的格式。這種流行使得人們很難對(duì) RSS 進(jìn)行改進(jìn)從而使它能用于更多的地方。這種限制導(dǎo)致了 RSS 的發(fā)展出現(xiàn)了分歧。

其中一個(gè)組選擇了一種基于 RDF 的方式,目的在于利用大量的 RDF 工具和模塊,而另一個(gè)組則選擇了一種更加緊縮的方式。前者被稱之為 RSS 1.0,而后者則被稱之為 RSS 0.91。就在上個(gè)月由于 RSS 非 RDF 變體的一個(gè)新版本的出現(xiàn)使得兩者之間的競(jìng)爭(zhēng)進(jìn)一步加劇。

這一新版本被它的創(chuàng)造者稱之為“RSS 2.0”。RSS 0.91 和 1.0 非常流行,并且許許多多的門戶網(wǎng)站和 Web 日志都使用它們。事實(shí)上,blogging 社區(qū)是 RSS 的主要用戶,而 Python RSS處理就是某些現(xiàn)有的用于 XML 交換的網(wǎng)絡(luò)令人印象深刻的理由。

這些網(wǎng)絡(luò)已在有機(jī)地增長(zhǎng),并且真正地成為現(xiàn)有的最成功的 XML 服務(wù)的網(wǎng)絡(luò)。RSS 成為一種 XML 服務(wù)是因?yàn)樗煌ㄟ^(guò)網(wǎng)際協(xié)議交換 XML 信息(絕大多數(shù)的 RSS 交換是 RSS 文檔的簡(jiǎn)單 HTTP GET)。

在本文中,我們介紹的不過(guò)是許多可以與 RSS 一起工作的 Python 工具中的少數(shù)幾個(gè)。我們不提供針對(duì) RSS 的技術(shù)上的介紹。因?yàn)槟梢栽谄渌S多的文章中獲得這些內(nèi)容。(請(qǐng)參閱參考資料)。我們推薦您首先簡(jiǎn)單地熟悉一下 RSS 知識(shí),并且能了解 XML。您不需要去了解 RDF。

Mark Nottingham 編寫的 RSS.py 是用于 RSS 處理的一個(gè) Python 庫(kù)。它非常完善并且編寫的很好。它需要 Python 2.2 和 PyXML 0.7.1。它的安裝是非常簡(jiǎn)單;您只需從 Mark 的主頁(yè)中下載 Python 文件并將它復(fù)制到您的 PYTHONPATH 中的某處。

大多數(shù)Python RSS處理.py 的用戶本身只需要關(guān)心它所提供的兩個(gè)類:CollectionChannel 和 TrackingChannel。后者似乎是這兩個(gè)類中更有用的一個(gè)。TrackingChannel 是一個(gè)包含以每一項(xiàng)的關(guān)鍵字為索引的所有的 RSS 數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。

CollectionChannel 是一個(gè)類似的數(shù)據(jù)結(jié)構(gòu),但它的結(jié)構(gòu)更像 RSS 文檔本身,它的頂層通道信息使用 URL 表示的散列值指向項(xiàng)細(xì)節(jié)。您很可能會(huì)使用 RSS.ns 結(jié)構(gòu)中的實(shí)用程序名稱空間聲明。清單 1 是一個(gè)簡(jiǎn)單的腳本,它將下載并解析用于 Python 新聞的 RSS 供給,并以一個(gè)簡(jiǎn)單的清單形式打印來(lái)自各項(xiàng)的所有信息。

【編輯推薦】

  1. 漫談Python 源代碼編制技巧
  2. 簡(jiǎn)單易于操作的Python 工具詳解
  3. 有關(guān)Python應(yīng)用領(lǐng)域進(jìn)行說(shuō)明介紹
  4. PythonAndroid面向?qū)ο蟮木幊獭狿ython應(yīng)用程序
  5. 如何使用Python模塊解析配置文件 ?
責(zé)任編輯:chenqingxiang 來(lái)源: IT168
相關(guān)推薦

2010-02-23 17:23:26

Python異常處理

2014-02-19 09:51:29

iOS開發(fā)時(shí)間處理

2010-05-17 14:59:05

MySQL事務(wù)處理

2016-11-14 10:06:04

大數(shù)據(jù)max位圖

2010-01-12 17:26:37

C++編譯器

2018-09-18 23:32:35

物聯(lián)網(wǎng)污水處理IOT

2022-04-24 16:29:28

千年蟲時(shí)間計(jì)算機(jī)系統(tǒng)

2022-05-12 23:38:19

SQL數(shù)據(jù)庫(kù)字符串

2021-03-10 18:26:49

Tensorflow語(yǔ)音識(shí)別音頻處理

2010-02-26 14:14:23

Python RSS文

2010-02-26 13:56:08

Python RSS

2017-08-28 15:21:29

異步處理回調(diào)函數(shù)異步編程

2011-07-05 10:20:38

java

2010-09-29 14:56:53

2009-06-10 17:11:01

linux netbe反鋸齒處理

2010-03-02 10:08:28

Android源代碼

2010-09-29 15:55:22

DHCP IP相同

2009-07-15 16:29:41

Swing繪畫

2018-03-22 11:00:45

PythonRSS

2009-11-05 15:39:39

負(fù)載均衡
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)