自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python 一鍵導出微信閱讀記錄和筆記

開發(fā) 后端
本人習慣使用微信讀書,為了方便整理書籍和導出筆記,便開發(fā)了這個小工具。

 [[328225]]

全民閱讀的時代已經來臨,目前使用讀書軟件的用戶數(shù)2.1億,日活躍用戶超過500萬,其中19-35歲年輕用戶占比超過60%,本科及以上學歷用戶占比高達80%,北上廣深及其他省會城市/直轄市用戶占比超過80%。

本人習慣使用微信讀書,為了方便整理書籍和導出筆記,便開發(fā)了這個小工具。

部分截圖

代碼思路

1. 目錄結構

首先,我們先看一下整體目錄結構 

  1. ├─ excel_func.py                   讀寫excel文件  
  2. ├─ pyqt_gui.py                     PyQt GUI界面  
  3. └─ wereader.py                     微信讀書相關api 
  •  excel_func.py

    使用xlrd和xlwt庫對excel文件進行讀寫操作

  •  pyqt_gui.py

    使用PyQt繪制GUI界面

  •  wereader.py

    通過抓包解析獲得相關api

2. excel_func.py 

  1. def write_excel_xls(path, sheet_name_list, value):  
  2.     # 新建一個工作簿  
  3.     workbook = xlwt.Workbook()  
  4.     # 獲取需要寫入數(shù)據的行數(shù)  
  5.     index = len(value)  
  6.     for sheet_name in sheet_name_list:  
  7.         # 在工作簿中新建一個表格  
  8.         sheet = workbook.add_sheet(sheet_name)  
  9.         # 往這個工作簿的表格中寫入數(shù)據  
  10.         for i in range(0, index):  
  11.             for j in range(0, len(value[i])):  
  12.                 sheet.write(i, j, value[i][j])  
  13.     # 保存工作簿  
  14.     workbook.save(path) 

該函數(shù)的代碼流程為:

  1.  創(chuàng)建excel文件
  2.  創(chuàng)建表格
  3.  往表格寫入數(shù)據

3. pyqt_gui.py 

  1. class MainWindow(QMainWindow):  
  2.     def __init__(self, *args, **kwargs):  
  3.         super().__init__(*args, **kwargs)  
  4.         self.DomainCookies = {}  
  5.         self.setWindowTitle('微信讀書助手') # 設置窗口標題  
  6.         self.resize(900, 600) # 設置窗口大小  
  7.         self.setWindowFlags(Qt.WindowMinimizeButtonHint) # 禁止最大化按鈕  
  8.         self.setFixedSize(self.width(), self.height()) # 禁止調整窗口大小  
  9.         url = 'https://weread.qq.com/#login' # 目標地址  
  10.         self.browser = QWebEngineView() # 實例化瀏覽器對象  
  11.         QWebEngineProfile.defaultProfile().cookieStore().deleteAllCookies() # 初次運行軟件時刪除所有cookies  
  12.         QWebEngineProfile.defaultProfile().cookieStore().cookieAdded.connect(self.onCookieAdd) # cookies增加時觸發(fā)self.onCookieAdd()函數(shù)  
  13.         self.browser.loadFinished.connect(self.onLoadFinished) # 網頁加載完畢時觸發(fā)self.onLoadFinished()函數(shù)  
  14.         self.browser.load(QUrl(url)) # 加載網頁  
  15.         self.setCentralWidget(self.browser) # 設置中心窗口 

該函數(shù)的代碼流程為:

  1.  新建QT窗口
  2.  實例化QWebEngineView對象
  3.  綁定self.onCookieAdd事件
  4.  綁定self.onLoadFinished事件
  5.  加載網頁   
  1. # 網頁加載完畢事件  
  2.     def onLoadFinished(self):  
  3.         global USER_VID  
  4.         global HEADERS 
  5.         # 獲取cookies  
  6.         cookies = ['{}={};'.format(key, value) for key,value in self.DomainCookies.items()]  
  7.         cookies = ' '.join(cookies)  
  8.         # 添加Cookie到header  
  9.         HEADERS.update(Cookie=cookies 
  10.         # 判斷是否成功登錄微信讀書  
  11.         if login_success(HEADERS):  
  12.             print('登錄微信讀書成功!')  
  13.             # 獲取用戶user_vid  
  14.             if 'wr_vid' in self.DomainCookies.keys():  
  15.                 USER_VID = self.DomainCookies['wr_vid']  
  16.                 print('用戶id:{}'.format(USER_VID))  
  17.                 # 關閉整個qt窗口  
  18.                 self.close()  
  19.         else:  
  20.             print('請掃描二維碼登錄微信讀書...') 

該函數(shù)的代碼流程為:

  1.  當網頁加載完畢時,檢測是否成功登錄微信讀書
  2.  如果成功登錄微信讀書,則關閉QT窗口,開始進行數(shù)據導出
  3.  如果失敗登錄微信讀書,則繼續(xù)等待用戶掃描二維碼   
  1. # 添加cookies事件  
  2.    def onCookieAdd(self, cookie):  
  3.        if 'weread.qq.com' in cookie.domain():  
  4.            name = cookie.name().data().decode('utf-8')  
  5.            value = cookie.value().data().decode('utf-8')  
  6.            if name not in self.DomainCookies:  
  7.                self.DomainCookies.update({name: value}) 

該函數(shù)的代碼流程為:

  1.  保存微信讀書網址的cookies,以便后續(xù)操作 
  1. books = get_bookshelf(USER_VID, HEADERS) # 獲取書架上的書籍  
  2.   booksbooks_finish_read = books['finishReadBooks']  
  3.   booksbooks_recent_read = books['recentBooks']  
  4.   booksbooks_all = books['allBooks']  
  5.   write_excel_xls_append(data_dir + '我的書架.xls', '已讀完的書籍', books_finish_read) # 追加寫入excel文件  
  6.   write_excel_xls_append(data_dir + '我的書架.xls', '最近閱讀的書籍', books_recent_read)  # 追加寫入excel文件  
  7.   write_excel_xls_append(data_dir + '我的書架.xls', '所有的書籍', books_all)  # 追加寫入excel文件  
  8.   # 獲取書架上的每本書籍的筆記  
  9.   for index, book in enumerate(books_finish_read):  
  10.       bookbook_id = book[0]  
  11.       bookbook_name = book[1]  
  12.       notes = get_bookmarklist(book[0], HEADERS)  
  13.       with open(note_dir + book_name + '.txt', 'w') as f:  
  14.           f.write(notes)  
  15.       print('導出筆記 {} ({}/{})'.format(note_dir + book_name + '.txt', index+1, len(books_finish_read))) 

該函數(shù)的代碼流程為:

  1.  調用write_excel_xls_append函數(shù),保存書籍,并且導出筆記

4. wereader.py 

  1. def get_bookshelf(userVid, headers):  
  2.     """獲取書架上所有書"""  
  3.     url = "https://i.weread.qq.com/shelf/friendCommon"  
  4.     params = dict(userViduserVid=userVid)  
  5.     r = requests.get(url, paramsparams=params, headersheaders=headers, verify=False 
  6.     if r.ok:  
  7.         data = r.json()  
  8.     else:  
  9.         raise Exception(r.text)  
  10.     books_finish_read = set() # 已讀完的書籍  
  11.     books_recent_read = set() # 最近閱讀的書籍  
  12.     books_all = set() # 書架上的所有書籍  
  13.     for book in data['recentBooks']:  
  14.         if not book['bookId'].isdigit(): # 過濾公眾號  
  15.             continue  
  16.         b = Book(book['bookId'], book['title'], book['author'], book['cover'], book['intro'], book['category'])  
  17.         books_recent_read.add(b)  
  18.     books_all = books_finish_read + books_recent_read  
  19.     return dict(finishReadBooks=books_finish_readrecentBooks=books_recent_readallBooks=books_all

該函數(shù)的代碼流程為:

  1.  獲取最近閱讀的書籍、已經讀完的書籍、所有書籍
  2.  過濾公眾號部分
  3.  將書籍數(shù)據保存為字典格式 
  1. def get_bookmarklist(bookId, headers):  
  2.     """獲取某本書的筆記返回md文本"""  
  3.     url = "https://i.weread.qq.com/book/bookmarklist"  
  4.     params = dict(bookIdbookId=bookId)  
  5.     r = requests.get(url, paramsparams=params, headersheaders=headers, verify=False 
  6.     if r.ok:  
  7.         data = r.json()  
  8.         # clipboard.copy(json.dumps(data, indent=4sort_keys=True))  
  9.     else:  
  10.         raise Exception(r.text)  
  11.     chapters = {c['chapterUid']: c['title'] for c in data['chapters']}  
  12.     contents = defaultdict(list)  
  13.     for item in sorted(data['updated'], key=lambda x: x['chapterUid']):  
  14.         # for item in data['updated']:  
  15.         chapter = item['chapterUid']  
  16.         text = item['markText']  
  17.         create_time = item["createTime"]  
  18.         start = int(item['range'].split('-')[0])  
  19.         contents[chapter].append((start, text))  
  20.     chapters_map = {title: level for level, title in get_chapters(int(bookId), headers)}  
  21.     res = '' 
  22.      for c in sorted(chapters.keys()):  
  23.         title = chapters[c]  
  24.         res += '#' * chapters_map[title] + ' ' + title + '\n'  
  25.         for start, text in sorted(contents[c], key=lambda e: e[0]):  
  26.             res += '> ' + text.strip() + '\n\n'  
  27.         res += '\n'  
  28.     return res 

該函數(shù)的代碼流程為:

  1.  獲取某一本書籍的筆記
  2.  將返回的字符串改寫成markdown格式并輸出

如何運行 

  1. # 跳轉到當前目錄  
  2. cd 目錄名  
  3. # 先卸載依賴庫  
  4. pip uninstall -y -r requirement.txt  
  5. # 再重新安裝依賴庫  
  6. pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple  
  7. # 開始運行  
  8. python pyqt_gui.py 

補充

完整版源代碼存放在github上,有需要的請點擊這里下載

https://github.com/shengqiangzhang/examples-of-web-crawlers 

 

責任編輯:龐桂玉 來源: 戀習Python
相關推薦

2021-04-27 14:59:13

微信一鍵凍結手機

2019-05-28 14:18:39

Python微信好友編程語言

2021-11-11 07:52:56

微信個人信息騰訊

2020-06-30 20:26:10

微信功能移動應用

2021-10-15 22:24:25

微信功能存儲

2015-02-09 15:25:52

換膚

2021-03-24 14:43:34

微信手機安卓

2020-04-13 15:45:11

小程序微信互聯(lián)網法院

2022-03-28 06:58:35

微信通訊錄刪除的好友

2017-12-22 09:28:33

微信車險微車保

2015-11-03 15:29:49

ONOS開放網絡操作系統(tǒng)SDN

2020-04-17 09:51:52

Python數(shù)據庫微信

2021-10-14 14:55:36

微信深度清理騰訊

2023-06-15 10:00:00

Jenkins任務操作

2025-04-17 04:00:00

2023-11-09 14:40:56

大數(shù)據自動化工具

2017-12-27 11:14:37

2021-09-07 08:26:07

微信微信收費騰訊

2020-12-15 08:56:00

微信移動應用

2012-03-01 14:00:08

點贊
收藏

51CTO技術棧公眾號