手把手教你使用Python網(wǎng)絡爬蟲實現(xiàn)郵件定時發(fā)送(附源碼)
大家好,我是Python進階者。
前言
前幾天【馮誠】大佬在群里分享了一個抓取讀書目錄并實現(xiàn)郵件定時發(fā)送的代碼,感覺還是蠻不錯的,這里分享給大家學習。
一、思路
思路倒是不難,構造一個爬蟲任務,抓取某書網(wǎng)站上的目錄,之后將獲取的內(nèi)容返回,然后利用Python實現(xiàn)郵件發(fā)送的功能,剩下的就是定時任務構建了,下面一起來看看具體的實現(xiàn)過程。
二、具體實現(xiàn)
這里直接丟大佬的代碼了,如下所示:
- # -*- coding: utf-8 -*-
- import requests, bs4
- import smtplib
- import schedule
- import time
- from bs4 import BeautifulSoup
- from email.mime.text import MIMEText
- from email.header import Header
- # account = '{0}'.format('發(fā)件人qq郵箱')
- # password = '{0}'.format('qq郵箱授權碼')
- # receiver = '{0}'.format('收件人163郵箱或者qq郵箱')
- account = '{0}'.format('2352180977@qq.com')
- password = '{0}'.format('awmowqginzdijg')
- receiver = '{0}'.format('2352180977@qq.com')
- # 爬蟲任務,獲取sobooks網(wǎng)站上的書名和作者,其中頁面的話,可以根據(jù)自己需求進行修改
- def recipe_spider():
- list_all = ''
- num = 0
- for a in range(1, 3):
- n = '{0}{1}'.format('https://sobooks.cc/page/', a)
- res = requests.get(n)
- res.encoding = res.apparent_encoding
- bs = BeautifulSoup(res.text, 'html.parser')
- # print(bs)
- books = bs.find_all('h3')
- authors = bs.find_all('p')
- for i in range(len(books)):
- num = num+1
- book = books[i].text.strip()
- author = authors[i+1].text.strip()
- #list_books.append([book,author])
- # list_books.append(list_book)
- n = '''
- 書名%s: %s,作者: %s
- ''' % (num, book, author)
- list_all = list_all + n
- return list_all
- # 將獲取到的內(nèi)容發(fā)送郵件
- def send_email(list_all):
- global account, password, receiver
- mailhost = 'smtp.qq.com'
- qqmail = smtplib.SMTP()
- qqmail.connect(mailhost, 25)
- qqmail.login(account, password)
- content = '親愛的,今天書單' + list_all
- print(content)
- message = MIMEText(content, 'plain', 'utf-8')
- subject = '今天看什么'
- message['Subject'] = Header(subject, 'utf-8')
- try:
- qqmail.sendmail(account, receiver, message.as_string())
- print('郵件發(fā)送成功')
- except:
- print('郵件發(fā)送失敗')
- qqmail.quit()
- def job():
- print('開始一次任務')
- list_all = recipe_spider()
- send_email(list_all)
- print('任務完成')
- if __name__ == '__main__':
- # 定時任務,其中0.05是間隔的意思,以分鐘為間隔,時間默認是整數(shù)。
- schedule.every(0.05).minutes.do(job)
- while True:
- schedule.run_pending()
- time.sleep(1)
程序運行之后,即可實現(xiàn)郵件自動發(fā)送了。
稍等片刻,郵件便會自動給你發(fā)送過去,下圖是郵件通知。
下圖是郵件的具體內(nèi)容:
針對上述代碼,你只需要更改三個地方,其一是發(fā)件人的qq郵箱,其二是qq郵箱的授權碼,其三是收件人的郵箱,如下圖紅色框框所示。
三、常見問題
在運行過程中小伙伴們應該會經(jīng)常遇到這個問題,如下圖所示。
這個很可能是因為你的郵箱沒有填對或者授權碼錯誤,檢查下郵箱后綴是否添加或者檢查下授權碼是否復制完整。
有的小伙伴還不知道qq郵箱授權碼怎么獲得,這里引導下,首先你得打開自己的qq郵箱,然后點擊設置-->賬戶,如下圖所示:
拉到最下方,如下圖所示:
點擊生成授權碼,之后會彈出下圖界面:
手機發(fā)送“配置郵件客戶端”關鍵字,記得,是“郵件”,而不是“郵箱”,小編之前就是因為發(fā)錯了字,所以導致沒成功,論細心的重要性!發(fā)送成功之后,就會彈出下圖:
上圖左側(cè)中的條框字母部分就是qq郵箱的授權碼了,將其復制到代碼中進行粘貼即可。
四、總結
我是Python進階者,這篇文章主要給大家介紹了使用Python網(wǎng)絡爬蟲并實現(xiàn)郵件自動定時發(fā)送的小項目。實現(xiàn)的主要思路是構造一個爬蟲任務,抓取某書網(wǎng)站上的目錄,之后將獲取的內(nèi)容返回,然后利用Python實現(xiàn)郵件發(fā)送的功能,并進行定時任務構建,在最后還給大家例舉了常見問題的處理方法。
小伙伴們,快快用實踐一下吧!