自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

10萬+的標(biāo)題怎么取?YouTube標(biāo)題首詞與播放量有什么關(guān)系?

開發(fā) 后端
“re.findall()”是Python中最基本的正則表達(dá)式函數(shù)之一,提取字符串表達(dá)式的開頭。本文將用這個(gè)函數(shù)告訴你,YouTube視頻標(biāo)題與播放量之間的關(guān)系。

本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)

正則表達(dá)式是定義文本中搜索模式的特殊字符序列。“re.findall()”是Python中最基本的正則表達(dá)式函數(shù)之一,提取字符串表達(dá)式的開頭。本文將用這個(gè)函數(shù)告訴你,YouTube視頻標(biāo)題與播放量之間的關(guān)系。

下面開始吧!

[[323443]]

首先,導(dǎo)入python正則表達(dá)式模塊“re”:

  1. import re 

假設(shè)有以下字符串:

  1. test_string1'Python is Amazing!' 

可將表達(dá)式r“^\w+”與字符串一并傳遞至“re.findall”,這將返回輸入字符串的開頭:

  1. reregex_1 =re.findall(r"^\w+",test_string1) 
  2. print(regex_1) 
10萬+的標(biāo)題怎么取?YouTube標(biāo)題首詞與播放量有什么關(guān)系?

在表達(dá)式r“^\w+”中,字符“^”對應(yīng)字符串開頭,而“\w+”查找字符串中的字母數(shù)字字符。

如果去掉“^”,會(huì)得到:

  1. reregex_1 =re.findall(r"\w+",test_string1) 
  2. print(regex_1) 

10萬+的標(biāo)題怎么???YouTube標(biāo)題首詞與播放量有什么關(guān)系?

試提取另一個(gè)字符串示例的開頭:

  1. test_string2'Java is Amazing!' 

 

[[323446]]

 

 

圖源:unsplash

 

現(xiàn)在,應(yīng)用“re.findall()”查找該字符串的第一個(gè)單詞:

  1. reregex_2 =re.findall(r"^\w+",test_string2) 
  2. print(regex_2) 
10萬+的標(biāo)題怎么???YouTube標(biāo)題首詞與播放量有什么關(guān)系?

接下來,考慮一個(gè)更實(shí)際的場景。假設(shè)有一個(gè)YouTube視頻標(biāo)題列表和相應(yīng)的YouTube觀看次數(shù)。我們可能對分析視頻標(biāo)題的第一個(gè)單詞和相應(yīng)視頻觀看次數(shù)之間的關(guān)系感興趣??紤]以下標(biāo)題/觀看次數(shù)元組列表:

  1. youtube_titles= [("How to Tell if We're Beating COVID-19", 2200000), ("ExtremeCloset Clean Out",326000), ("This is $1,000,000 inFood",8800000), ("How To Tell If Someone Truly Loves You ",2800000), ("How to Tell Real Gold from Fake", 2300000),("Extreme living room transformation ", 25000)] 

可以通過以下方式找到每個(gè)標(biāo)題的第一個(gè)單詞:

  1. for titlein youtube_titles: 
  2.    print(re.findall(r"^\w+",title[0])[0]) 
10萬+的標(biāo)題怎么?。縔ouTube標(biāo)題首詞與播放量有什么關(guān)系?

可以將這些值添加到列表中:

  1. first_words= [] 
  2. for title in youtube_titles: 
  3.    first_words.append(re.findall(r"^\w+",title[0])[0]) 
  4. print(first_words) 

10萬+的標(biāo)題怎么?。縔ouTube標(biāo)題首詞與播放量有什么關(guān)系?

還可以將觀看次數(shù)附加到列表中:

  1. first_words= [] 
  2. views = [] 
  3. for title in youtube_titles: 
  4.    first_words.append(re.findall(r"^\w+",title[0])[0]) 
  5.     views.append(title[1]) 
10萬+的標(biāo)題怎么???YouTube標(biāo)題首詞與播放量有什么關(guān)系?

然后,可以創(chuàng)建視頻首字值和視頻觀看次數(shù)的數(shù)據(jù)框:

  1. importpandas as pd 
  2. df = pd.DataFrame({'first_words': first_words, 'views':views}) 
  3. print(df) 
10萬+的標(biāo)題怎么???YouTube標(biāo)題首詞與播放量有什么關(guān)系?

之后可以對每個(gè)標(biāo)題首詞進(jìn)行分組,并計(jì)算每個(gè)標(biāo)題首詞的平均觀看次數(shù):

  1. dfdf =df.groupby('first_words')['views'].mean() 
  2. print(df) 
10萬+的標(biāo)題怎么?。縔ouTube標(biāo)題首詞與播放量有什么關(guān)系?

按降序方式對這些值進(jìn)行排序:

  1. dfdf =df.groupby('first_words')['views'].mean().sort_values(ascending = False
  2. print(df) 
10萬+的標(biāo)題怎么?。縔ouTube標(biāo)題首詞與播放量有什么關(guān)系?

假設(shè)這些結(jié)果來自一個(gè)足夠大的數(shù)據(jù)集(比如有數(shù)千個(gè)標(biāo)題和觀看次數(shù)),這種類型的分析可以幫助我們選擇最佳的YouTube視頻標(biāo)題。

[[323450]]

圖源:unsplash

本文討論了如何使用python正則表達(dá)式模塊中的“re.findall()”函數(shù)。為提取每個(gè)字符串的第一個(gè)單詞,筆者將該函數(shù)應(yīng)用于兩個(gè)簡單的字符串。然后,考慮了一個(gè)實(shí)際用例,使用該函數(shù)提取YouTube視頻標(biāo)題的第一個(gè)單詞,并計(jì)算第一個(gè)單詞對應(yīng)的平均觀看次數(shù)。

10萬+的標(biāo)題,或許就是這么來的。

 

責(zé)任編輯:趙寧寧 來源: 讀芯術(shù)
相關(guān)推薦

2023-11-02 09:59:53

C++設(shè)計(jì)模式

2021-07-20 08:12:55

CPU核數(shù)線程數(shù)

2021-10-18 10:17:07

Go Golang語言

2018-09-30 15:55:56

2023-07-10 10:53:22

2011-06-02 18:33:03

標(biāo)題關(guān)鍵詞

2019-09-29 19:28:13

區(qū)塊鏈比特幣加密貨幣

2022-11-01 15:02:11

2021-04-27 10:14:28

大數(shù)據(jù)物聯(lián)網(wǎng)IOT

2015-08-27 14:05:01

大數(shù)據(jù)創(chuàng)業(yè)

2017-10-23 14:40:01

2015-09-24 10:40:31

NFVSDN

2022-08-15 09:02:22

Redis模式訂閱消息

2020-02-27 08:52:51

NFVSDN網(wǎng)絡(luò)

2022-02-14 11:28:51

區(qū)塊鏈元宇宙代幣

2015-08-03 10:20:39

大數(shù)據(jù)Hadoop

2011-06-02 18:12:35

2021-02-02 12:46:36

Spring異步循環(huán)

2023-04-06 11:54:55

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號