12個(gè)Python數(shù)據(jù)處理常用內(nèi)置函數(shù)
在python數(shù)據(jù)分析中,經(jīng)常需要對字符串進(jìn)行各種處理,例如拼接字符串、檢索字符串等。下面我將對python中常用的內(nèi)置字符串操作函數(shù)進(jìn)行介紹。
1.計(jì)算字符串的長度-len()函數(shù)
- str1='我愛python'
- length=len(str1)
- print(length)
len()函數(shù)在計(jì)算字符串的長度時(shí),不區(qū)分英文、數(shù)字和漢字,所有字符都按一個(gè)字符計(jì)算。
有時(shí),我們需要獲取字符串實(shí)際所占的字節(jié),即計(jì)算python默認(rèn)編碼UTF-8下的實(shí)際字節(jié)長度,可以這樣做:
- str1='我愛python'
- length=len(str1.encode())
- print(length)
12
和UTF-8編碼下一個(gè)漢字占3個(gè)字節(jié)相吻合
2.分割字符串
split()方法可以實(shí)現(xiàn)字符串分割,也就是把一個(gè)字符串按照指定的分割符分割為字符串列表。具體語法格式如下
- str.split(sep,maxsplit)
參數(shù)說明:
- str:表示要分割的字符串
- sep:指定的分割符
- maxsplit:用于指定分割的次數(shù)
3.統(tǒng)計(jì)某字符出現(xiàn)的次數(shù)
count()方法用于檢索某字符串在另一字符串中出現(xiàn)的次數(shù),語法格式如下:
- str.count(str1)
參數(shù)說明:
- str:表示原字符串
- str1:表示要檢索的字符串
4.檢索某字符串是否存在(find)
find()方法用于檢索是否包含指定的子字符串。如果檢索的字符串不存在,則返回-1,否則返回首次出現(xiàn)該子字符串的索引。其語法格式如下:
- str.find(str1)
參數(shù)說明:
- str:表示原字符
- str1:表示要檢索的子字符串
5.檢索某字符串是否存在(index)
index()與find()方法類似,也是用于檢索是否包含指定的子字符串。只不過index()方法在指定字符串不存在是會(huì)拋出異常。具體語法如下:
- str.index(str1)
參數(shù)說明:
- str:表示原字符
- str1:表示要檢索的子字符串
6.檢索字符串是否已指定字符串開頭
這里用到startswith()方法,如果是則返回True,否則返回False,具體語法如下:
- str.startswith(str1)
參數(shù)說明:
- str:表示原字符
- str1:表示要檢索的子字符串
7.檢索字符串是否已指定字符串結(jié)尾
這里用到endswith()方法,如果是則返回True,否則返回False,具體語法如下:
- str.endswith(str1)
參數(shù)說明:
- str:表示原字符
- str1:表示要檢索的子字符串
8.大寫字母轉(zhuǎn)小寫字母
lower()方法用于價(jià)格字符串中的大寫字母轉(zhuǎn)換為小寫字母,語法格式如下:
- str.lower()
9.小寫字母轉(zhuǎn)換為大寫字母
upper()方法用于價(jià)格字符串中的小寫字母轉(zhuǎn)換為大寫字母,語法格式如下:
- str.upper()
10.刪除空格和特殊字符
strip()方法用于去掉字符串左、右兩側(cè)的空格和特殊字符,語法格式如下:
- str.strip([chars])
參數(shù)說明:
- str:表示原字符
- chars:為可選參數(shù),用于指定要取出的字符,可以指定多個(gè)。如果chars為“@”,則取出左、右兩側(cè)包括的“@”“。”。如果不指定chars參數(shù),默認(rèn)去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
11.去掉字符串左側(cè)的字符
lstrip()方法用于去掉字符串左側(cè)的空格和特殊字符,語法格式如下:
- str.lstrip([chars])
參數(shù)說明:
- str:表示原字符
- chars:為可選參數(shù),用于指定要取出的字符,可以指定多個(gè)。如果chars為“@”,則取出左、右兩側(cè)包括的“@”“。”。如果不指定chars參數(shù),默認(rèn)去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
12.去掉字符串右側(cè)的字符
rstrip()方法用于去掉字符串右側(cè)的空格和特殊字符,語法格式如下:
- str.rstrip()
參數(shù)說明:
- str:表示原字符
- chars:為可選參數(shù),用于指定要取出的字符,可以指定多個(gè)。如果chars為“@”,則取出左、右兩側(cè)包括的“@”“。”。如果不指定chars參數(shù),默認(rèn)去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
本文轉(zhuǎn)載自微信公眾號(hào)「python數(shù)據(jù)分析之禪」,作者小dull鳥 。轉(zhuǎn)載本文請聯(lián)系python數(shù)據(jù)分析之禪公眾號(hào)。