被Python的這個(gè)“特性”給坑死了
哈哈哈,被自己蠢死了,也被 python 的語(yǔ)法給坑死了。沒(méi)想到還會(huì)遇到這種問(wèn)題。
事情是這樣的。
項(xiàng)目中遇到一個(gè)字符串替換的問(wèn)題。
我們知道字符串替換可以直接用replace方法,但這個(gè)方法只適合簡(jiǎn)單的字符替換,就是前提你要明確知道你要替換什么。
例如把“java”去掉
- s = "java python"
- print(s.replace("java", "")) # python
遇到復(fù)雜場(chǎng)景就不得不用正則表達(dá)式的方法來(lái)替換了。
比如有一段html文本
- s = """
- <script>
- !function(e)
- w3i9df
- xxx
- </script>
- <div> 這是html文本</div>
- """
我想把script腳本去掉,只保留html文本。這時(shí)候可以正則表達(dá)式里面的 re.sub 方法來(lái)實(shí)現(xiàn)。
- import re
- s = """
- <script>
- !function(e)
- w3i9df
- xxx
- </script>
- <div> 這是html文本</div>
- """
- result=re.sub(r"<script.*?</script>", "", s)
- print(result)