自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何去除字符串中的 "\n" ?

開發(fā) 前端
我最近負(fù)責(zé)的工作是設(shè)計一個 SQL 解析引擎。簡單來說,就是將一個 SQL 表達(dá)式字符串,解析為一顆對象樹,從而執(zhí)行查詢等一系列操作。

[[387047]]

本文轉(zhuǎn)載自微信公眾號「程序員魚皮」,作者 魚皮。轉(zhuǎn)載本文請聯(lián)系程序員魚皮公眾號。  

 大家好,我是魚皮,今天分享一個小知識。

我最近負(fù)責(zé)的工作是設(shè)計一個 SQL 解析引擎。簡單來說,就是將一個 SQL 表達(dá)式字符串,解析為一顆對象樹,從而執(zhí)行查詢等一系列操作。

SQL 解析原理

在最開始,我就遇到了一個很頭疼的問題,用戶編寫的 SQL 語句可能非常不標(biāo)準(zhǔn)!

理想的 SQL 語句,縮進(jìn)很規(guī)范,沒有多余的字符:

  1. select * from user

而現(xiàn)實往往是這樣的:

  1. select * \n 
  2. rom   user

上述語句不僅縮進(jìn)、換行很隨意,還多了很多無意義的字符串,比如 "\n" !

因此,想要設(shè)計一個通用性強的 SQL 解析引擎,首先要對字符串進(jìn)行 預(yù)處理,將輸入的 SQL 語句標(biāo)準(zhǔn)化。比如去除回車、換行、冗余的空格和特殊字符等。

那問題來了,如何去除字符串中的所有 "\n" 呢?注意,這里的 "\n" 并不是換行符,而是由字符 '\' 和字符 'n' 組成的字符串!

  1. # 轉(zhuǎn)換前 
  2. select * \n  
  3. from user
  4.  
  5. # 轉(zhuǎn)換后 
  6. select * from user

首先我想到了兩種思路:

  • 用循環(huán)語句順序掃描每個字符,通過當(dāng)前字符和下一個字符判斷是否為 "\n",再移除。
  • 直接用 Java 語言提供的 replaceAll 方法,傳入一個正則表達(dá)式,直接將完整字符串中所有匹配正則的子串替換為空串。

我這里選擇后者,直接用現(xiàn)成的方法會比較方便,而且借助強大的正則表達(dá)式,可以同時替換掉多個冗余字符。

Java 正則表達(dá)式定義:

  1. /* 
  2.  * 全部替換 
  3.  * regex 正則表達(dá)式 
  4.  * replacement 要替換成的新串 
  5.  */ 
  6. public String replaceAll(String regex, String replacement) { 
  7.   return Pattern.compile(regex).matcher(this).replaceAll(replacement); 

剛開始我想的太簡單了,直接編寫出如下代碼:

  1. str.replaceAll("\n"""); 

結(jié)果,并不能順利地替換掉字符串中的 "\n",僅僅是把換行符去掉了!

用單個反斜杠的結(jié)果

原因很簡單,在 Java 字符常量中,反斜杠(\)是一個特殊的字符,被稱為 轉(zhuǎn)義字符,它的作用是用來轉(zhuǎn)義后面一個字符,本身不具有實際意義!

因此,不能用下面這種方式直接輸出反斜杠:

報錯

如果想要單獨輸出一個反斜杠,需要再加上一個反斜杠轉(zhuǎn)義:

無報錯

同理,想要輸出一個 "\n" 字符串,代碼要這么寫:

  1. System.out.println("\\n"

那不妨試試這個正則表達(dá)式:

  1. str.replaceAll("\\n"""); 

結(jié)果出乎意料,竟然和只用一個反斜杠時的效果一樣!僅僅是移除了換行符。

用兩個反斜杠的效果

其實,正確的答案應(yīng)該是使用 四個反斜杠,因為反斜杠在 Java 和正則表達(dá)式中都是轉(zhuǎn)義字符!

其中,第一個斜杠是轉(zhuǎn)義符,第二個斜杠是斜杠本身,第三個斜杠又是轉(zhuǎn)義符,第四個斜杠是斜杠本身。

在 Java 中,輸出 "\n" 字符串需要兩個反斜杠和一個 'n',在 Java 的正則表達(dá)式中,要給這兩個反斜杠分別再分配一個反斜杠進(jìn)行轉(zhuǎn)義,才能生效。

總而言之,記住一句話:Java 正則表達(dá)式中,匹配一個反斜杠要用四個反斜杠!

 

責(zé)任編輯:武曉燕 來源: 程序員魚皮
相關(guān)推薦

2010-06-28 15:18:51

SQL Server

2022-11-25 07:53:26

bash腳本字符串

2021-01-09 23:11:33

SQL數(shù)據(jù)庫字母

2022-12-15 16:23:32

JavaScrip字符串開發(fā)

2017-12-11 13:50:17

LinuxBash子字符串

2011-07-11 16:00:22

字符串拼接

2011-06-08 15:45:41

字符串JAVA

2020-09-03 10:13:49

JavaScript字符串pad

2021-09-07 09:23:07

C++字符串算法

2009-02-24 15:39:27

字符串比較函數(shù)函數(shù)

2010-07-13 09:20:38

SQL Server

2010-09-06 17:30:46

SQL函數(shù)

2021-09-10 08:18:31

Go語言字符串

2015-06-09 14:43:36

javascript操作字符串

2010-09-09 11:48:00

SQL函數(shù)字符串

2010-08-12 10:26:12

FlexXML

2010-11-25 15:59:33

字符串.NET

2012-01-11 09:15:45

Objective-C

2019-12-17 15:49:44

Java語言字符串

2021-03-08 08:23:24

Java字符串截取
點贊
收藏

51CTO技術(shù)棧公眾號