Golang 中的 String、rune 和 byte,你了解了嗎?
解釋
String
Go語(yǔ)言中,string就是只讀的采用utf8編碼的字節(jié)切片(slice) 因此用len函數(shù)獲取到的長(zhǎng)度并不是字符個(gè)數(shù),而是字節(jié)個(gè)數(shù)。 for循環(huán)遍歷輸出的也是各個(gè)字節(jié)。
rune
rune是int32的別名,代表字符的Unicode編碼,采用4個(gè)字節(jié)存儲(chǔ),將string轉(zhuǎn)成rune就意味著任何一個(gè)字符都用4個(gè)字節(jié)來(lái)存儲(chǔ)其unicode值,這樣每次遍歷的時(shí)候返回的就是unicode值,而不再是字節(jié)了,這樣就可以解決亂碼問(wèn)題了
byte
bytes操作的對(duì)象也是字節(jié)切片,與string的不可變不同,byte是可變的,因此string按增量方式構(gòu)建字符串會(huì)導(dǎo)致多次內(nèi)存分配和復(fù)制,使用bytes就不會(huì)因而更高效一點(diǎn)
轉(zhuǎn)換方式
String、bytes 相互轉(zhuǎn)換
String to bytes
func main() {
str := "Hello, Golang!"
fmt.Println(string2bytes1(str))
fmt.Println(string2bytes2(str))
fmt.Println(string2bytes3(str))
}
func string2bytes1(str string) []byte {
bs := make([]byte, 0)
for i := 0; i < len(str); i++ {
bs = append(bs, str[i])
}
return bs
}
func string2bytes2(str string) []byte {
return []byte(str)
}
func string2bytes3(s string) []byte {
sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
bh := reflect.SliceHeader{
Data: sh.Data,
Len: sh.Len,
Cap: sh.Len,
}
return *(*[]byte)(unsafe.Pointer(&bh))
}
前兩個(gè)方法是非常標(biāo)準(zhǔn)的轉(zhuǎn)換方式,第三種方式使用了 unsafe 和 reflect 處理,是個(gè)不安全的做法,而且 StringHeader 在我使用的 1.21 已經(jīng)廢棄了。
bytes to String
func main() {
str := "Hello, Golang!"
bs := string2bytes3(str)
fmt.Println(bytes2string1(bs))
fmt.Println(bytes2string2(bs))
}
func bytes2string1(bs []byte) string {
return string(bs)
}
func bytes2string2(bs []byte) string {
return *(*string)(unsafe.Pointer(&bs))
}
第一種轉(zhuǎn)換也是一個(gè)非常標(biāo)準(zhǔn)的轉(zhuǎn)換方式,第二個(gè)方式使用了不安全的做法。
String、rune 相互轉(zhuǎn)換
String to rune
func main() {
str := "Hello, 中國(guó)!"
fmt.Println(string2rune1(str))
fmt.Println(string2rune2(str))
}
func string2rune1(str string) []rune {
rs := make([]rune, 0)
for _, r := range str {
rs = append(rs, r)
}
return rs
}
func string2rune2(str string) []rune {
return []rune(str)
}
這里的 for range 和上面 for index 是不一樣的,索引字符串產(chǎn)生字節(jié)。For range 循環(huán)每次迭代都會(huì)解碼一個(gè) UTF-8 編碼的符文,因此值類型是 rune。
rune to String
func main() {
str := "Hello, 中國(guó)!"
rs := string2rune2(str)
fmt.Println(rune2string1(rs))
}
func rune2string1(rs []rune) string {
return string(rs)
}
rune、bytes 相互轉(zhuǎn)換
[]rune 和 []byte 的相互轉(zhuǎn)換需要先轉(zhuǎn)成字符串再轉(zhuǎn)換。
func main() {
str := "Hello, 中國(guó)!"
rs := string2rune1(str)
bs := string2bytes1(str)
convertedBytes := rune2bytes(rs)
convertedRunes := bytes2rune(bs)
fmt.Println(bs)
fmt.Println(convertedBytes)
fmt.Println(rs)
fmt.Println(convertedRunes)
}
func rune2bytes(rs []rune) []byte {
return []byte(string(rs))
}
func bytes2rune(bs []byte) []rune {
return []rune(string(bs))
}
總結(jié)
希望大家通過(guò)這篇文章可以鞏固自己對(duì)這幾種類型的理解,以及更方便的對(duì)它們進(jìn)行轉(zhuǎn)換。