為什么說(shuō)Go字符串不能修改
在接觸Go這么語(yǔ)言,可能你經(jīng)常會(huì)聽(tīng)到這樣一句話(huà)。對(duì)于字符串不能修改,可能你很納悶,日常開(kāi)發(fā)中我們對(duì)字符串進(jìn)行修改也是很正常的,為什么又說(shuō)Go中的字符串不能進(jìn)行修改呢?
本文就來(lái)通過(guò)實(shí)際案例給大家演示,為什么Go中的字符串不能進(jìn)行修改。
在演示這個(gè)問(wèn)題之前,我們先對(duì)字符串類(lèi)型的基礎(chǔ)知識(shí)做個(gè)大致的演示,這樣便于大家對(duì)問(wèn)題的進(jìn)一步了解。
字符串定義
字符串是一種用來(lái)表示字符的數(shù)據(jù)類(lèi)型。在使用時(shí),使用" "將字符內(nèi)容包含起來(lái)。例如下面的形式:
在Go中,字符串通常有三種定義方式:
字符串的定義,其實(shí)也可以通過(guò)字節(jié)的方式。這里羅列的方式是最為常見(jiàn)的方式。
字符串的組成
Go中的字符串符合Unicode[1]標(biāo)準(zhǔn),并且采用UTF-8[2]編碼。字符串底層其實(shí)也是由byte組成(后面會(huì)仔細(xì)講解)。通過(guò)下面的示例,打印查看具體的字節(jié)內(nèi)容:
上面代碼打印的內(nèi)容,就是每一個(gè)字符所表示的字節(jié)碼。
字符串不能修改
通過(guò)上面的大致演示,我們對(duì)字符串有一個(gè)基本的了解。對(duì)于字符串不能修改,可能你很納悶,日常開(kāi)發(fā)中我們對(duì)字符串進(jìn)行重新賦值也是很正常的,為什么又說(shuō)Go中的字符串不能進(jìn)行修改呢?
其實(shí)這里要糾正這個(gè)說(shuō)話(huà),對(duì)于字符串修改并不等價(jià)于重新賦值。開(kāi)發(fā)中常用的方式,其實(shí)是一種重新賦值的概念。
通常聽(tīng)到的不能修改,其實(shí)就是指的上面代碼的第二種方式。并且通過(guò)這種方式修改會(huì)報(bào)錯(cuò)::cannot assign to s[0] (value of type byte)
回歸正題,為什么Go中的字符串不能通過(guò)下標(biāo)的方式來(lái)進(jìn)行修改呢? 這是因?yàn)镚o中的字符串的數(shù)據(jù)結(jié)構(gòu)體是由一個(gè)指針和長(zhǎng)度組成的結(jié)構(gòu)體,該指針指向的一個(gè)切片才是真正的字符串值。Go中源碼有這樣一段定義:
正是因?yàn)榈讓邮且粋€(gè)[]byte類(lèi)型的切片,當(dāng)我們使用下標(biāo)的方式去修改值,這時(shí)候?qū)⒁粋€(gè)字符內(nèi)容賦值給byte類(lèi)型,肯定是不允許的。但是我們可以通過(guò)下標(biāo)的方式去訪(fǎng)問(wèn)對(duì)應(yīng)的byte值。
那我們要想通過(guò)下標(biāo)的方式去修改值該怎么辦呢?這時(shí)候,就需要通過(guò)切片的方式來(lái)定義,然后在轉(zhuǎn)成字符串。
字符串的賦值
上面分析了為什么字符串不能使用下標(biāo)去賦值,回過(guò)來(lái)解答一下日常開(kāi)發(fā)中的賦值方式。
那為什么這種場(chǎng)景下又可以給字符串重新賦值呢? 這是因?yàn)?,在Go的底層其實(shí)是新創(chuàng)建了一個(gè)[]byte{}類(lèi)型的切片,將變量s中的指針指向了新的內(nèi)存空間地址(也就是這里的Hello Go!?)。原有的Hello World!內(nèi)存空間會(huì)隨著垃圾回收機(jī)制被回收掉。
為什么這么設(shè)計(jì)
可能大家都會(huì)考慮到,為什么一個(gè)普通的字符串要設(shè)計(jì)這么復(fù)雜,還需要使用指針。暫時(shí)沒(méi)找到官方文檔的說(shuō)明,
- 1. 個(gè)人猜想,當(dāng)遇到一個(gè)非常長(zhǎng)的字符時(shí),這樣做使得string變得非常輕量,可以很方便的進(jìn)行傳遞而不用擔(dān)心內(nèi)存拷貝。雖然在Go中,不管是引用類(lèi)型還是值類(lèi)型參數(shù)傳遞都是值傳遞。但指針明顯比值傳遞更節(jié)省內(nèi)存。
引用鏈接
[1]? Unicode: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/
[2]? UTF-8: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/