自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

關(guān)于 JavaScript 字符串的一個(gè)小知識(shí)

開發(fā) 前端
說(shuō)起字符串,我們?cè)偈煜げ贿^(guò)了。接觸編程的第一個(gè)經(jīng)典任務(wù)就是輸出字符串:Hello, world。但是你知道 JavaScript 字符串在計(jì)算機(jī)里是怎么表示的嗎?

 說(shuō)起字符串,我們?cè)偈煜げ贿^(guò)了。接觸編程的第一個(gè)經(jīng)典任務(wù)就是輸出字符串:Hello, world。但是你知道 JavaScript 字符串在計(jì)算機(jī)里是怎么表示的嗎?

[[337557]]

最簡(jiǎn)單直觀但不太準(zhǔn)確的的理解就是,字符串就是由英文字母、數(shù)字和標(biāo)點(diǎn)符號(hào)等這些字符組成的序列。比如下面這個(gè)字符串就是由5個(gè)字母和一個(gè)感嘆號(hào)組成的:

 

  1. const message = 'Hello!'

同時(shí)也可以看出該字符串的字符數(shù)是6:

 

  1. const message = 'Hello!'
  2. message.length; // => 6 

如果字符串是由這些可見字符(也就是 127 個(gè) ASCII 字符) 組成的,這樣理解沒(méi)有問(wèn)題。但是,一旦碰到不常見的符號(hào),比如一些表情字符😀, 😁, 😈,可能會(huì)得到意外的結(jié)果:

 

  1. const smile = '😀'
  2. smile.length; // => 2 

是不是很奇怪?明明只有一個(gè)字符,長(zhǎng)度怎么會(huì)是 2 呢?這是因?yàn)?,JavaScript 字符串實(shí)際上是由編碼單元構(gòu)成的,而不是可見字符序列。

ECMA 262 規(guī)范里是這么描述 JavaScript 字符串的:

String 類型是由零或多個(gè) 16 位無(wú)符號(hào)整數(shù)值組成的有序序列的集合。字符串類型通常用于表示運(yùn)行中的 ECMAScript 程序中的文本數(shù)據(jù),在這種情況下,字符串中的每個(gè)元素都被視為 UTF-16 編碼單元值。

簡(jiǎn)單說(shuō),JavaScript 字符串就是 UTF-16 編碼單元序列,一串?dāng)?shù)字而已。

一個(gè)編碼單元就是位于 0x0000 和 0xFFFF 之間的一個(gè)數(shù)字,編碼單元與字符之間有個(gè)對(duì)應(yīng)關(guān)系。例如,編碼單元 0x0048 對(duì)應(yīng)了實(shí)際的字符 H:

 

  1. const letter = '\u0048'
  2. letter === 'H' // => true 

如果把一整個(gè)字符串'Hello!'用編碼單元表示就是這樣:

 

  1. const message = '\u0048\u0065\u006C\u006C\u006F\u0021'
  2. message === 'Hello!'; // => true 
  3. message.length;       // => 6 

可以看到,這個(gè)字符串有6個(gè)編碼單元,每個(gè)編碼單元對(duì)應(yīng)一個(gè)字符?;径辔姆N平面 BMP(Basic Multilingual Plane)中的任意一個(gè)字符,都可以用一個(gè) UTF-16 編碼單元表示。但是,在這個(gè)范圍以外的字符,就需要 2 個(gè) UTF-16 編碼單元來(lái)表示了。比如前面提到的笑臉?lè)?hào),編碼是\uD83D\uDE00:

 

  1. const smile = '\uD83D\uDE00'
  2. smile === '😀'; // => true 
  3. smile.length;  // => 2 

這兩個(gè)編碼單元是成對(duì)存在的,用于表示超出 0xFFFF 的字符。不能拆開,否則就變成無(wú)法識(shí)別的亂碼了。另外,這里的.length是2,說(shuō)明這個(gè)屬性其實(shí)是字符串編碼單元的個(gè)數(shù),而不是字符數(shù)。在需要判斷字符數(shù)量的時(shí)候就要注意了,根據(jù).length得到的結(jié)果是不準(zhǔn)確的。那要怎么解決呢?可以用這種辦法:

 

  1. const message = 'Hello!'
  2. const smile = '😀'
  3.  
  4. [...message].length; // => 6 
  5. [...smile].length;   // => 1 

如果覺(jué)得這個(gè)關(guān)于 JavaScript 字符串的小知識(shí)對(duì)你有用,歡迎分享給你的小伙伴們!

責(zé)任編輯:華軒 來(lái)源: 1024譯站
相關(guān)推薦

2011-07-18 13:34:44

SQL Server數(shù)拼接字符串

2021-08-13 07:00:43

Java字符串對(duì)象問(wèn)題

2022-10-13 16:14:26

JavaScript字符串開發(fā)

2020-05-12 08:53:15

JavaScript字符串處理庫(kù)

2020-12-31 07:56:02

JavaScript 字符串技巧

2023-02-09 16:15:27

JavaScript編程語(yǔ)言字符串

2023-04-17 16:19:32

編程語(yǔ)言JavaScript開發(fā)

2023-04-25 15:46:51

Python字符串

2011-07-22 15:38:54

SQL Server數(shù)存儲(chǔ)過(guò)程切割字符串

2023-11-27 16:01:59

JavaScrip技巧

2011-04-20 11:34:07

SQL字符串分割

2022-12-08 15:55:52

JavaScript字符串

2020-09-18 14:23:50

字符

2022-08-14 09:01:27

代碼字符串

2011-07-11 16:00:22

字符串拼接

2020-09-03 10:13:49

JavaScript字符串pad

2022-11-24 08:01:57

bash腳本字符串

2024-01-04 09:17:03

前端開發(fā)CSV 格式JSON 字符串

2010-01-05 10:40:07

.NET Framew

2015-06-09 14:43:36

javascript操作字符串
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)