自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何在MySQL中存儲(chǔ)emoji?

數(shù)據(jù)庫(kù) MySQL
目前來(lái)說(shuō),多數(shù) MySQL 都是以 utf8 存儲(chǔ),注意 MySQL 的 utf8 和我們所說(shuō)的傳統(tǒng) utf8 有點(diǎn)區(qū)別。MySQL 的 utf8 編碼規(guī)定了最多只能有 3 個(gè)字節(jié),而 emoji 的 unicode 已經(jīng)超過(guò)了 3 個(gè)字節(jié),因此 MySQL 的 utf8 無(wú)法識(shí)別與存儲(chǔ) emoji。

[[170505]]

問(wèn)題還原

使用 erlang 存儲(chǔ)一些特殊字符串到 MySQL 的時(shí)候,卻沒(méi)法讀出來(lái)。經(jīng)檢查,這些字符串的二進(jìn)制格式如下:

  1. <<240,159,152,134,240,159,152,144>> 

查看二進(jìn)制的 unicode 是什么?

  1. 14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>). 
  2. [128518,128528] 
  3. 15> erlang:integer_to_list(128518,16).%%查看十六進(jìn)制 
  4. "1F606" 
  5. 16> erlang:integer_to_list(128528,16). 
  6. "1F610" 

明顯,1F606 和 1F610 超過(guò)了常見(jiàn) unicode 字符串 0000-FFFF 的表達(dá)范圍。

這里引用資料:http://cenalulu.github.io/linux/character-encoding/

1F606 和 1F610 代表什么?

根據(jù) unicode 官網(wǎng)上的說(shuō)明,這是一種 emoji(表情符號(hào)),具體的展示形式與廠商有關(guān)。

MySQL 上存儲(chǔ)失敗的原因

目前來(lái)說(shuō),多數(shù) MySQL 都是以 utf8 存儲(chǔ),注意 MySQL 的 utf8 和我們所說(shuō)的傳統(tǒng) utf8 有點(diǎn)區(qū)別。MySQL 的 utf8 編碼規(guī)定了最多只能有 3 個(gè)字節(jié),而 emoji 的 unicode 已經(jīng)超過(guò)了 3 個(gè)字節(jié),因此 MySQL 的 utf8 無(wú)法識(shí)別與存儲(chǔ) emoji。

為此可以查閱 MySQL 中關(guān)于 unicode 支持的資料,從中可以得知 MySQL 在 5.5 后開(kāi)始支持 utf8mb4,這種編碼支持 1 ~ 4 個(gè)字節(jié),這種編碼可以表示 emoji。

另外 utf8mb4 向下兼容 utf8。

關(guān)于 unicode 與 utf8 的詳細(xì)介紹,請(qǐng)查看:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

解決方案

將 MySQL 中對(duì)應(yīng)的字段改成 utf8mb4 編碼:

  1. ALTER TABLE t1 
  2.   DEFAULT CHARACTER SET utf8mb4, 
  3.   MODIFY col1 CHAR(10) 
  4.     CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL
  5.   MODIFY col2 CHAR(10) 
  6.     CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL

參考:http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-upgrading.html

將連接庫(kù)的連接編碼改為 utf8mb4,以 erlang 的連接庫(kù) emysql 為例:

  1. emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]). 
  2. %%或者 
  3. emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4). 

為了建表方便,可以修改 my.cnf:

  1. # 服務(wù)器字符集 
  2. [mysql] 
  3. default-character-set=utf8mb4 
  4. [mysqld] 
  5. character-set-server=utf8mb4 

 

責(zé)任編輯:龐桂玉 來(lái)源: Linux中國(guó)
相關(guān)推薦

2019-12-23 09:42:19

Linux輸入emoji

2016-09-12 16:19:38

MySQL存儲(chǔ)數(shù)據(jù)庫(kù)

2022-09-20 14:46:17

PostgreSQL存儲(chǔ)工具

2024-06-17 10:16:37

MySQLutf8mb4字節(jié)

2022-06-22 09:56:19

PythonMySQL數(shù)據(jù)庫(kù)

2013-07-03 09:42:06

桌面虛擬化存儲(chǔ)

2017-02-22 10:06:11

UbuntuCeph存儲(chǔ)

2009-07-21 14:57:41

iBatis中調(diào)用存儲(chǔ)iBatis

2013-08-23 10:30:41

虛擬桌面虛擬快照

2011-08-11 14:35:47

SQL Server插入更新

2011-07-25 09:45:51

樹(shù)狀結(jié)構(gòu)數(shù)據(jù)庫(kù)存儲(chǔ)

2022-01-17 13:34:45

MySQLLinux數(shù)據(jù)庫(kù)

2018-12-27 13:35:11

MySQLMySQL 8重置密碼

2011-03-03 10:00:14

ProFTPD建立MySQL

2024-12-16 17:02:58

MySQLInnoDB數(shù)據(jù)庫(kù)

2009-06-01 09:57:43

netbeans連接數(shù)netbeans數(shù)據(jù)庫(kù)netbeans連接m

2015-03-09 10:12:51

AWS S3AWSCloudFront

2015-11-24 14:14:00

CentOS 7.0Ceph配置

2022-11-09 07:40:18

2024-01-17 09:33:16

數(shù)據(jù)庫(kù)MySQL
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)