自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

老大告訴我不要用字符串存IP地址,不興~

網(wǎng)絡(luò) 通信技術(shù)
數(shù)據(jù)庫中IP地址數(shù)據(jù)該怎么存?或許你已經(jīng)不止一次遇到過這類問題,怎么存?

[[432371]]

數(shù)據(jù)庫中IP地址數(shù)據(jù)該怎么存?或許你已經(jīng)不止一次遇到過這類問題,怎么存?varchar(255)不就完事兒了?坦白說,在我經(jīng)歷的幾個項目中,幾乎都遇到過存儲IP地址(V4、V6)的數(shù)據(jù)字段,都用的變長字符串varchar(15)來存儲,嗯,感覺還挺香的...

其實很早以前我就在《高性能MySQL第三版》中看過IP地址屬于特殊類型數(shù)據(jù),應轉(zhuǎn)為整數(shù)存儲。

《高性能MySQL第三版》

4.1.7 特殊類型數(shù)據(jù)

某些類型的數(shù)據(jù)并不直接與內(nèi)置類型一致。低于秒級精度的時間戳就是一個例子;本意的前面部分也演示過存儲此類數(shù)據(jù)的一些選項。

另一個例子是一個IPv4地址。人們經(jīng)常使用VARCHAR(15)列來存儲IP地址。然而,它們實際上是 32位無符號整數(shù),不是字符串。用小數(shù)點將地址分成四段的表示方法只是為了讓人們閱讀容易。所以應該用無符號整數(shù)存儲IP地址。MySQL提供INET ATON()和 INET NTOA()函數(shù)在這兩種表示方法之間轉(zhuǎn)換。

??但項目中并未涉及到對IP地址的高頻查詢業(yè)務需求;所以嘛,你知道的,我們程序員的三不準則:跟自己沒關(guān)系的代碼不要看,自己模塊用不到的技術(shù)不要學,遺留代碼只要能跑的就不要動!

直到老大看我們項目數(shù)據(jù)表時問道:"你們存IP地址都是用字符串嗎?這可不興啊!應該用整數(shù)來存啊。"

"老大,我明白你的優(yōu)化思路,你看咱們這表,就幾十條數(shù)據(jù)(狗頭)...."

直到上周有位同學問我IP地址在數(shù)據(jù)庫中該怎么存,他在面試中被問到了,我突然意識到了這玩意兒是時候記錄一下了。

一、IP地址應該怎么存

在MySQL中,當存儲IPv4地址時,應該使用32位的無符號整數(shù)(UNSIGNED INT)來存儲IP地址,而不是使用字符串,用UNSIGNED INT類型存儲IP 地址是一個4字節(jié)長的整數(shù)。

如果是字符串存儲IP 地址,在正常格式下,最小長度為 7 個字符 (0.0.0.0),最大長度為 15 個 (255.255.255.255),因此,我們通常會使用varchar(15)來存儲。同時為了讓數(shù)據(jù)庫準確跟蹤列中有多少數(shù)據(jù),數(shù)據(jù)庫會添加額外的1字節(jié)來存儲字符串的長度。這使得以字符串表示的 IP 的實際數(shù)據(jù)存儲成本需要16字節(jié)。

這意味著如果將每個 IP 地址存儲為字符串的話,每行需要多耗費大約 10 個字節(jié)的額外資源。

如果你說磁盤夠使不是事兒,那我得告訴你,這個不僅會使數(shù)據(jù)文件消耗更多的磁盤,如果該字段加了索引,也會同比例擴大索引文件的大小,緩存數(shù)據(jù)需要使用更多內(nèi)存來緩存數(shù)據(jù)或索引,從而可能將其他更有價值的內(nèi)容推出緩存區(qū)。執(zhí)行SQL對該字段進行CRUD時,也會消耗更多的CPU資源。

在早先使用Oracle10g時,是沒有相關(guān)函數(shù)來進行IP整數(shù)和字符串的,但在MySQL中有內(nèi)置的函數(shù),來對IP和數(shù)值進行相互轉(zhuǎn)換。

  • INET_ATON()

將IP轉(zhuǎn)換成整數(shù)。

算法:第一位乘256三次方+第二位乘256二次方+第三位乘256一次方 + 第四位乘256零次方

  • INET_NTOA()

將數(shù)字反向轉(zhuǎn)換成IP

  1. SELECT INET_ATON('127.0.0.1'); 
  2.  
  3. +------------------------+ 
  4. | INET_ATON('127.0.0.1') | 
  5. +------------------------+ 
  6. |             2130706433 |  
  7. +------------------------+ 
  8. 1 row in set (0.00 sec) 
  9.  
  10.  
  11. SELECT INET_NTOA('2130706433'); 
  12.  
  13. +-------------------------+ 
  14. | INET_NTOA('2130706433') | 
  15. +-------------------------+ 
  16. | 127.0.0.1               |  
  17. +-------------------------+ 
  18. 1 row in set (0.02 sec) 

如果是 IPv6地址的話,可以使用函數(shù) INET6_ATON() 和 INET6_NTOA() 來轉(zhuǎn)化:

  1. mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B'));  
  2.  
  3. +----------------------------------------------+ 
  4. | HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) | 
  5. +----------------------------------------------+ 
  6. | 1030000000000000C9B4FF1248AA1A2B             | 
  7. +----------------------------------------------+ 
  8. 1 row in set 
  9.  
  10. mysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B'));  
  11. +-------------------------------------------------------+ 
  12. | INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) | 
  13. +-------------------------------------------------------+ 
  14. | 1030::c9b4:ff12:48aa:1a2b                             | 
  15. +-------------------------------------------------------+ 
  16. 1 row in set 

然后將數(shù)據(jù)庫定義為 varbinary 類型,分配 128bits 空間(因為 ipv6采用的是128bits,16個字節(jié));或者定義為 char 類型,分配 32bits 空間。

二、整數(shù)存儲 IP 地址的查詢性能實驗

測試數(shù)據(jù),用存儲過程生成了 100 萬個隨機 IP 地址;

1、測試范圍查詢:

IP轉(zhuǎn)成Int,查詢:耗時0.60s

  1. select ip_int from T where ip_int > INET_ATON('192.0.0.0'and ip_int <=INET_ATON('192.255.255.255'); 
  2.  
  3. 1726 row in set, 1 warning (0.60 sec) 
  • IP為字符串,查詢:耗時0.63s
  1. select ip_varchar from T where ip_varchar like '192.%'
  2.  
  3. 1726 row in set, 1 warning (0.63 sec) 

2、IP精確查詢:

  1. select ip_int from T where ip_int = INET_ATON('192.168.0.0'); 
  2.  
  3. 1 row in set, 1 warning (0.00 sec) 
  1. select ip_varchar from T where ip_varchar='192.168.0.0'
  2.  
  3. 1 row in set, 1 warning (0.00 sec) 

都是0s出結(jié)果??烧J為常量索引查詢,性能上無明顯差異。

3、整理一下結(jié)果發(fā)現(xiàn):

  • 范圍查詢和精確查詢:

數(shù)據(jù)量少的情況下的差距不明顯,如果數(shù)據(jù)量擴大到約1千萬行或1億行,1億行時預計范圍查詢差距能拉開到0.5s。

  • 存儲空間節(jié)省:

按1億行算,理論上 varchar 最大15字節(jié)存儲,數(shù)值4個字節(jié),大約節(jié)省10字節(jié) *1億 約1G空間。

加上索文件引所占的空間,一個索引也是能節(jié)省1G。約能節(jié)省2G空間。

總結(jié)

??IP地址數(shù)據(jù)采用整數(shù)(UNSIGNED INT)存儲,在存儲和CPU資源使用上都少于字符串存儲形式;在歧義較大的范圍查詢中,存儲整數(shù)方式無需關(guān)系范圍中的位數(shù)問題,查詢更加直觀方便。

??但整數(shù)存儲需要使用INET_ATON、INET_NTOA等特定函數(shù)處理,可讀性查,函數(shù)也會消耗額外CPU,經(jīng)檢驗發(fā)現(xiàn)CPU開支微乎其微。

 

??因此,需要范圍查詢,且數(shù)據(jù)量很大(如億級以上),采用數(shù)值存儲IP地址的方式更優(yōu)。如果均是唯一IP精確查詢,或數(shù)據(jù)量不大,那么使用字符串操作更為簡單。

 

責任編輯:武曉燕 來源: MySQL江湖路
相關(guān)推薦

2018-03-26 09:05:18

CTO

2009-06-15 16:53:44

Groovy字符串gstring

2024-04-09 09:08:09

Kafka消息架構(gòu)

2019-03-25 20:31:58

IP地址轉(zhuǎn)換數(shù)字

2022-09-05 08:01:20

JWTWeb安全

2025-04-08 09:40:00

DWD數(shù)據(jù)倉庫大數(shù)據(jù)

2009-11-24 19:02:35

PHP常用字符串

2025-02-03 22:07:43

2019-01-18 20:36:40

Python佩奇turtle

2022-09-13 08:44:02

IP網(wǎng)絡(luò)MAC地址

2024-04-16 08:26:18

IP地址MAC地址

2017-07-17 12:17:38

2018-01-03 08:31:43

前端開發(fā)圖標

2018-01-10 15:15:47

2024-09-03 09:20:45

2020-11-20 16:13:01

Android手機上網(wǎng)

2021-05-22 06:56:18

OpenWrt 路由器刷機

2013-08-30 13:35:14

項目團隊

2009-06-12 13:59:04

2013-11-11 11:10:03

WE大會馬化騰
點贊
收藏

51CTO技術(shù)棧公眾號