ULID:Universally Unique Lexicographically Sortable Identifier(通用唯一詞典分類標識符)
UUID:Universally Unique Identifier(通用唯一標識符)
為什么不選擇UUID
UUID 目前有 5 個版本:
版本1:在許多環境中是不切實際的,因為它需要訪問唯一的,穩定的MAC地址,容易被攻擊;
版本2:將版本 1 的時間戳前四位換為 POSIX 的 UID 或 GID,問題同上;
版本3:基于 MD5 哈希算法生成,生成隨機分布的ID需要唯一的種子,這可能導致許多數據結構碎片化;
版本4:基于隨機數或偽隨機數生成,除了隨機性外沒有提供其他信息;
版本5:通過 SHA-1 哈希算法生成,生成隨機分布的ID需要唯一的種子,這可能導致許多數據結構碎片化;
這里面常用的就是 UUID4 了,但是,即使是隨機的,但是也是存在沖突的風險。
和 UUID 要么基于隨機數,要么基于時間戳不同,ULID 是既基于時間戳又基于隨機數,時間戳精確到毫秒,毫秒內有1.21e + 24個隨機數,不存在沖突的風險,而且轉換成字符串比 UUID 更加友好。
ULID特性:
ulid()#01ARZ3NDEKTSV4RRFFQ69G5FAV
與UUID的128位兼容性
每毫秒1.21e + 24個唯一ULID
按字典順序(也就是字母順序)排序!
規范地編碼為26個字符串,而不是UUID的36個字符
使用Crockford的base32獲得更好的效率和可讀性(每個字符5位)
不區分大小寫
沒有特殊字符(URL安全)
單調排序順序(正確檢測并處理相同的毫秒)
ULID規范
以下是在python(ulid-py)中實現的ULID的當前規范。二進制格式已實現
01AN4Z07BY79KA1307SR9X4MV3 |----------||----------------| TimestampRandomness 10chars16chars 48bits80bits
組成
時間戳
48位整數
UNIX時間(以毫秒為單位)
直到公元10889年,空間都不會耗盡。
隨機性
80位隨機數
如果可能的話,采用加密技術保證隨機性
排序
最左邊的字符必須排在最前面,最右邊的字符必須排在最后(詞匯順序)。必須使用默認的ASCII字符集。在同一毫秒內,不能保證排序順序
編碼方式
如圖所示,使用了Crockford的Base32。該字母表不包括字母I,L,O和U,以避免混淆和濫用。
0123456789ABCDEFGHJKMNPQRSTVWXYZ
二進制布局和字節順序
組件被編碼為16個八位位組。每個組件都以最高有效字節在前(網絡字節順序)進行編碼。
0123 01234567890123456789012345678901 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_time_high| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |16_bit_uint_time_low|16_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
應用場景
替換數據庫自增id,無需DB參與主鍵生成
分布式環境下,替換UUID,全局唯一且毫秒精度有序
比如要按日期對數據庫進行分區分表,可以使用ULID中嵌入的時間戳來選擇正確的分區分表
如果毫秒精度是可以接受的(毫秒內無序),可以按照ULID排序,而不是單獨的created_at字段
用法(python)
安裝
pipinstallulid-py
創建一個全新的ULID。
時間戳記值(48位)來自 time.time(),精度為毫秒。
隨機值(80位)來自 os.urandom()。
>>>importulid >>>ulid.new()
根據現有的128位值(例如UUID)創建新的ULID 。
支持ULID值類型有 int,bytes,str,和UUID。
>>>importulid,uuid >>>value=uuid.uuid4() >>>value UUID('0983d0a2-ff15-4d83-8f37-7dd945b5aa39') >>>ulid.from_uuid(value)
從現有時間戳值(例如datetime對象)創建新的ULID 。
支持時間戳值類型有int,float,str,bytes,bytearray,memoryview,datetime,Timestamp,和ULID
>>>importdatetime,ulid >>>ulid.from_timestamp(datetime.datetime(1999,1,1))
根據現有的隨機數創建一個新的ULID。
支持隨機值類型有int,float,str,bytes,bytearray,memoryview,Randomness,和ULID。
>>>importos,ulid >>>randomness=os.urandom(10) >>>ulid.from_randomness(randomness) >>>
一旦有了ULID對象,就有多種與之交互的方法。
timestamp()方法將為您提供ULID的前48位的時間戳快照,而randomness()方法將為您提供后80位的隨機數快照。
>>>importulid >>>u=ulid.new() >>>u>>>u.timestamp() >>>u.randomness()
審核編輯:劉清
-
二進制
+關注
關注
2文章
795瀏覽量
41653 -
URL
+關注
關注
0文章
139瀏覽量
15341 -
字符串
+關注
關注
1文章
579瀏覽量
20518 -
python
+關注
關注
56文章
4797瀏覽量
84691 -
UUID
+關注
關注
0文章
22瀏覽量
8128
原文標題:放棄使用UUID,ULID才是更好的選擇!
文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論