uehtml 网站源码,dedecms部署两个网站,wordpress 4.5.9,wordpress移动端顶部菜单UUID(Universally Unique IDentifier)是一个128位数字的唯一标识。RFC 4122描述了具体的规范实现。本文尝试从它的结构一步步分析为什么它能做到唯一性#xff1f;及各个版本的使用场景。
Format
UUID使用16进制表示#xff0c;共有36个字符(32个字母数字4个连接符-及各个版本的使用场景。
Format
UUID使用16进制表示共有36个字符(32个字母数字4个连接符-)格式为8-4-4-4-12如
6d25a684-9558-11e9-aa94-efccd7a0659b xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx M中使用4位来表示UUID的版本N中使用1-3位表示不同的variant。如上面所示M 1, N a表示此UUID为version-1variant-1的UUID(Time-based ECE/RFC 4122 UUID)。
但是为什么最开始说它是一个128位的唯一标识呢这里明明字母位数是(844412)*8256位。
因为上面的字母是用的16进制一个16进制只代表4个bit所以应该是(844412)*4128位。
UUID使用的是大数位format(big-endian)比如
00112233-4455-6677-8899-aabbccddeeff 编码就是 00 11 22 33 44 55 66 77 88 99 aa bb cc dd ee ff.
UUID现有5种版本是根据不同的使用场景划分的而不是根据精度所以Version5并不会比Version1精度高在精度上大家都能保证唯一性重复的概率近乎于0。
Version1(date-time MAC address)
基于时间戳及MAC地址的UUID实现。它包括了48位的MAC地址和60位的时间戳
接下来使用ossp-uuid命令行创建5个UUID v1。(在Mac安装brew install ossp-uuid)
uuid -n 5 -v1
5b01c826-9561-11e9-9659-cb41250df352
5b01cc7c-9561-11e9-965a-57ad522dee7f
5b01cea2-9561-11e9-965b-a3d050dd0f99
5b01cf60-9561-11e9-965c-1b66505f58da
5b01d118-9561-11e9-965d-97354eb9e996肉眼一看有一种所有的UUID都很相似的感觉几乎就要重复了怎么回事
其实v1为了保证唯一性当时间精度不够时会使用13~14位的clock sequence来扩展时间戳比如
当UUID的生产成速率太快超过了系统时间的精度。时间戳的低位部分会每增加一个UUID就1的操作来模拟更高精度的时间戳换句话说就是当系统时间精度无会区分2个UUID的时间先后时为了保证唯一性会在其中一个UUID上1。所以UUID重复的概率几乎为0时间戳加扩展的clock sequence一共有74bits,(2的74次方约为1.8后面加22个零),即在每个节点下每秒可产生1630亿不重复的UUID(因为只精确到了秒,不再是74位所以换算了一下)。
相对于其它版本v1还加入48位的MAC地址这依赖于网卡供应商能提供唯一的MAC地址同时也可能通过它反查到对应的MAC地址。Melissa病毒就是这样做到的。
Version2(date-time Mac address)
这是最神秘的版本RFC没有提供具体的实现细节以至于大部分的UUID库都没有实现它只在特定的场景(DCE security)才会用到。所以绝大数情况我们也不会碰到它。
Version3,5(namespace name-based)
V3和V5都是通过hash namespace的标识符和名称生成的。V3使用MD5作为hash函数V5则使用SHA-1。
因为里面没有不确定的部分所以当namespace与输入参数确定时得到的UUID都是确定唯一的。比如
uuid -n 3 -v3 ns:URL http://www.baidu.com
2f67490d-55a4-395e-b540-457195f7aa95
2f67490d-55a4-395e-b540-457195f7aa95
2f67490d-55a4-395e-b540-457195f7aa95
可以看到这3个UUID都是一样的。具体的流程就是
把namespace和输入参数拼接在一起如http/http://wwwbaidu.com “/queryuuid” 使用MD5算法对拼接后的字串进行hash截断为128位 把UUID的Version和variant字段都替换成固定的; 如果需要to_string需要转为16进制和加上连接符-。 把V3的hash算法由MD5换成SHA-1就成了V5。
Version4(random)
这个版本使用最为广泛:
uuid -n 5 -v4
a3535b78-69dd-4a9e-9a79-57e2ea28981b
a9ba3122-d89b-4855-85f1-92a018e5c457
7c59d031-a143-4676-a8ce-1b24200ab463
533831da-eab4-4c7d-a3f6-1e2da5a4c9a0
def539e8-d298-4575-b769-b55d7637b51e其中4位代表版本2-3位代表variant。余下的122-121位都是全部随机的。即有2的122次方(5.3后面36个0)个UUID。一个标准实现的UUID库在生成了2.71万亿个UUID会产生重复UUID的可能性也只有50%的概率 这相当于每秒产生10亿的UUID持续85年而把这些UUID都存入文件每个UUID占16bytes,总需要45 EB(exabytes)比目前最大的数据库(PB)还要大很多倍。
Summary
如果只是需要生成一个唯一ID,你可以使用V1或V4。 V1基于时间戳和Mac地址,这些ID有一定的规律(你给出一个是有可能被猜出来下一个是多少的)而且会暴露你的Mac地址。 V4是完全随机(伪)的。 如果对于相同的参数需要输出相同的UUID,你可以使用V3或V5。 V3基于MD5 hash算法如果需要考虑与其它系统的兼容性的话就用它,因为它出来得早大概率大家都是用它的。 V5基于SHA-1 hash算法这个是首选。