当前位置:首页 > 数字货币资讯 > 正文内容

hash算法(原理)

hash算法(原理)

哈希 Hash 算法介绍

哈希算法也叫散列算法, 不过英文单词都是 Hash, 简单一句话概括, 就是可以把任意长度的输入信息通过算法变换成固定长度的输出信息, 输出信息也就是哈希值, 通常哈希值的格式是16进制或者是10进制, 比如下面的使用 md5 哈希算法的示例

md5("123456") => "e10adc3949ba59abbe56e057f20f883e"

主要特点:

  • 不可逆 从哈希值不能推导出原始数据, 所以Hash算法广泛应用在现代密码体系中

  • 无碰撞 不同的信息进行哈希后得到的值应该是不同的, 但是从理论上来说, 哈希算法其实是有可能发生碰撞的, 输入的信息是无穷的, 而输出的哈希值长度是固定的, 所以是有限的。好比要把10个苹果放到9个抽屉里面, 肯定会有一个抽屉装了多个苹果, 只不过哈希算法的碰撞的概率是非常小的, 比如128位的哈希值, 就有2的128次方的空间。

  • 效率高 在处理比较大的原生值时, 也能能快速的计算出哈希值

  • 无规律 原始输入信息修改一点信息, 得到的哈希值也是大不相同的

哈希算法的实现有很多, 常见的有 MD5, SHA-1, 还有像 C#, Java 一些语言都有直接的 GetHashCode(), hashCode() 函数可以直接来用。

分布式存储场景

在互联网场景中, 通常面对的都是海量的数据,海量的用户, 那为了要满足大量数据的写入和查询, 以及高可用, 一台单机的存储服务器肯定是不能满足需求的, 通常需要使用多台服务器形成分布式存储。

场景描述:

在本文中, 为了方便大家更好的理解, 这里列出了一个简单的例子, 有三位用户, 分别是 James、 Bob、 Lee, 我们需要把用户的图片写入到存储服务器节点, 这里有ABC三个节点, 而且当查询用户的图片时, 还需要快速定位到这个用户的图片是在哪个节点存储的, 然后直接从这个节点进行查询, 需要满足高效率的查询。

hash算法(原理)

实现思路:

首先,我们可以对用户标识进行 Hash 计算, 这里我为了方便演示, 使用了用户名作为Hash对象, 当然你还可以对用户的IP或者是UserId 进行Hash计算, Hash计算后会生成一个int类型的数字, 然后再根据存储节点的数量进行取模, 这里的公式就是 hash(name) % 3, 计算得出的结果只有三种情况, 分别是 0,1,2, 然后我们再把这三种结果和三个存储节点做一个映射, 0 ==> A, 1 ==> B, 2 == C。 因为Hash算法对一个值多次计算后都会得到同样的hash值, 所以上面的公式, 一个用户的图片每次都会固定的写入的其中一个节点, 这样做查询的话, 也可以通过hash算法快速找到这个用户的图片所在的节点。

分享给朋友:

相关文章

三大交易所排行(加密货币交易所对比)

三大交易所排行(加密货币交易所对比)

三大交易所排行 okcoin币行 okcoin除了拥有交易所之外,还积极对外投资,入股区块链媒体sososbtc,矿池1hash。之前徐明星也做过熟人借贷项目“好有钱”。另外btc114.com这...

chia奇亚挖矿教程:Chia(奇亚)挖矿显示未同步怎么办?

chia奇亚挖矿教程:Chia(奇亚)挖矿显示未同步怎么办?

随着Chia的热度越来越高,越来越多的“Farmers”加入“Farming”的行列。很多小伙伴在此过程中,可能遇到最多的问题就是,Chia奇亚钱包不同步、Chia节点未同步、Chi...

“公共服务”是什么?

“公共服务”是什么?

公共服务是指政府及其相关机构为公众提供的有偿或无偿的服务,以满足公众的需求和追求。公共服务不仅包括政府的公共行政服务,还涉及监督政府服务,公共建设,社会保障,农业、林业、水利和环境卫生服务,公共教育,...

资产上链是什么意思?

资产上链是什么意思?

资产上链,即把传统资产的信息、权益和流通映射到区块链上。通俗来讲,就是用区块链技术去登记资产的信息、产权以及交易方式,从而把资产与区块链上的Token(通证)进行一个有效的连接。目前,可上链的资产包括...

近期比特币市场消息(比特币技术层面分析)

近期比特币市场消息(比特币技术层面分析)

近期比特币市场消息(比特币技术层面分析) 比特币周一(4月24号)最高点反弹回升至27999美元,上周回调10%升幅,和今年第一季表现差距甚大。但本周初币价出现复苏的迹象,分析师指出,回调至2500...