哈夫曼树

作者&投稿:兆葛 (若有异议请与网页底部的电邮联系)
~

转自: http://blog.csdn.net/hikvision_java_gyh/article/details/8952596
哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的带权路径长度记为WPL=(W1 L1+W2 L2+W3 L3+...+ Wn Ln),N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,...n)。可以证明哈夫曼树的WPL是最小的。【例】给定4个叶子结点a,b,c和d,分别带权7,5,2和4。构造如下图所示的三棵二叉树(还有许多棵),它们的带权路径长度分别为: (a)WPL=7 2+5 2+2 2+4 2=36 (b)WPL=7 3+5 3+2 1+4 2=46 (c)WPL=7 1+5 2+2 3+4 3=35其中(c)树的WPL最小,可以验证,它就是哈夫曼树。

构造哈夫曼树的算法如下: 1)对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F={T1,T2,T3,...,Ti,..., Tn},其中每棵二叉树Ti中只有一个权值为Wi的根结点,它的左右子树均为空。 2)在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树的根结点的权值为其左右子树的根结点的权值之和。 3)从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合F中。 4)重复2)和3),直到集合F中只有一棵二叉树为止。 例如,对于4个权值为1、3、5、7的节点构造一棵哈夫曼树,其构造过程如下图所示:

可以计算得到该哈夫曼树的路径长度WPL=(1+3) 3+2 5+1*7=26。
哈夫曼编码应用 大数据 量的图像信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。压缩的关键在于编码,如果在对数据进行编码时,对于常见的数据,编码器输出较短的码字;而对于少见的数据则用较长的码字表示,就能够实现压缩。【例】:假设一个文件中出现了8种符号S0,SQ,S2,S3,S4,S5,S6,S7,那么每种符号要编码,至少需要3bit。假设编码成 000,001, 010,011,100,101,110,111。那么符号序列S0S1S7S0S1S6S2S2S3S4S5S0S0S1编码后变成 000001111000001110010010011100101000000001,共用了42bit。我们发现S0,S1,S2这3个符号出现的频率比较大,其它符号出现的频率比较小,我们采用这样的编码方案:S0到S7的码辽分别01,11,101,0000,0001,0010,0011, 100,那么上述符号序列变成011110001110011101101000000010010010111,共用了39bit。尽管有些码字如 S3,S4,S5,S6变长了(由3位变成4位),但使用频繁的几个码字如S0,S1变短了,所以实现了压缩。对于上述的编码可能导致解码出现非单值性:比如说,如果S0的码字为01,S2的码字为011,那么当序列中出现011时,你不知道是S0的码字后面跟了个1,还是完整的一个S2的码字。因此,编码必须保证较短的编码决不能是较长编码的前缀。符合这种要求的编码称之为前缀编码。要构造符合这样的二进制编码体系,可以通过二叉树来实现。以下是哈夫曼树的 Java 实现:
[java] view plain copy

// 二叉树节点
public class Node implements Comparable { private int value; private Node leftChild; private Node rightChild; public Node(int value) { this.value = value; } public int getValue() { return value; } public void setValue(int value) { this.value = value; } public Node getLeftChild() { return leftChild; } public void setLeftChild(Node leftChild) { this.leftChild = leftChild; } public Node getRightChild() { return rightChild; } public void setRightChild(Node rightChild) { this.rightChild = rightChild; } public int compareTo(Object o) { Node that = (Node) o; double result = this.value - that.value; return result > 0 ? 1 : result == 0 ? 0 : -1; } }

private static Node build(List<Node> nodes) {
nodes = new ArrayList<Node>(nodes);
sortList(nodes);
while (nodes.size() > 1) {
createAndReplace(nodes);
}
return nodes.get(0);
}

/**

/**

private static void sortList(List<Node> nodes) {
Collections.sort(nodes);
}

`
/**




什么叫哈夫曼树?
因为哈夫曼树的定义是构造一棵最短的带权路径树,所以这种树为最优二叉树。最优二叉树的度只有0或者2。给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点...

哈夫曼树的定义是什么?
哈夫曼树是给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。例子:1、将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);2、...

什么是哈夫曼树?
哈夫曼树的定义是构造一棵最短的带权路径树,所以这种树为最优二叉树。最优二叉树的度只有0或者2。给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

数据结构——哈夫曼树(Huffman Tree)
构造哈夫曼树的步骤是:首先将每个权值看作单独的树,然后不断选择权值最小的两棵树进行合并,直到只剩下一棵树,即为哈夫曼树。例如,对于权值2、3、4、6,通过迭代合并生成最终的哈夫曼树。哈夫曼树的应用主要体现在哈夫曼编码中,这是一种压缩编码方式,根据字符出现的频率赋予不同的编码长度,从...

什么是哈夫曼树?
由五个带权值为9,2,3,5,14的叶子结点构成哈夫曼树,带权路径长度为67。给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

最简哈夫曼树简介
哈夫曼树,是由德国数学家冯·哈夫曼在其研究中提出的一种重要树形结构,也被称为最简哈夫曼树。它的独特之处在于,它的构建方式使得从树根到每个叶子节点的路径长度之和达到最小,这是通过精心设计每个节点的权值和路径长度来实现的。在编程中,哈夫曼树的应用尤为显著,特别是在需要高效编码和数据压缩...

什么是哈夫曼树,它有哪些特点?
哈夫曼树是一种非常有用的数据结构,它在编码理论和数据压缩领域有着广泛的应用。哈夫曼树的特点在于它能够以非常高效的方式编码数据,特别是对于那些权重较大的数据。首先,哈夫曼树是一种二叉树,这意味着每个节点最多只有两个子节点。这种结构使得它在计算机科学中非常实用,因为计算机可以方便地存储和...

哈夫曼树(Huffman Tree)的基本概念介绍
哈夫曼树(Huffman Tree)作为数据结构的精华,广泛应用于通信、压缩算法和信息存储。由David A. Huffman于1952年提出,它旨在通过构建最优的前缀编码,实现数据压缩与编码,有效减少所需比特数。哈夫曼树的核心特性包括最优性与前缀编码。最优性意味着树的带权路径长度最小,带权路径长度是每个叶子节点的...

哈夫曼树是什么意思?
哈夫曼树(Huffman Tree)是一种用于数据压缩的最优二叉树。它被称为最优二叉树是因为它可以实现最优的数据压缩效果。在数据压缩中,我们希望使用尽可能少的比特数来表示数据,以减少存储空间或传输带宽的使用。哈夫曼树通过将出现频率较高的字符或符号分配较短的编码,而将出现频率较低的字符或符号分配...

什么是哈夫曼树?
哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的路径长度是从树根到每一结点的路径长度之和,记为WPL=(W1*L1+W2*L2+W3*L3+...+Wn*...

伊春区13820831072: 哈夫曼树 - 搜狗百科
时程感冒: 夫曼树是带权路径长度最小的二叉树,用途是平均查找信息的代价最小. 普通二叉树的用途也普通,比较通用,就是信息存储和查找. 普通二叉树可能有的只有一个子节点,而哈夫曼树一定有两个.

伊春区13820831072: 到底什么是哈夫曼树啊,求例子 -
时程感冒: 哈夫曼树是给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近. 例子: 1、将w...

伊春区13820831072: 哈夫曼树是什么?求解 -
时程感冒: 哈夫曼编码是哈夫曼树的一个应用.哈夫曼编码应用广泛,如JPEG中就应用了哈夫曼编码.首先介绍什么是哈夫曼树.哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树.所谓树的带权路径长度,就是树中所有的叶结点的权值乘上...

伊春区13820831072: 用简单的语言概括什么是哈夫曼树哈夫曼树 -
时程感冒:[答案] 哈夫曼树也称最优二叉树.哈夫曼树是完全二叉树,只有度为0和度为2的结点.给定n个值,可以构造出多棵具有n个叶节点且权值分别为这n个给定值的二叉树,其中加权通路长最小的那棵就是哈夫曼树.也就是说权值大的更靠近根节点.

伊春区13820831072: 哈夫曼树的定义是:带权路径长度最小的二叉树.我先请问:为何它是带全路径长度最小的二叉树?最小是哈夫曼树的定义是:带权路径长度最小的二叉树.我... -
时程感冒:[答案] 只有带权路径长度最小的二叉树,才是哈夫曼树.当然是可以证明带权路径长度最小

伊春区13820831072: 哈夫曼树有什么作用 -
时程感冒:[答案] 简单说为了进行哈夫曼编码,这样就可以起到压缩作用.详细说:(百度百科:哈夫曼树)看了一下里面的应用,讲的很好,直接拷贝了,如果有很么不满意的可以继续问,能答就答,不能的话再问问其他人.在数据通信中,需要将传送...

伊春区13820831072: 哈夫曼树一定是完全二叉树么 -
时程感冒:[答案] 可以不是的.哈夫曼树只是按照最优编码后生成的.而完全二叉树则要求有右子树时必有左子树.你可以去查阅相关书籍的.

伊春区13820831072: 哈夫曼树的带权路径长度是什么? -
时程感冒:[答案] 1.树的路径长度树的路径长度是从树根到树中每一结点的路径长度之和.在结点数目相同的二叉树中,完全二叉树的路径长... wi和li分别表示叶结点ki的权值和根到结点ki之间的路径长度. 树的带权路径长度亦称为树的代价. 3.最优二叉树或哈夫曼树在...

伊春区13820831072: 哈夫曼树问题 -
时程感冒:[答案] 给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman tree).

你可能想看的相关专题

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网