为什么压缩文件可以将原来一个G的东西压缩成六七百兆的啊?

作者&投稿:绪柳 (若有异议请与网页底部的电邮联系)
压缩问题,如何将几G的文件压缩成几百M的?~

可以考虑分卷压缩,这样可以将一个大文件压缩成数个小文件,方便在网络上传输。

文件的压缩比与文档的格式和内容有关系,没有任何一款软件能确保10倍以上的无损压缩。
以常见的通用文档压缩软件为例,压缩的原理如下:
把文件的二进制代码压缩,就是把相邻的0,1代码减少,比如有000000,可以把它变成6个0 的写法60,来减少该文件的空间.
但是如果是1001011011这样的代码,按上面的规则写的话变成了1(20)1(10)11(10)11,这样代码不当没有变短,反而变长了。
主要是看文档的重复内容是否足够多,重复内容越多,则压缩比越大。

兄弟你的想法很好。但是如果有的话比尔盖茨说不定会上门请你出山。现实世界来说:你把100平方米压缩成10平方米,强。
正常压缩如果单个嫌大,只能分成好几个。

目前压缩技术可分为通用无损数据压缩与有损压缩两大类,但不管是采用何种技术模型,其本质内容都是一样的,即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低,从而达到数据压缩的目的。

比如:“中国”是“中华人民共和国”的简称,但前者的字数是2,后者则是7,但我们都不会对它们俩所要表达的意思产生误解,这是因为前者保留了信息中最“关键点”。同时,作为有思维能力的人类,我们可以根据前后词汇关系和知识积累,就可推断出其原来的全部信息。压缩技术也一样,在不影响文件的基本使用的前提下,只保留原数据中一些“关键点”,去掉了数据中的重复的、冗余的信息,从而达到压缩的目的。这就是文件压缩技术所要遵循的最基本原理。

举一个详细的例子:

1、压缩的原理

有两种形式的重复存在于计算机数据中,zip 就是对这两种重复进行了压缩。
一种是短语形式的重复,即三个字节以上的重复,对于这种重复,zip用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩,这很容易理解。
一个字节有 0 - 255 共 256 种可能的取值,三个字节有 256 * 256 * 256 共一千六百多万种可能的情况,更长的短语取值的可能情况以指数方式增长,出现重复的概率似乎极低,实则不然,各种类型的数据都有出现重复的倾向,一篇论文中,为数不多的术语倾向于重复出现;一篇小说,人名和地名会重复出现;一张上下渐变的背景图片,水平方向上的像素会重复出现;程序的源文件中,语法关键字会重复出现(我们写程序时,多少次前后copy、paste?),以几十 K 为单位的非压缩格式的数据中,倾向于大量出现短语式的重复。经过上面提到的方式进行压缩后,短语式重复的倾向被完全破坏,所以在压缩的结果上进行第二次短语式压缩一般是没有效果的。
第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。其中,某些字节出现次数可能较多,另一些则较少,在统计上有分布不均匀的倾向,这是容易理解的,比如一个 ASCII 文本文件中,某些符号可能很少用到,而字母和数字则使用较多,各字母的使用频率也是不一样的,据说字母 e 的使用概率最高;许多图片呈现深色调或浅色调,深色(或浅色)的像素使用较多(这里顺便提一下:png图片格式是一种无损压缩,其核心算法就是zip算法,它和zip格式的文件的主要区别在于:作为一种图片格式,它在文件头处存放了图片的大小、使用的颜色数等信息);上面提到的短语式压缩的结果也有这种倾向:重复倾向于出现在离当前压缩位置较近的地方,重复长度倾向于比较短(20字节以内)。这样,就有了压缩的可能:给 256 种字节取值重新编码,使出现较多的字节使用较短的编码,出现较少的字节使用较长的编码,这样一来,变短的字节相对于变长的字节更多,文件的总长度就会减少,并且,字节使用比例越不均匀,压缩比例就越大。
在进一步讨论编码的要求以及办法前,先提一下:编码式压缩必须在短语式压缩之后进行,因为编码式压缩后,原先八位二进制值的字节就被破坏了,这样文件中短语式重复的倾向也会被破坏(除非先进行解码)。另外,短语式压缩后的结果:那些剩下的未被匹配的单、双字节和得到匹配的距离、长度值仍然具有取值分布不均匀性,因此,两种压缩方式的顺序不能变。
在编码式压缩后,以连续的八位作为一个字节,原先未压缩文件中所具有的字节取值不均匀的倾向被彻底破坏,成为随机性取值,根据统计学知识,随机性取值具有均匀性的倾向(比如抛硬币试验,抛一千次,正反面朝上的次数都接近于 500 次)。因此,编码式压缩后的结果无法再进行编码式压缩。
短语式压缩和编码式压缩是目前计算机科学界研究出的仅有的两种无损压缩方法,它们都无法重复进行,所以,压缩文件无法再次压缩(实际上,能反复进行的压缩算法是不可想象的,因为最终会压缩到 0 字节)。

将文件从一种格式转换成另一种格式,当解压缩时又将文件格式转换回来,而压缩工具就起到了压缩与解压缩的的作用.
至于文件的格式转换,举个例子,由于图象文件所占的空间较大,于是我用压缩工具将它压缩成文字格式,而文字格式的文件通常比图象格式来得大,它们之间存在着互相转换的关系,由此压缩工具的产生,不过当文件为另一种格式时,文件不易被读取,所以压缩工具又具有解压缩的功能.

就像是棉花被打包一样的道理。。。

默虹 - 探花 十级


什么是压缩文件啊?
压缩文件就是可以将多个文件压缩打包成一个文件,或者将一个文件经过压缩后其体积容量变小的软件。首先我们要下载一个解压软件,因为如果你下载了一个文件是以压缩文件的形式保存的,那么没有解压软件就没办法打开这类文件。下载之后可以找到你所下载的这个文件,我们可以发现它现在已经成了多个书捆在一起...

用什么工具可以将文件压缩到最小?
还有一种新兴的7z格式,是最近才出现的。可以用好压软件对文件进专行压缩。具体方法是:1.先在电脑界面上找一个需要压缩的文件,如下图。2.右击文件并选择“添加到zip”选项。3.在出现的界面中,点击“立即压缩”按钮,如下图所示。4.此时,将生成一个压缩文件,如下图。

怎样将多个文件压缩到一个压缩包里?
2、进入后,【压缩包】底部,点击【文件压缩】,如箭头所示。3、进入下一个页面,显示自己手机存储的文件,选择需要合并文件,如【文档】。4【文档】中,勾选合并的文件,在点击右侧【压缩】如箭头所示。5、【压缩】成功后,可以进行命名名称,之后选择【保存】。6、保存成功后,3个文件就合并压缩在一...

rar如何压缩
将文件压缩成RAR格式,可以大大减小文件的大小,从而节省磁盘空间和带宽资源,具体分为以下三个步骤:1、在电脑上右击需要压缩的文件,在菜单中点击“添加到压缩文件”选项。2、再在压缩文件名和参数窗口中,勾选需要的RAR格式,还可以按需设置下压缩文件名、压缩方式等相关参数。3、完成以上操作后,文件就...

什么文件都可以做成压缩包吗?
也就是压缩包文件;如果是多个文件,您可以先建一个新的文件夹,将文件都放进去再一同压缩即可;3、除了压缩,还可以给文件压缩包设置密码,第一个直接设置即可,第二需要重新添加文件再如第一个一样设置密码就好;4、解压文件压缩包,右键点击,选择解压到制定文件夹或者解压到当前文件夹即可 ...

RAR分卷压缩文件可以合并成一个吗?推荐2个方法!
方法一:解压后重新压缩 确保所有分卷文件在一个文件夹内,且文件名保持原始格式“文件名.编号.rar”。 按照常规解压方式打开第一个分卷,后续所有分卷会随之解压。 将解压后的文件内容重新压缩成一个压缩包即可。 方法二:使用WinRAR软件 启动WinRAR,选择“工具”>“转换压缩文件格式”。 选...

如何给压缩文件解压
选择“解压到”可自行定义将压缩文件解压到什么地方,如下图;“解压到当前文件夹”则会直接将软件解压到当前压缩软件所在的位置;“解压到**”则会根据压缩软件的文件名进行同名文件夹的创建,并将软件解压至这个文件夹中。2、rar格式的解压。同上。3、7z格式的解压。同上。方式二:双击打开进行解压。1...

mac上怎么打开rar压缩文件
RAR格式的文件是一种常见的压缩文件格式,它可以将多个文件压缩成一个文件,方便传输和存储。在Windows系统中,我们可以通过WinRAR等软件来打开RAR格式的文件,但是在Mac系统中,我们该如何打开RAR格式的文件呢?本文将为大家介绍在Mac上打开RAR格式文件的方法。方法一:使用The Unarchiver The Unarchiver是一款...

如何将文件夹压缩为ZIP格式
1. 首先第一步鼠标右键单击需要压缩的文件夹,在弹出的菜单栏中根据下图箭头所指,点击【添加到压缩文件】选项。2. 第二步打开【压缩文件名和参数】窗口后,根据下图箭头所指,将【压缩文件格式】设置为【ZIP】。3. 第三步根据下图所示,按照需求选择压缩方式。4. 第四步根据下图箭头所指,还可以点击...

请问用什么软件可以将视频文件压缩变小
2. .操作简单快速:可一次性上传多张需要压缩的图片文件,批量进行图片压缩处理,支持根据压缩前与压缩后的文件大小对比确认压缩结果是否符合预期效果,节约图片压缩的时间成本。3. 保障文件安全:图片压缩在线版对压缩过程进行了多重加密处理,并且在压缩完图片文件的30分钟后,便会将所有文件从服务...

大冶市15072174651: 为什么别人用RAR压缩能将一个G左右的文件压缩到800M,为什么我不能啊
毅秆乳泉: 压缩程度多少,要看你压缩的是什么格式的东西. 如果压缩1G的东西全都是文本资料的话,我想最终压出来也就100-200M,远比800M小的多. 如果压缩1G的东西全都是视频文件的话,比如.rmvb格式影片的话,那基本上和没压缩差不了几M. 这是压缩算法的问题,和操作方法没有很大关系. 所以说,不要和别人比,因为你们压的东西不一样. 另外,告诉你一点,在压缩东西时选高版本的压缩软件,通常会比低版本的压出来小一些. 至于把压缩参数中的压缩方式改为最好,从我的经验看,这通常不会比默认设置压出来小多少,反而在压缩时间上拖的特别长.

大冶市15072174651: 为什么压缩文件后的文件大小和原文件一样?? -
毅秆乳泉: 并不是所有的文件压缩后都比原来小,有些文件本身就是压缩数据无法再压缩的,仅仅是打包而已

大冶市15072174651: 为什么1个多G的excel文件压缩以后就剩下十多M了,想知道压缩excel的机制,为什么可以压缩得这么小 -
毅秆乳泉: 能否大幅度压缩在于原数据中是否重复数据多,打个比方,一个1到10000的数字序列,和10000个1的数字序列,压缩结果会有巨大的差别.这只是一个简单的比方.压缩机制本身不是太针对什么类型的文件,只是针对什么类型的数据.目前除在exe文件的压缩上7-zip有绝对优势外,其他类型的文件压缩,几个压缩软件的实力是相当的.

大冶市15072174651: 为什么用winRAR压缩后的文件和原文件一样大啊? -
毅秆乳泉: 因为这种文件已经是压缩过的文件,例如:JPEG图片,MPEG电影,这些文件本来已经就是经过高级算法压缩过的,有的文件压缩过后还有可能变大,这很正常的,一般纯文本格式例如TXT.DOC等,压缩率就会很大,只有原文件的十几分之一,同样没有经过压缩的BMP图片,压缩过后也会很小!!

大冶市15072174651: 为什么压缩文件可以把三十多个G的文件压缩到十几个G -
毅秆乳泉: 压缩文件的基本原理是查找文件内的重复字节,并建立一个相同字节的"词典"文件,并用一个代码表示,比如在文件里有几处有一个相同的词"中华人民共和国"用一个代码表示并写入"词典"文件,这样就可以达到缩小文件的目的. 由于计...

大冶市15072174651: 为什么我压缩的文件与原来的一样大 -
毅秆乳泉: 看你压缩是什么文件类型,一般音乐,视频,exe,图片这类文件都压缩不了多少了,因为本身就已经很固实了,文本类的文件压缩率才大.

大冶市15072174651: 为什么我压缩完的照片压缩包大小和原来文件夹一样大 -
毅秆乳泉: JPEG 本身就是压缩格式,而且还是有损压缩,别指望有压缩率.不仅限于图片,如 MP3、MKV 等音频视频格式相对于 WAV、MPEG 来说已经是高压缩了,再次压缩自然无效.如果你压缩的是一大堆 BMP 图片,或许可以得到很高的压缩率.

大冶市15072174651: 我将文件压缩后,把压缩文件删掉留下原文件,为啥原文件从4G多变成了8G多呢 -
毅秆乳泉: 楼主是把压缩文件解压缩了吧,然后删掉了压缩文件,对吧 解压出来的文件比压缩文件大是很正常的事情,所谓压缩就是把大的压缩小了,反过来讲,原来8G多的文件压缩到了4G多,等你再次把压缩问价解压缩的时候,不就是从4G多变回到8G了么?

大冶市15072174651: 怎么压缩文件啊.为什么我压缩后的大小和原来的一样大呢?
毅秆乳泉: 第一,要看你压缩的是什么.如果压缩的文件为".jpg"".rm"".rmvb"".mp3""3gp""rar""zip""等等也有一部分".exe"文件,这些文件本身就是压缩后的文件.你再用压缩软件去压缩这些文件,当然是没有效果的.大小跟压缩之前一样.甚至压缩后比之前还大. 第二,要看你使用压缩软件的设置方法,一般压缩软件都是可以设置压缩比率的.当然一般你把原文件压的越小.压的时间就越长.相反,你要想提高压缩速度.同时压缩后的文件也会略大.也有可能比之前的文件还大.

大冶市15072174651: 为什么文件压缩后,比原来没有压缩还要大? -
毅秆乳泉: 因为有些文件本身不能再压缩了,比如一般的视频文件,音频文件,弄成一个压缩包,会添加进去打包信息,所以有可能比原来的总大小稍大一点点

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网