hadoop编程:暴力破解ZIP密码

时间: 2023-09-30 admin IT培训

hadoop编程:暴力破解ZIP密码

hadoop编程:暴力破解ZIP密码

 

“云计算技术与应用课程设计”总结报告

 

 

背景

       互联网发展到今天,许多数据与文件的传输仍然要用到压缩技术。其中最有名的无疑是ZIP压缩文件,是无损压缩的杰出代表。

       但是,我们今天在上网的时候仍然会遇到这样尴尬的情况:下载了一个ZIP压缩包,但是解压这个包却需要密码,通常这些密码会写在帖子里,但是如果你找不到这个压缩包的出处或者联系到这个压缩包的作者的话,是不能解压出里面的内容的。于是,有了暴力破解这类压缩包文件的软件。

       但是,又出现一个问题,ZIP压缩包的密码是不定长的,里面可以是任意字符,也就是说一个8位密码,那它的可能次数为(26+10)^8=282429536481次,如果用一台计算机进行暴力破解可能需要一周或者更多时间。

       为了处理这个情况,这个项目就应运而生了。

 

介绍

       GetZipKey是运行在Hadoop分布式集群上的软件,可以充分运用分布式集群的并行计算能力对ZIP压缩包进行暴力破解密码。

 

主要设计思想

1.        获取输入的参数,对参数进行保存。

2.        通过自定义输入文件格式类InputFormat,根据输入的参数,生成可能的密码。

3.        密码由Hadoop分配给各个机器,由各个机器尝试着解压给定的ZIP压缩包。

4.        由Hadoop对尝试结果进行汇总,保存在输出文件内。