基于Hadoop的小文件存储的研究

在线阅读 下载PDF 导出详情
摘要 摘要:随着信息化的发展,各行业需要处理的数据呈爆炸式增长。Hadoop分布式存储框架对较大文件提供了可靠高效的存储服务,但在处理海量小文件时效率显著降低。因此,本文提出了基于Hadoop的小文件存储优化的研究,通过Apriori算法挖掘出各小文件之间的关联性,将具有关联性的小文件进行合并装箱降低NameNode内存开销来提高文件的存储效率。实验结果表明,该方法提高了Hadoop文件系统存储小文件的存储效率。
出处 《科学与技术》 2022年16期
出版日期 2023年01月07日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献