申请加入项目     链接源码 STU:一个记录数据优化存储与恢复系统(该项目已被浏览1292次!)

在数据格式上,传统的记录型数据仍然是主要的信息数据组织格式,如关系 型数据库数据,半结构化的 JSON 数据格式和 XML 格式。但大数据背景下,这 些传统格式在数据存储时,存在着存储开销大的问题。这对这一问题,提出了一 种记录型数据去重、压缩和恢复系统。通过归并与哈希的方法,实现记录数据的 去重与字典压缩,通过优化的无符号整数编码方法来提高无符号整数序列的存储 效率。 

2016/01/08 15:12:16 V1.0介绍
1、精简数据格式,本系统实现了json格式的转换,json由key-value键值对组成,但对于数据模式比较规则的数据,其key可以不用存储,本系统就可以消除这些说明性的数据,节省空间。同时,这个格式转换是开放出来的,用户可以继承转换类自己定义格式的转换,但要符合系统要求。
2、消除数据重复,比如在多条记录数据中,每一条的同一个字段可能存在重复情况,通过系统的归并方式来去重,节约存储空间。
3、数据编码,使用一种优化的数据编码方式,对数值数据序列进行编码,节约存储空间。
4、数据按块存储,这样可以实现序列化数据存储,方便操作。
文档下载

开源社区_项目简介.pdf(该资源已被下载452次)

开源社区_安装部署.pdf(该资源已被下载424次)

开源社区_用户指南.pdf(该资源已被下载421次)

程序员手册(API设计).pdf(该资源已被下载412次)

安装包下载

stuProject.zip(该资源已被下载423次)