大数据

非结构化数据的生命周期管理

2018-05-03 11:12:57 | 来源:中培企业IT培训网

7.非结构化数据的生命周期管理

对于结构化数据,主要是针对表中的记录进行清理、归档或者销毁,即每条数据记录都有一定的生命周期。而非结构化数据则类似于影像、文档等,均是一个个独立对象,因此其生命周期相比于结构化数据存在较大的差异。一般来说,商业银行会根据数据的类别、特点、属性等相关信息来确定其生命周期。例如,商业银行将数据进行分类,不同类型的数据根据版本号、状态、访问时间来确定不同类型数据的生命周期管理策略。商业银行可以将数据分成资讯数据、规章制度、办公文档、培训视频、宣传影像、论坛数据等各种类型,然后根据不同类型的数据特性,例如规章制度的版本、论坛帖子的最后访问日期等进行生命周期的制定。

举个例子,表8-3为某商业银行非结构化数据的数据类型与保存期限。

1)对于规章制度等具有版本属性的非结构化数据,当前版本一直保留,上一版本超过保存期限后需要归档并清理。

2)对于具有状态属性的非结构化数据,无效或超过保存期限后需要归档并清理。

3)对于具有最后访问日期属性的非结构化数据,超过保存期限无访问的数据需要归档并清理。

4)无以上属性的非结构化数据,从数据生成之日起开始计算保留时间,超过保存期限后需要归档并清理。

当然,这里仅仅是举例说明,对于不同的商业银行,其做法可能稍有差异,具体的非结构化数据的数据生命周期管理策略还应综合考虑业务对非结构化数据的在线时间需求、应用服务器的存储压力、业务系统的活动情况等来综合制定。

标签: 生命周期管理