当前位置:首页
>档案讯息>市县局馆
徐州馆启动数据清洗工程
  • 信息时间:2024-07-30 15:55
  • 浏览次数:

数据清洗是对数据进行重新审查和校验的过程,目的在于查找修改数据中的错误,保障数据格式项目一致性。传统的清洗办法是人工通过实体与挂接信息逐一核对,该方法耗时且耗力。徐州市档案馆信息技术处在研发数据接收工具的基础上,重新开发了一系列数据清洗工具,通过利用计算机软件达到高效精准清洗数据的目的。

数据清洗一般分几个阶段进行,每个阶段设定具体目标,选用不同的清洗工具。目前已开发了档号查重合并、连续性检测等功能,处理无效值和缺失值等功能正在测试中,有望近期实现。

徐州馆将运用自主研发的档案数据清洗工具,对馆藏300万条目录数据进行全面清洗,持续提高馆藏档案数据质量,夯实档案“数据化”基础。

作者:徐州市档案馆信息技术处 由翠


Produced By 大汉网络 大汉版通发布系统