Skip to content

目录管理

目录管理是OraAI平台的数据治理核心,提供统一的数据资产目录、元数据管理和数据发现功能,帮助组织更好地管理和利用数据资产。

📁 功能概述

数据目录

  • 统一视图:提供所有数据资产的统一目录视图
  • 分层结构:支持多层级的目录组织结构
  • 智能分类:基于业务领域的智能数据分类
  • 搜索发现:强大的数据搜索和发现功能

元数据管理

  • 自动采集:自动采集数据源的元数据信息
  • 人工补充:支持人工补充和完善元数据
  • 版本控制:元数据的版本管理和变更追踪
  • 质量检查:元数据质量检查和验证

🗂️ 目录结构

业务域分类

  • 销售域:销售相关的数据资产
  • 财务域:财务会计相关数据
  • 营销域:市场营销相关数据
  • 运营域:业务运营相关数据
  • 人力资源域:人力资源管理数据
  • 客户域:客户关系管理数据

技术分类

  • 关系型数据:结构化关系型数据库数据
  • 文档数据:非结构化文档和文件数据
  • 流数据:实时流式处理数据
  • 大数据:大数据平台和数据湖数据
  • API数据:通过API接口获取的数据
  • 外部数据:第三方数据源数据

敏感性分类

  • 公开数据:可以公开访问的数据
  • 内部数据:仅限内部使用的数据
  • 敏感数据:包含敏感信息的数据
  • 机密数据:高度机密的核心数据

📊 元数据管理

基础元数据

  • 数据集信息:名称、描述、所有者、创建时间
  • 字段信息:字段名、数据类型、长度、约束
  • 关系信息:表间关系、外键关系、依赖关系
  • 统计信息:数据量、更新频率、使用频率

业务元数据

  • 业务含义:字段和表的业务含义说明
  • 业务规则:数据的业务规则和约束
  • 数据质量:数据质量规则和检查结果
  • 使用场景:数据的典型使用场景和案例

技术元数据

  • 存储信息:物理存储位置和格式
  • 访问信息:访问方式和连接参数
  • 性能信息:查询性能和优化建议
  • 依赖关系:数据依赖和血缘关系

🔍 数据发现

搜索功能

  • 全文搜索:在元数据中进行全文搜索
  • 字段搜索:按字段名称和属性搜索
  • 标签搜索:基于数据标签的搜索
  • 相似性搜索:查找相似的数据资产

推荐功能

  • 智能推荐:基于使用历史的智能推荐
  • 相关数据:推荐相关的数据集
  • 热门数据:推荐热门和常用数据
  • 新增数据:推荐最新添加的数据

浏览功能

  • 分类浏览:按业务域和技术分类浏览
  • 层级浏览:按目录层级结构浏览
  • 标签浏览:按数据标签分组浏览
  • 时间浏览:按时间维度浏览数据

🏷️ 标签体系

业务标签

  • 业务领域:销售、财务、营销、运营等
  • 数据主题:客户、产品、订单、库存等
  • 业务价值:核心、重要、一般、辅助等
  • 使用频率:高频、中频、低频、冷数据等

技术标签

  • 数据源类型:MySQL、PostgreSQL、文件等
  • 数据格式:CSV、JSON、Parquet等
  • 更新方式:实时、批量、手动等
  • 数据大小:小型、中型、大型、海量等

质量标签

  • 完整性:完整、基本完整、不完整
  • 准确性:高准确、中准确、低准确
  • 一致性:一致、基本一致、不一致
  • 时效性:实时、准实时、延时、过期

📈 数据血缘

血缘追踪

  • 向上追踪:追踪数据的原始来源
  • 向下追踪:追踪数据的使用去向
  • 变更影响:分析数据变更的影响范围
  • 依赖分析:分析数据间的依赖关系

可视化展示

  • 血缘图谱:可视化的数据血缘关系图
  • 影响分析:变更影响范围的可视化
  • 流向分析:数据流向的可视化展示
  • 依赖链路:完整的数据依赖链路图

🔧 管理功能

目录维护

  • 目录创建:创建新的数据目录分类
  • 目录编辑:修改目录结构和属性
  • 目录移动:调整数据资产的目录归属
  • 目录删除:删除不需要的目录分类

权限管理

  • 查看权限:控制目录的查看权限
  • 编辑权限:控制目录的编辑权限
  • 管理权限:控制目录的管理权限
  • 继承权限:权限在目录层级间的继承

审计功能

  • 操作日志:记录所有目录操作行为
  • 访问日志:记录数据访问和使用情况
  • 变更日志:记录元数据的变更历史
  • 使用统计:统计目录和数据的使用情况

💡 最佳实践

目录组织

  1. 清晰分类:建立清晰的业务域分类体系
  2. 一致命名:使用一致的命名规范
  3. 合理层级:避免过深的目录层级结构
  4. 定期整理:定期整理和优化目录结构

元数据维护

  1. 及时更新:及时更新数据变更的元数据
  2. 完整描述:提供完整准确的业务描述
  3. 标准化:使用标准化的数据描述规范
  4. 协作维护:建立团队协作的维护机制

数据治理

  1. 统一标准:建立统一的数据标准和规范
  2. 质量监控:持续监控数据质量状况
  3. 合规管理:确保数据使用的合规性
  4. 培训推广:开展数据治理的培训和推广

提示:目录管理是数据治理的基础,建议先建立完善的目录分类体系,然后逐步完善元数据信息。如需协助建立数据治理体系,请联系数据管理团队。