Skip to content

工作原理

数据目录基础

OraAI的核心是AI原生数据目录,这是系统理解数据环境的智能知识库:

目录组成:

  • 模型:主要来自dbt等数据建模工具,代表结构化表和视图数据
  • 语义定义:通过YAML文件为原始模型添加业务上下文和语义含义,包括:
    • 维度和度量
    • 指标
    • 过滤器
    • 枚举值(字段有效值)
    • 其他常见语义层组件
  • 部署方式:使用CLI工具将数据目录部署到OraAI平台,通常在管理数据模型的代码库(如dbt项目目录)中运行

用户问题解答流程

1. 智能搜索:

  • 执行语义搜索而非简单关键词匹配
  • 模仿人类分析师直觉搜索相关表、列、指标和定义

2. 规划阶段:

  • 分析与澄清:系统会结合已检索到的上下文,对用户的请求进行深入分析,并在必要时主动提出澄清性问题,确保理解用户真实意图。
  • 计划制定:基于分析结果,系统会制定详细的分步执行计划(内部“待办清单”),例如:
    • “利用维度Y和度量Z来构建新的业务指标”
    • “新建仪表板并添加多个关键指标,如销售额、用户增长率、活跃用户数等”

执行循环

1. 迭代创建:

  • 生成数据产物
    • 可视化(指标):配置好的可视化或特定数据计算
    • 仪表板和报告:展示生成的指标和洞察
  • 安全语义查询生成
    • 智能解析SQL
    • 利用语义层定义确保正确的表连接
    • 注入预定义表达式(如自定义维度或度量)
    • 包含安全防护措施和访问控制

2. 版本控制产物:

  • 以文件形式创建指标和仪表板
  • 可轻松集成到Git等版本控制系统

3. 审查与进展:

  • 执行过程中包含中间审查步骤
  • 检查待办清单,标记已完成任务

4. 完成:

  • 持续创建和审查循环,直到完成所有计划任务