Appearance
工作原理
数据目录基础
OraAI的核心是AI原生数据目录,这是系统理解数据环境的智能知识库:
目录组成:
- 模型:主要来自dbt等数据建模工具,代表结构化表和视图数据
- 语义定义:通过YAML文件为原始模型添加业务上下文和语义含义,包括:
- 维度和度量
- 指标
- 过滤器
- 枚举值(字段有效值)
- 其他常见语义层组件
- 部署方式:使用CLI工具将数据目录部署到OraAI平台,通常在管理数据模型的代码库(如dbt项目目录)中运行
用户问题解答流程
1. 智能搜索:
- 执行语义搜索而非简单关键词匹配
- 模仿人类分析师直觉搜索相关表、列、指标和定义
2. 规划阶段:
- 分析与澄清:系统会结合已检索到的上下文,对用户的请求进行深入分析,并在必要时主动提出澄清性问题,确保理解用户真实意图。
- 计划制定:基于分析结果,系统会制定详细的分步执行计划(内部“待办清单”),例如:
- “利用维度Y和度量Z来构建新的业务指标”
- “新建仪表板并添加多个关键指标,如销售额、用户增长率、活跃用户数等”
执行循环
1. 迭代创建:
- 生成数据产物:
- 可视化(指标):配置好的可视化或特定数据计算
- 仪表板和报告:展示生成的指标和洞察
- 安全语义查询生成:
- 智能解析SQL
- 利用语义层定义确保正确的表连接
- 注入预定义表达式(如自定义维度或度量)
- 包含安全防护措施和访问控制
2. 版本控制产物:
- 以文件形式创建指标和仪表板
- 可轻松集成到Git等版本控制系统
3. 审查与进展:
- 执行过程中包含中间审查步骤
- 检查待办清单,标记已完成任务
4. 完成:
- 持续创建和审查循环,直到完成所有计划任务