工作原理

数据目录基础

OraAI的核心是AI原生数据目录，这是系统理解数据环境的智能知识库：

目录组成：

模型：主要来自dbt等数据建模工具，代表结构化表和视图数据
语义定义：通过YAML文件为原始模型添加业务上下文和语义含义，包括：
- 维度和度量
- 指标
- 过滤器
- 枚举值(字段有效值)
- 其他常见语义层组件
部署方式：使用CLI工具将数据目录部署到OraAI平台，通常在管理数据模型的代码库(如dbt项目目录)中运行

用户问题解答流程

1. 智能搜索：

执行语义搜索而非简单关键词匹配
模仿人类分析师直觉搜索相关表、列、指标和定义

2. 规划阶段：

分析与澄清：系统会结合已检索到的上下文，对用户的请求进行深入分析，并在必要时主动提出澄清性问题，确保理解用户真实意图。
计划制定：基于分析结果，系统会制定详细的分步执行计划（内部“待办清单”），例如：
- “利用维度Y和度量Z来构建新的业务指标”
- “新建仪表板并添加多个关键指标，如销售额、用户增长率、活跃用户数等”

执行循环

1. 迭代创建：

生成数据产物：
- 可视化(指标)：配置好的可视化或特定数据计算
- 仪表板和报告：展示生成的指标和洞察
安全语义查询生成：
- 智能解析SQL
- 利用语义层定义确保正确的表连接
- 注入预定义表达式(如自定义维度或度量)
- 包含安全防护措施和访问控制

2. 版本控制产物：

以文件形式创建指标和仪表板
可轻松集成到Git等版本控制系统

3. 审查与进展：

执行过程中包含中间审查步骤
检查待办清单，标记已完成任务

4. 完成：

持续创建和审查循环，直到完成所有计划任务