Vanna 的愿景与路线图
愿景声明
Vanna 旨在通过成为创建 AI 数据分析师的默认工具来重新定义数据分析领域。我们设想的 AI 在准确性、交互性和自主性方面接近人类数据分析师的能力。
我们的旅程始于通过使用大型语言模型 (LLM) 精通 SQL 生成,因为
-
SQL 具有高 token 密度,使其成为上下文受限的 LLM 的理想目标。
-
SQL 是最常见的数据临时接口。
-
许多价值被锁在 SQL 数据库中,组织中只有一部分用户可以访问。
实现愿景的路线图
我们的路线图围绕三个关键目标构建:准确性、交互性和自主性。这些目标旨在确保 Vanna 的 AI 数据分析师不仅满足而且超越用户的期望,为数据分析新时代铺平道路。
1. 准确性
目标: 在 SQL 生成和数据分析中实现无与伦比的准确性,媲美经验丰富的数据分析师的专业知识。
注意
-
我们不应关注基准测试,而应关注“经验准确性”。
-
通过存储历史上的正确问题-SQL 对并用它们来指导 LLM 的响应,这一点已基本实现。
-
数据库会随着时间推移而演变,因此我们需要能够“管理” AI 的知识库,就像管理人类的知识一样。
2. 交互性
目标: AI 应以熟悉且协作的方式与用户互动,类似于人类数据分析师与利益相关者互动的方式。
注意
-
如果 AI 没有所需信息,它应该能够主动提问。
-
如果问题含糊不清,AI 应该能够寻求澄清。
-
AI 应该能够为其答案提供解释。
-
AI 应该能够为其答案提供置信度评分。
-
AI 应该能够建议后续问题。
3. 自主性
目标: 赋予 AI 高度自主性,使其能够访问常用系统并根据其分析执行后续操作。
注意
-
简化入职流程,使 AI 能够立即访问必要的系统和数据源。
-
使 AI 能够根据其数据分析自主执行后续操作,例如生成报告、提醒利益相关者或触发工作流程。
开源
我们相信实现我们愿景的最佳方式是 Vanna 成为开源项目。这将允许社区贡献项目,并帮助我们更快地实现目标。
通过模块化设计,我们可以满足任何组织的安全要求,因为您可以将其插入到已被您的安全团队批准的组件中。
开发
我们所有的开发工作都应与愿景和路线图保持一致。
(动态文档,最后更新于 2024-02-27)