
Vanna AI
的使用方法、功能与可解决的业务课题
添加书签
Vanna AI是什么?
从自然语言提问生成精确 SQL 的开源(MIT)RAG 框架(Text-to-SQL)。让其学习数据库的 DDL、文档与 SQL 示例,通过智能体式检索(Agentic Retrieval)生成高精度的 SQL。支持 PostgreSQL、Snowflake、BigQuery 等主流数据库,以及 OpenAI、Anthropic 等主流大模型。
可解决的业务课题
「Vanna AI」的服务详情
使用方法
-
安装
将 Vanna 作为 Python 包引入(通过 pip 安装)。可根据使用场景集成到 Jupyter、Flask(FastAPI)、Streamlit、Slack 等环境中。
-
选择 LLM 和向量存储
配置所使用的 LLM(如 OpenAI、Anthropic、Google Gemini、Ollama 本地模型等)以及用于保存学习内容的向量存储。
-
训练
输入数据库的 DDL(表定义)、业务知识文档、问题与 SQL 的配对样本等进行训练。这些训练数据将作为 RAG 的检索来源,从而提升生成 SQL 的准确性。
-
用自然语言提问
以自然语言提问(例如"上个月销量最高的 10 款产品是什么?"),Vanna 会通过 Agentic Retrieval 检索相关信息并生成对应的 SQL。
-
执行与可视化
将生成的 SQL 在数据库中执行,获取结果表格、图表和摘要。可通过内置的 Web 聊天组件或 UI 进行交互式使用。
功能
-
自然语言转 SQL(Text-to-SQL)
根据自然语言问题,生成适用于目标数据库的精准 SQL。借助 RAG(检索增强生成),可结合已训练的表结构和业务知识进行生成。
-
RAG 训练(DDL、文档、SQL 示例)
通过提供表定义(DDL)、业务文档、问题与 SQL 配对样本作为训练数据,可实现针对自有数据的优化生成。
-
多数据库支持
支持 PostgreSQL、MySQL、Snowflake、BigQuery、Redshift、SQLite、Oracle、SQL Server、DuckDB、ClickHouse 等主流数据库。
-
多 LLM 与向量存储支持
支持 OpenAI、Anthropic、Google Gemini、Azure、AWS Bedrock、Mistral、Ollama(本地)等多种 LLM,以及各类向量存储,可灵活替换组合。
-
多轮对话与可视化
支持多轮对话,并以表格、图表、摘要等形式返回结果。同时提供内置的 Web 聊天组件。
-
访问控制与审计(高级功能)
具备行级安全性(按用户限制查询范围)、审计日志、速率限制等面向生产环境的功能(云端/企业版)。
价格
以下价格信息截至 2026 年 6 月。Vanna 的核心框架采用 MIT 许可证开源,自托管完全免费(使用的 LLM API 费用另计)。云端/企业版价格可能变动,请以官网最新信息为准。
| 套餐 | 费用 | 主要内容 |
|---|---|---|
| OSS(自托管) | 免费 | MIT 许可证框架,通过 pip 安装并在自有环境中运行(LLM API 费用另计) |
| Cloud(托管版) | 请确认 | 托管版,额外提供访问控制、可观测性、审计日志等运营功能 |
| Enterprise | 联系询价 | 面向大型组织的定制化服务 |
※OSS 框架本身免费,但生成时使用的 LLM(如 OpenAI)API 费用需另行支付。此外,官方 GitHub 仓库已于 2026 年 3 月 29 日归档(设为只读)。使用前请在官网确认最新的提供状态。
优点与缺点
优点
- 可用自然语言查询内部数据,即便不熟悉 SQL 的人员也能轻松进行数据分析
- 采用 MIT 许可证的开源框架,自托管即可免费集成到自有环境
- 可自由组合主流数据库、主流 LLM 及各类向量存储
- 通过训练 DDL 和业务知识,可实现针对自有数据的优化生成
缺点
- 部署和运维需要具备 Python 及 RAG 的基础知识
- 生成 SQL 的准确性依赖于训练数据的质量,需以验证和防护机制为前提
- UI 和文档以英文为主
- 官方仓库已归档,后续更新方向需以官方说明为准
用户评价
- 工程师和数据负责人评价称"训练了 DDL 和业务知识后,能以较高精度生成符合自有数据的 SQL"。
- 有用户表示"可以开源自托管,还能自由组合喜欢的 LLM 和数据库,灵活性很好"。
- 另一方面,也有"以英文为主""必须验证生成的 SQL""训练数据的质量决定成败"等反馈。
常见问题(FAQ)
Q. Vanna AI 可以免费使用吗?
核心框架采用 MIT 许可证开源,自托管完全免费。但生成时使用的 LLM(如 OpenAI)API 费用需另行支付。此外还提供具备运营功能的云端/企业版。
Q. 支持哪些数据库?
支持 PostgreSQL、MySQL、Snowflake、BigQuery、Redshift、SQLite、Oracle、SQL Server、DuckDB、ClickHouse 等主流数据库。
Q. 不懂 SQL 也能使用吗?
用自然语言提问即可获得 SQL 和结果(表格、图表、摘要),即便不熟悉 SQL 的人员也能用于内部数据分析。但对于重要的分析,建议验证生成的 SQL。
Q. 支持中文吗?
UI 和文档以英文为主,未提供中文界面。
Vanna AI 与其他开发及数据支持工具的区别
| 维度 | Vanna AI | 通用代码生成 AI | 适用场景 |
|---|---|---|---|
| 核心定位 | 自然语言转 SQL(通过 RAG 提升精度) | 任意代码生成 | 查询内部数据首选 Vanna |
| 提供形式 | OSS(MIT)框架 + 云端版 | 因服务而异 | 需要集成自有数据库时使用 |
| 优化方向 | 训练 DDL、业务知识、SQL 示例 | 以通用训练为主 | 适合需要针对自有数据定制的场景 |
如需更详细的对比,请参阅相关服务的各页面。

