何时使用 Data Analyst Agent
- 查询数据库:针对已连接的数据源编写并执行 SQL 查询
- 分析数据:探索模式、计算指标并分析数据中的趋势
- 创建可视化:使用 seaborn 生成专业的图表和图形
- 回答数据相关问题:快速、准确地解答关于数据的问题
- 生成洞察:发现模式、异常以及可执行的关键发现
访问 Data Analyst Agent
在 Web 应用中
- 进入 Devin 首页
- 点击智能体选择下拉菜单
- 在下拉菜单中选择 Data Analyst
- 从与数据相关的问题或任务开始会话
在 Slack 中发起
!dana 宏:
前置条件
- 数据库 MCP:Redshift、PostgreSQL、Snowflake、BigQuery 以及其他 SQL 数据库
- 分析类 MCP:Datadog、Metabase 以及其他可观测性平台
Set up MCP integrations
了解如何通过 MCP 连接数据库和其他数据源
工作原理
Database Knowledge
示例提问
简单查询
- “我们上周有多少活跃用户?”
- “过去一个月我们的每日收入趋势如何?”
- “哪些客户的使用量最高?“
聚合与指标
- “过去 30 天内,不同套餐层级的平均会话时长是多少?”
- “按地区和产品线展示第四季度(Q4)的总收入”
- “计算本周每个 API 端点的第 95 百分位响应时间”
关联与跨表分析
- “将我们的 users 表与 orders 表做关联查询,并展示按生命周期价值排序的前 20 位客户”
- “关联注册来源与 30 天留存率——哪些获客渠道的留存率最高?”
- “将会话数据与计费记录结合起来,查找使用量高但支出低的账户”
筛选与细分
- “仅显示在 2025 年 1 月之后注册且会话次数超过 100 次的 Enterprise 客户”
- “将错误日志筛选为仅包含过去 48 小时内来自 payments 服务的 5xx 错误”
- “按 Enterprise 客户与自助服务客户拆分使用量,并排除试用账户”
时间序列分析
- “绘制过去 6 个月的每周活跃用户数,并标出任何变化超过 10% 的周”
- “展示 2025 年与 2024 年注册率的月度对比”
- “过去 90 天的 API 调用日度趋势如何?叠加一条 7 天移动平均线”
调查与异常检测
- “为什么上周二注册量下降了?检查是否有相关的事故或部署变更”
- “本周我们的错误率中是否存在异常情况?”
- “将本月的指标与去年同期进行对比,并标记显著偏差”
多步分析
- “按分群分析第四季度的用户留存情况,然后找出流失最严重的分群,并给出可能原因”
- “找出按会话数排名前 10 的用户,展示他们的活动随时间的变化情况,并标记出看起来可能要流失的用户”
支持的数据源
SQL 数据库
| 数据源 | MCP 名称 | 配置方式 |
|---|---|---|
| Amazon Redshift | Redshift | 连接字符串 + 凭证 |
| PostgreSQL | PostgreSQL | 连接字符串 |
| Snowflake | Snowflake | 帐户 + 凭证 |
| Google BigQuery | BigQuery | OAuth 或服务帐户 |
| MySQL | MySQL | 连接字符串 |
| SQL Server | SQL Server | 连接字符串 |
| Neon | Neon | OAuth |
| Supabase | Supabase | 个人访问令牌 |
| Cloud SQL (PostgreSQL, MySQL, SQL Server) | Cloud SQL | OAuth |
分析与可观测性平台
| 数据源 | MCP 名称 | 配置方式 |
|---|---|---|
| Datadog | Datadog | API key + 应用密钥 |
| Metabase | Metabase | OAuth |
| Grafana | Grafana | URL + 服务账号令牌 |
| Sentry | Sentry | OAuth |
连接数据源
- 进入 Settings > MCP Marketplace
- 找到你的数据源并点击 Enable
- 提供所有必需的凭据(连接字符串、API key 或 OAuth)
- 启动一次 Data Analyst 会话——智能体会自动发现你已连接的数据源
Set up MCP integrations
每个数据源的完整设置说明
你可以同时连接多个数据源。Data Analyst Agent 会根据你的查询上下文使用合适的 MCP 工具。
最佳实践
明确你的指标
指定时间范围
请求特定的输出格式
事先定义业务逻辑
请求对比和上下文信息
对结果进行迭代
- 先从整体入手:“从营收来看,本季度排名前 10 的客户是谁?”
- 进一步细化:“针对这前 3 名客户,展示他们过去一年的月度营收趋势”
- 进一步分析:“客户 X 在 3 月的营收出现激增——是什么原因导致的?“
验证 SQL
输出格式
表格
图表和可视化
- 折线图 — 时间序列趋势、随时间的对比
- 柱状图 — 分类对比、排名
- 热力图 — 相关性矩阵、活动模式
- 散点图 — 两个指标之间关系分析
总结与洞察
- 分析概述 — 用通俗语言回答你的问题
- SQL 查询 — 使用的精确查询,方便你验证其逻辑
- 关键指标 — 突出显示的最重要指标
- 数据洞察 — 发现的模式、异常或其他值得注意的结果
- Metabase 链接 — 如果你的组织通过 MCP 连接了 Metabase,agent 可能会附上一个交互式仪表盘链接,供你进一步探索
Knowledge 管理
- 新的 schema 信息或表之间的关系
- 业务逻辑或指标定义
- 数据质量模式或相关注意事项
进一步了解 Knowledge
了解 Devin 的 Knowledge 系统的工作原理
与标准版 Devin 的差异
| 功能 | Data Analyst Agent | 标准版 Devin |
|---|---|---|
| SQL 查询执行 | 已优化 | 支持 |
| 数据可视化 | 内置 seaborn 支持 | 需手动配置 |
| 数据库模式感知 | 预加载 Knowledge | 按需探索 |
| 响应风格 | 简洁、侧重指标 | 解释更为详细 |
| 代码变更 | 非主要关注点 | 完整支持 |
| MCP 集成 | 必需 | 可选 |
