跳转到主要内容
Devin 可以使用完整的 Linux 桌面环境——而不是仅限于浏览器。它可以移动鼠标、点击界面元素、在键盘上输入、截取屏幕截图,并与任何运行在 Linux 桌面上的应用程序交互。这种能力称为 Computer Use(计算机使用),使 Devin 能够像人类一样测试和交互你的软件。

什么是 Computer Use?

Computer Use 为 Devin 提供对带有鼠标和键盘的图形化桌面环境的直接访问。它不仅仅是浏览器自动化——Devin 可以与屏幕上渲染的任何应用程序交互,包括:
  • Chrome 中的网页应用程序(点击按钮、填写表单、在页面之间导航)
  • 在 Linux 上运行的桌面应用程序(Electron 应用、原生图形界面、IDE)
  • 基于终端的界面(TUI 程序、交互式 CLI)
  • 能在桌面上显示的任何可视化界面
Devin 将屏幕视为一个 1024×768 像素的显示器,并且可以执行诸如点击、输入、滚动、拖动和截图等操作——就像一个坐在电脑前的人类用户一样。

如何启用

Computer Use 由你所在组织的自定义选项中的 Desktop mode(桌面模式) 设置进行控制。
  1. 前往 Settings > Customization
  2. 找到 Enable desktop mode 开关
  3. 将其开启
启用后,Devin 会在会话期间使用其桌面环境——尤其是在需要与应用程序 UI 交互的测试流程中。
Desktop mode 适用于所有套餐。只有组织管理员可以更改此设置。

Computer Use 的运行时机

启用桌面模式后,Computer Use 功能将在每个会话中可用。它有三种触发方式:

创建 PR 后

当 Devin 创建 PR 时,它会提供一个 Test the app 按钮。点击该按钮会触发完整的测试工作流:Devin 会启动你的应用,使用 Computer Use 与桌面交互,测试这些更改,并将录屏发送给你。
Test the app 按钮

在会话中按需使用

你可以在会话中的任何时候让 Devin 进行测试——不需要任何特殊语法,只需用自然语言提出请求即可。例如:
  • “测试你刚刚做的更改,并把录屏发给我”
  • “在浏览器中打开应用,验证登录页面是否正常工作”
  • “启动桌面应用,检查新的菜单项是否出现”

在适当情况下自主操作

Devin 会自行决定何时适合通过桌面交互来完成任务。如果任务涉及点击 UI 元素、在应用中导航、填写表单或对某些内容进行目视确认,Devin 会在无需你明确要求的情况下使用 Computer Use。你不需要告诉 Devin 如何 与屏幕交互——只需告诉它 要完成什么 即可。

Devin 在计算机操作方面能做什么

端到端测试 Web 应用

Devin 可以在本地启动你的应用,在 Chrome 中打开它,并完整地走一遍用户流程——登录、导航、表单提交、结账——以验证一切是否按预期工作正常。

测试桌面应用程序

任何在 Linux 上运行的应用程序都可以进行测试。Devin 可以启动应用、与其图形界面(GUI)交互并验证其行为。这包括 Electron 应用、Java Swing/AWT 应用、GTK/Qt 应用等。

可视化验证

Devin 可以在测试过程中的特定步骤截取屏幕截图,用于验证布局、样式和 UI 元素是否正确显示。它可以将屏幕上看到的内容与预期效果进行比对,并标记出视觉问题。

处理复杂的 UI 流程

有些测试场景需要多步 GUI 交互,而不仅是简单的 API 调用或浏览器自动化——比如拖拽、上下文菜单、键盘快捷键,或在多个窗口之间切换。Computer Use 可以处理所有这些。

记录测试会话

Devin 可以在测试时录制自己的屏幕,并在视频中标注关键时刻。录制内容随后会被处理并发送给你,这样你就可以观看 Devin 与你的应用交互的过程,并确认更改是否正常生效。有关录制工作流的完整说明,请参见 Testing & Video Recordings

Computer Use 功能的工作原理

当 Devin 在会话中使用 Computer Use 功能时,会遵循以下流程:
  1. 截取屏幕截图,以了解当前屏幕上可见的内容
  2. 识别可交互元素 —— 按钮、文本输入框、菜单、链接 —— 并决定要与哪些进行交互
  3. 执行操作 —— 点击、输入、滚动,或使用键盘快捷键
  4. 等待并观察 —— 再次截屏以查看该操作的结果
  5. 重复上述步骤,直到任务完成
这种“截图—操作”循环使 Devin 能够适应屏幕上的任何内容,像人类一样处理动态内容、加载状态、弹出窗口和意外弹出的对话框。

电脑操作与测试

电脑操作是 Devin 测试与录屏 工作流的基础。当 Devin 在创建拉取请求(PR)后测试你的应用时:
  1. 设置 — Devin 安装依赖、启动你的应用并准备环境
  2. 测试规划 — Devin 阅读代码 diff 并创建一份聚焦的测试计划
  3. 通过电脑操作执行 — Devin 使用其桌面环境与应用交互,按测试计划一步步执行
  4. 录制 — 整个过程会被录制成带批注的视频,然后发送给你进行审核
电脑操作与测试与录屏工作流之间的关键区别在于作用范围:电脑操作 是底层能力(桌面交互),而 测试与录屏 是在此之上构建的结构化工作流,它使用电脑操作来测试你的 PR,并提供视频佐证。

获得最佳效果的建议

明确要测试的内容

  • “打开应用,在右上角点击 Settings 按钮,切换深色模式,并确认所有文本仍然清晰可读”
  • “启动 Electron 应用,创建一个新文档,输入一些文本,并在关闭窗口时确认文档已成功保存”

告诉 Devin 成功的标准

  • “仪表盘应显示三个图表,且没有错误信息”
  • “提交表单后,页面顶部应出现绿色的成功提示横幅”

提前配置访问

如果你的应用需要身份验证,请提前设置好机密信息,这样 Devin 就可以在会话过程中无需再向你确认即可登录。完成代码仓库设置,以确保 Devin 能够安装依赖项并顺利启动你的应用。

创建测试 Skill

对于需要频繁测试的应用程序,你可以创建一个 Skill,用来准确告知 Devin 如何为你的应用进行配置和测试。这样可以在多次会话中节省时间,并确保测试过程的一致性。示例请参见 Testing & Video Recordings — Skill 建议

故障排除

Devin 找不到某个 UI 元素

如果 Devin 无法在屏幕上找到某个按钮或元素,请在给 Devin 的指示中尽量更具体——描述该元素的位置、文字标签或周围的界面内容。比如,“点击弹窗右下角蓝色的 Save 按钮”要比“点击 Save”更好。

应用无法在 Devin 的桌面上显示

Devin 运行在 Linux 环境中。如果你的应用程序只能在 macOS 或 Windows 上运行,就无法在桌面端进行测试。由于 Web 应用在 Chrome 中运行,因此不受平台限制。对于桌面应用,请确保提供 Linux 构建版本。

Devin 点击错了地方

如果 Devin 在你的 UI 上出现误操作,请在 SkillKnowledge 中添加一条包含你应用具体导航说明的条目。描述精确步骤(“点击左上角的汉堡菜单,然后在下拉菜单中点击 Settings”)可以减少歧义。