跳转到主要内容
Devin 可以使用完整的 Linux 桌面环境——而不是仅限于浏览器。它可以移动鼠标、点击界面元素、在键盘上输入、截取屏幕截图,并与任何运行在 Linux 桌面上的应用程序交互。这种能力称为 Computer Use (计算机使用) ,使 Devin 能够像人类一样测试和交互你的软件。

什么是 Computer Use?

Computer Use 为 Devin 提供对带有鼠标和键盘的图形化桌面环境的直接访问。它不仅仅是浏览器自动化——Devin 可以与屏幕上渲染的任何应用程序交互,包括:
  • Chrome 中的网页应用程序 (点击按钮、填写表单、在页面之间导航)
  • 在 Linux 上运行的桌面应用程序 (Electron 应用、原生图形界面、IDE)
  • 基于终端的界面 (TUI 程序、交互式 CLI)
  • 能在桌面上显示的任何可视化界面
Devin 将屏幕视为一个 1024×768 像素的显示器,并且可以执行诸如点击、输入、滚动、拖动和截图等操作——就像一个坐在电脑前的人类用户一样。

如何启用

Computer Use 由你所在组织的自定义选项中的 Enable desktop mode 开关进行控制。
  1. 前往 Settings > Customization
  2. Browser interaction 部分下,将 Enable desktop mode 切换为开启
  3. Devin 现在将在会话期间使用其桌面环境
Desktop mode 适用于所有套餐。只有组织管理员可以更改此设置。

Computer Use 的运行时机

启用桌面模式后,Computer Use 功能将在每个会话中可用。它有三种触发方式:

创建 PR 后

当 Devin 创建 PR 时,它会提供一个 Test the app 按钮。点击该按钮会触发完整的测试工作流:Devin 会启动你的应用,使用 Computer Use 与桌面交互,测试这些更改,并将录屏发送给你。
Test the app 按钮

在会话中按需使用

你可以在会话中的任何时候让 Devin 进行测试——不需要任何特殊语法,只需用自然语言提出请求即可。例如:
  • “测试你刚刚做的更改,并把录屏发给我”
  • “在浏览器中打开应用,验证登录页面是否正常工作”
  • “启动桌面应用,检查新的菜单项是否出现”

在适当情况下自主操作

Devin 会自行决定何时适合通过桌面交互来完成任务。如果任务涉及点击 UI 元素、在应用中导航、填写表单或对某些内容进行目视确认,Devin 会在无需你明确要求的情况下使用 Computer Use。你不需要告诉 Devin 如何 与屏幕交互——只需告诉它 要完成什么 即可。

Devin 在计算机操作方面能做什么

端到端测试 Web 应用

Devin 可以在本地启动你的应用,在 Chrome 中打开它,并完整地走一遍用户流程——登录、导航、表单提交、结账——以验证一切是否按预期工作正常。

测试桌面应用程序

任何在 Linux 上运行的应用程序都可以进行测试。Devin 可以启动应用、与其图形界面 (GUI) 交互并验证其行为。这包括 Electron 应用、Java Swing/AWT 应用、GTK/Qt 应用等。

可视化验证

Devin 可以在测试过程中的特定步骤截取屏幕截图,用于验证布局、样式和 UI 元素是否正确显示。它可以将屏幕上看到的内容与预期效果进行比对,并标记出视觉问题。

处理复杂的 UI 流程

有些测试场景需要多步 GUI 交互,而不仅是简单的 API 调用或浏览器自动化——比如拖拽、上下文菜单、键盘快捷键,或在多个窗口之间切换。Computer Use 可以处理所有这些。

记录测试会话

Devin 可以在测试时录制自己的屏幕,并在视频中标注关键时刻。录制内容随后会被处理并发送给你,这样你就可以观看 Devin 与你的应用交互的过程,并确认更改是否正常生效。有关录制工作流的完整说明,请参见 Testing & Video Recordings

Computer Use 功能的工作原理

当 Devin 在会话中使用 Computer Use 功能时,会遵循以下流程:
  1. 截取屏幕截图,以了解当前屏幕上可见的内容
  2. 识别可交互元素 —— 按钮、文本输入框、菜单、链接 —— 并决定要与哪些进行交互
  3. 执行操作 —— 点击、输入、滚动,或使用键盘快捷键
  4. 等待并观察 —— 再次截屏以查看该操作的结果
  5. 重复上述步骤,直到任务完成
这种“截图—操作”循环使 Devin 能够适应屏幕上的任何内容,像人类一样处理动态内容、加载状态、弹出窗口和意外弹出的对话框。

电脑操作与测试

电脑操作是 Devin 测试与录屏 工作流的基础。当 Devin 在创建拉取请求 (PR) 后测试你的应用时:
  1. 设置 — Devin 安装依赖、启动你的应用并准备环境
  2. 测试规划 — Devin 阅读代码 diff 并创建一份聚焦的测试计划
  3. 通过电脑操作执行 — Devin 使用其桌面环境与应用交互,按测试计划一步步执行
  4. 录制 — 整个过程会被录制成带批注的视频,然后发送给你进行审核
电脑操作与测试与录屏工作流之间的关键区别在于作用范围:电脑操作 是底层能力 (桌面交互) ,而 测试与录屏 是在此之上构建的结构化工作流,它使用电脑操作来测试你的 PR,并提供视频佐证。

获得最佳效果的建议

明确要测试的内容

  • “打开应用,在右上角点击 Settings 按钮,切换深色模式,并确认所有文本仍然清晰可读”
  • “启动 Electron 应用,创建一个新文档,输入一些文本,并在关闭窗口时确认文档已成功保存”

告诉 Devin 成功的标准

  • “仪表盘应显示三个图表,且没有错误信息”
  • “提交表单后,页面顶部应出现绿色的成功提示横幅”

提前配置访问

如果你的应用需要身份验证,请提前设置好机密信息,这样 Devin 就可以在会话过程中无需再向你确认即可登录。完成代码仓库设置,以确保 Devin 能够安装依赖项并顺利启动你的应用。

创建测试 Skill

对于需要频繁测试的应用程序,你可以创建一个 Skill,用来准确告知 Devin 如何为你的应用进行配置和测试。这样可以在多次会话中节省时间,并确保测试过程的一致性。示例请参见 Testing & Video Recordings — Skill 建议

故障排除

Devin 找不到某个 UI 元素

如果 Devin 无法在屏幕上找到某个按钮或元素,请在给 Devin 的指示中尽量更具体——描述该元素的位置、文字标签或周围的界面内容。比如,“点击弹窗右下角蓝色的 Save 按钮”要比“点击 Save”更好。

应用无法在 Devin 的桌面上显示

Devin 运行在 Linux 环境中。如果你的应用程序只能在 macOS 或 Windows 上运行,就无法在桌面端进行测试。由于 Web 应用在 Chrome 中运行,因此不受平台限制。对于桌面应用,请确保提供 Linux 构建版本。

Devin 点击错了地方

如果 Devin 在你的 UI 上出现误操作,请在 SkillKnowledge 中添加一条包含你应用具体导航说明的条目。描述精确步骤 (“点击左上角的汉堡菜单,然后在下拉菜单中点击 Settings”) 可以减少歧义。