最佳 Enterprise 使用场景
| 理想使用场景评估标准 |
|---|
| 规模大、业务价值高,且可以拆分为相互独立且可重复的子任务的项目。 |
| 需要少于 90 分钟工程师人工时间的任务。 |
| 向后兼容型任务,可以被独立验证并合并。 |
Devin 的理想任务要求
| 要求 |
|---|
| 大量重复性的子任务(切片) |
| 复杂度相当于初级工程师水平的任务 |
| 相互独立且可逐步推进的任务 |
| 客观且可验证的子任务 |
| **(推荐)**对项目依赖最少 |
规划 Devin 的工作
| 场景 | 可靠性考量 | 任务类型 |
|---|---|---|
| 让 Devin 构建复杂的、全新的功能(即使是重复性的) | 在大规模使用时可靠性较低 | 纵深型(Tall & Deep) |
| 给 Devin 分配简单、定义清晰的任务 | 可靠性高且效果显著 | 广而浅型(Wide & Shallow) |
垂直深入 vs. 水平广浅


切片越简单,整体项目就越可靠。
应该切分什么
- 迁移
- 重构
- 现代化改造
- 技术债务积压事项

验证
| 示例 Slice |
|---|
| 文件(File) |
| Notebook |
| 模块(Module) |
| 要求 | 详情 |
|---|---|
| 时间限制 | 每个 slice 所需的人工工程工作必须少于 90 分钟完成。 |
| 验证 | 必须包含一种验证代码变更的方式,例如: - 运行测试 - 构建代码 - CI 检查 - 自定义验证脚本 |

并行执行
| 需求 | 说明 |
|---|---|
| 隔离性 | 每个 slice 必须是独立的并且向后兼容。 |
| 并行执行 | 利用 Devin 的并行处理能力来同时执行各个 slice。 |
| 人工审查 | 每个 slice 完成后,在合并到 main 之前,都应经过人工审查。 |

扩展性考量

| 原则 | 描述 |
|---|---|
| 切片级可靠性 | Devin 在单个切片层面经过优化,确保最大可靠性。 |
| 扩展性考量 | 当扩展到成千上万的切片时,保持高可靠性至关重要。 |
| 错误影响 | 即使是很小的错误率,在大规模执行时也会不断累积放大。 |
任务定义最佳实践
| 需求 | 说明 |
|---|---|
| Clear step details | 为每个任务切片提供明确的操作说明。 |
| End-to-end reference | 提供端到端的详细指南或视频以确保一致性。 |
| Before/After examples | 提供多个变更前后的代码对比示例(输入/输出对)。 |
| Dependency access | 确保 Devin 拥有完成该任务所需的全部依赖项。 |
迁移、现代化改造和重构是非常适合的用例,前提是可以分阶段、逐步推进。
例如,如果要求对整个代码库进行一次性迁移,则不推荐这种做法。
