跳转到主要内容
为 Devin 确定合适的用例是最大化效率和投资回报率(ROI)的关键。以下是选择与 Devin 优势相契合用例的一些最佳实践。

最佳 Enterprise 使用场景

理想使用场景评估标准
规模大、业务价值高,且可以拆分为相互独立且可重复的子任务的项目。
需要少于 90 分钟工程师人工时间的任务。
向后兼容型任务,可以被独立验证并合并。

Devin 的理想任务要求

要求
大量重复性的子任务(切片)
复杂度相当于初级工程师水平的任务
相互独立且可逐步推进的任务
客观且可验证的子任务
**(推荐)**对项目依赖最少
如果你的任务满足上述大部分或全部要求,那么这个任务就非常适合交给 Devin 处理。

规划 Devin 的工作

选择合适的任务类型对于最大化 Devin 的可靠性至关重要。
场景可靠性考量任务类型
让 Devin 构建复杂的、全新的功能(即使是重复性的)在大规模使用时可靠性较低纵深型(Tall & Deep)
给 Devin 分配简单、定义清晰的任务可靠性高且效果显著广而浅型(Wide & Shallow)

垂直深入 vs. 水平广浅

狭窄-深入 与 浅层-广泛 的对比
由简单、可水平扩展的任务(例如解决 SonarQube 问题)构成的大量待办事项,在扩展到成千上万次迭代时,可以产生显著的投资回报率(ROI) 水平变更示意图
切片越简单,整体项目就越可靠

应该切分什么

非常适合交给 Devin 处理的任务类型:
  • 迁移
  • 重构
  • 现代化改造
  • 技术债务积压事项
例如,在进行代码迁移时,应当将任务拆分为一系列彼此独立的切片,每个切片由一个独立的 Devin 会话负责处理。 Slicing use cases illustration

验证

一个 slice 应该是项目中最小的原子单元
示例 Slice
文件(File)
Notebook
模块(Module)
要求详情
时间限制每个 slice 所需的人工工程工作必须少于 90 分钟完成。
验证必须包含一种验证代码变更的方式,例如:
- 运行测试
- 构建代码
- CI 检查
- 自定义验证脚本
Devin 必须具有清晰的用于判断成功/失败的验证机制。
避免选择对依赖或外部系统依赖过多的任务。Devin 擅长编码类任务
向后兼容性示意图

并行执行

需求说明
隔离性每个 slice 必须是独立的并且向后兼容
并行执行利用 Devin 的并行处理能力同时执行各个 slice。
人工审查每个 slice 完成后,在合并到 main 之前,都应经过人工审查
并行执行可视化

扩展性考量

Overall model diagram
原则描述
切片级可靠性Devin 在单个切片层面经过优化,确保最大可靠性
扩展性考量当扩展到成千上万的切片时,保持高可靠性至关重要。
错误影响即使是很小的错误率,在大规模执行时也会不断累积放大。

任务定义最佳实践

需求说明
Clear step details为每个任务切片提供明确的操作说明
End-to-end reference提供端到端的详细指南或视频以确保一致性。
Before/After examples提供多个变更前后的代码对比示例(输入/输出对)。
Dependency access确保 Devin 拥有完成该任务所需的全部依赖项
当相关工作被合理地拆分和结构化后,Devin 在处理持续性的技术债务类任务(例如 PR 评审、QA 自动化)时表现尤为出色。
迁移、现代化改造和重构是非常适合的用例,前提是可以分阶段、逐步推进。 例如,如果要求对整个代码库进行一次性迁移,则不推荐这种做法。
案例研究:Nubank 迁移案例研究