一句话总结
Factory AI (Droid) 不是又一个AI代码补全工具——它是一个多智能体协作平台。通过将编码、审查、测试、文档生成分配给不同的专业Droid,由一个Coordinator Droid统一调度,在 Terminal-Bench 排行榜上以58.8%的成绩位居第一。$20/月起步,也支持自带API密钥(BYOK)免费使用。
核心能力
关键功能
- 多智能体架构:Coordinator Droid 将任务分解后分发给专业 Droid(Code、Review、Test、Docs、Knowledge、Reliability、Product),每个 Droid 有明确的职责边界
- Droid CLI:终端原生代理,支持
curl -fsSL https://app.factory.ai/cli | sh一键安装 - Mission Control:编排多个 Droid 执行跨天复杂任务,支持长周期自主工作
- 模型无关:支持 Anthropic Claude、OpenAI GPT 及开源模型,可在会话中切换
- Bring Your Own Key (BYOK):用自己的 API Key 可免费使用
- Droid Shield:内置安全检查,防止提交 API Key 等敏感信息
- 分析与成本仪表盘:追踪 token 消耗与故事点完成情况的对应关系
- 多平台支持:VS Code 插件、JetBrains 插件、终端 CLI、Web 界面
价格
| 套餐 | 价格 | 适用人群 |
|---|---|---|
| Free (BYOK) | $0 | 已有 Claude/ChatGPT API 密钥的个人开发者 |
| Pro | $20/月 | 个人开发者,含标准用量和所有模型 |
| Plus | $100/月 | 进阶个人/小团队,含更多用量 |
| Max | $200/月 | 重度使用者 |
| Teams / Enterprise | 定制 | 团队和企业客户 |
超量费用:约 $2.70/百万 token
适用场景
- 需要多步骤自动化的代码重构和迁移
- 有明确工程规范、文档齐全的团队
- 需要持续集成代码审查和自动化测试生成
- 希望跨天执行复杂任务(Missions 模式)
- 已有 API 订阅、想零成本使用的个人开发者
优缺点
优点
- 多智能体架构领先:角色分离设计(Review Droid 不写代码,Test Droid 不改逻辑)比单纯的通用代理产出更可预测
- Terminal-Bench 排名第一:58.8% 得分,高于 Claude Code 和 GPT-5 代理
- 模型无锁定:可在会话中切换 Claude、GPT 等模型,也可以 BYOK
- Missions 功能独特:支持跨天自主运行,适合大型项目拆解
- Knowledge Droid 持久记忆:索引仓库和文档,跨会话共享上下文
- Droid Shield 安全特性:防止意外提交敏感信息,企业友好
- BYOK 免费模式:已有 API Key 即可零成本体验全部功能
缺点
- Token 计费可能超出预期:虽然订阅价不高,但重度使用超量费用叠加后可能超过 Claude Code 或 Cursor
- 对代码库组织要求高:代码质量差、文档缺失的项目中表现大幅下降
- 仍在快速迭代中:部分功能存在小 bug,稳定性不如成熟产品
- 支持响应参差不齐:部分用户反馈客服响应慢
- 不适合快速补全场景:不是 Cursor 式的行级补全工具,批量任务启动有启动成本
- 退出机制争议:有 Reddit 用户反馈取消订阅流程不顺畅
与竞品对比
| 维度 | Factory AI (Droid) | Claude Code | Cursor | GitHub Copilot |
|---|---|---|---|---|
| 架构 | 多智能体协作(Coordinator + 专业 Droid) | 单智能体终端代理 | IDE 内嵌智能体 | 行级补全 + Copilot Chat |
| 定价 | $20-200/月 (BYOK 免费) | $20-200/月 | $20-60-200/月 | $10/月 (Pro) |
| 超量费用 | ~$2.70/百万 token | 含在订阅额度内 | $20 额度用完自动限制 | 2026年6月起改为信用点计费 |
| Terminal-Bench | 58.8% (#1) | ~55% | ~52% (IDE模式) | 未独立排名 |
| 跨天任务 | ✅ Missions 模式 | ❌ 无 | ❌ 无 | ❌ 无 |
| 模型自由切换 | ✅ 支持 | ❌ 仅 Claude | ✅ 支持 | ❌ 仅 OpenAI |
| BYOK | ✅ 支持 | ❌ 不支持 | ✅ 部分支持 | ❌ 不支持 |
| IDE 兼容 | VS Code / JetBrains 插件 | 终端原生 | 自有 IDE | VS Code / JetBrains |
| 安全审查 | Droid Shield | 无 | 无 | Codespaces 安全策略 |
| 最适合 | 团队、大型项目 | 个人开发者、终端控 | 日常编码、前端 | 预算有限的个人 |
适合谁用
推荐给:
- 工程团队(3-50人):如果有明确的代码规范、CI/CD 流程和文档体系,Factory 的多智能体架构能显著提升 PR 审查和测试覆盖率
- 有 API 密钥的个人开发者:BYOK 模式零成本,值得一试
- 管理复杂代码库的开发者:Missions 模式适合跨模块重构、大型迁移
- 追求工程纪律的团队:角色分离设计有助于保持代码一致性
不推荐给:
- 只需要行级自动补全的开发者:Cutter 或 Copilot 更轻量
- 代码质量较低的项目:Droid 对混乱代码库的驾驭能力有限
- 预算敏感且轻度使用的个人:Copilot Pro $10/月更划算
评分(满分5)
| 维度 | 评分 | 说明 |
|---|---|---|
| 🏗️ 功能 | ⭐⭐⭐⭐½ | 多智能体架构领先,Missions 功能独特 |
| 💰 性价比 | ⭐⭐⭐½ | BYOK 免费是真香,但重度使用超量费可能超预期 |
| 🎮 易用性 | ⭐⭐⭐½ | CLI 体验优秀,但团队部署和学习曲线不低 |
| 🏆 整体推荐 | ⭐⭐⭐⭐ | 对团队场景是顶级选择,个人用户视需求而定 |
一句话建议:如果你的团队有工程纪律且愿意做前期配置,Factory AI 是目前多智能体编码领域最具前瞻性的选择——先用 BYOK 模式零成本试水,再决定是否订阅。