deer-flow
B23/40Agent 框架洞察置信度:中An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.
Executive Insight
deer-flow 属于「Agent 框架」方向,综合分 23/40(B)。当前最强项是 LLM 集成、Agent 自主性、记忆系统,短板集中在 工具使用、评估与验证。
核心优势
- - LLM 集成达到 4/5(Level 4),说明该项目在这一能力上较成熟。
- - Agent 自主性达到 4/5(Level 4),说明该项目在这一能力上较成熟。
- - 记忆系统达到 3/5(Level 3),说明该项目在这一能力上较成熟。
能力短板
- - 工具使用仅 2/5,当前更像“可用基础版”,需要补齐工程化能力。
- - 评估与验证仅 2/5,当前更像“可用基础版”,需要补齐工程化能力。
适用场景
- - 需要多步骤自动化的团队工具
- - 复杂工作流编排与协作系统
落地风险与建议
- - 该条目为启发式分析,建议在核心决策前做一次仓库级人工复核。
- - 项目相对较新,API 与架构演进速度可能较快,升级成本需预留。
- - 评估与验证环节偏弱,上线前需要补充自动测试与回归策略。
- - 人机协作机制偏弱,生产环境需增加人工审批或灰度发布闸门。
- - 梳理工具调用协议,先统一输入输出,再做动态路由。
- - 先补评测基线:定义 10-20 条关键任务用例并接入 CI。
Intelligence Profile
Dimensions
LLM 集成
Level 4
Level 4: 多模型切换 + Provider 抽象
Agent 自主性
Level 4
Level 4: 任务规划 + 自主执行 + 纠错
记忆系统
Level 3
Level 3: 向量检索 + 语义记忆
工具使用
Level 2
Level 2: 多工具 + 路由
知识检索 (RAG)
Level 3
Level 3: 切块 + 检索 + Rerank
多模态
Level 3
Level 3: 多模态输入输出
评估与验证
Level 2
Level 2: 规则校验
人机协作
Level 2
Level 2: AI 执行 + 人工审批
Architecture
An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.
GitHub Live Metrics
Loading live metrics...