← All projects

deer-flow

B23/40Agent 框架洞察置信度:

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

56,707PythonCreated 2025-05-07GitHub →
agentagenticagentic-frameworkagentic-workflowaiai-agentsdeep-researchharnesslangchainlanggraphlangmanusllmmulti-agentnodejspodcastpythonsuperagenttypescript

Executive Insight

deer-flow 属于「Agent 框架」方向,综合分 23/40(B)。当前最强项是 LLM 集成、Agent 自主性、记忆系统,短板集中在 工具使用、评估与验证。

核心优势

  • - LLM 集成达到 4/5(Level 4),说明该项目在这一能力上较成熟。
  • - Agent 自主性达到 4/5(Level 4),说明该项目在这一能力上较成熟。
  • - 记忆系统达到 3/5(Level 3),说明该项目在这一能力上较成熟。

能力短板

  • - 工具使用仅 2/5,当前更像“可用基础版”,需要补齐工程化能力。
  • - 评估与验证仅 2/5,当前更像“可用基础版”,需要补齐工程化能力。

适用场景

  • - 需要多步骤自动化的团队工具
  • - 复杂工作流编排与协作系统

落地风险与建议

  • - 该条目为启发式分析,建议在核心决策前做一次仓库级人工复核。
  • - 项目相对较新,API 与架构演进速度可能较快,升级成本需预留。
  • - 评估与验证环节偏弱,上线前需要补充自动测试与回归策略。
  • - 人机协作机制偏弱,生产环境需增加人工审批或灰度发布闸门。
  • - 梳理工具调用协议,先统一输入输出,再做动态路由。
  • - 先补评测基线:定义 10-20 条关键任务用例并接入 CI。

Intelligence Profile

LLM 集成Agent 自主性记忆系统工具使用知识检索 (RAG)多模态评估与验证人机协作

Dimensions

LLM 集成

Level 4

Level 4: 多模型切换 + Provider 抽象

Heuristic from category + topics — verify manually

Agent 自主性

Level 4

Level 4: 任务规划 + 自主执行 + 纠错

Heuristic from category + topics — verify manually

记忆系统

Level 3

Level 3: 向量检索 + 语义记忆

Heuristic from category + topics — verify manually

工具使用

Level 2

Level 2: 多工具 + 路由

Heuristic from category + topics — verify manually

知识检索 (RAG)

Level 3

Level 3: 切块 + 检索 + Rerank

Heuristic from category + topics — verify manually

多模态

Level 3

Level 3: 多模态输入输出

Heuristic from category + topics — verify manually

评估与验证

Level 2

Level 2: 规则校验

Heuristic from category + topics — verify manually

人机协作

Level 2

Level 2: AI 执行 + 人工审批

Heuristic from category + topics — verify manually

Architecture

agents ecosystem (GitHub)

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

GitHub Live Metrics

Loading live metrics...