Weave 概述
Weights & Biases (W&B) Weave 是一个用于跟踪、实验、评估、部署和改进基于 LLM 的应用程序的框架。
- 跟踪与监控:自动跟踪 LLM 调用和应用程序逻辑,以调试和分析生产系统
- 系统化迭代:优化和迭代提示、数据集和模型
- 评估:使用自定义或预构建的评分器来系统地评估和提升智能体性能
- 护栏:通过事前和事后保障措施保护您的智能体,进行内容审核和提示安全防护
设置说明
1
安装所需包
2
设置 W&B 账户
如果您还没有 Weights & Biases 账户,请注册一个。您将需要它来查看您的跟踪信息和指标。
3
在您的应用程序中初始化 Weave
将以下代码添加到您的应用程序中初始化后,Weave 将提供一个 URL,您可以在其中查看您的跟踪信息和指标。
4
创建您的 Crew/Flow
5
在 Weave 中查看跟踪信息
运行您的 CrewAI 应用程序后,访问初始化时提供的 Weave URL 以查看:
- LLM 调用及其元数据
- 智能体交互和任务执行流程
- 性能指标,如延迟和令牌使用量
- 执行期间发生的任何错误或问题

Weave 跟踪仪表板
功能
- Weave 会自动捕获所有 CrewAI 操作:智能体交互和任务执行;带有元数据和令牌使用量的 LLM 调用;工具使用情况和结果。
- 该集成支持所有 CrewAI 执行方法:
kickoff()、kickoff_for_each()、kickoff_async()和kickoff_for_each_async()。 - 自动跟踪所有 crewAI-tools。
- 通过装饰器修补支持 Flow 功能(
@start、@listen、@router、@or_、@and_)。 - 使用
@weave.op()跟踪传递给 CrewAITask的自定义护栏。
