工具
视觉工具
VisionTool
工具旨在从图像中提取文本。
VisionTool
描述
此工具用于从图像中提取文本。当传递给代理时,它将从图像中提取文本,然后使用它来生成响应、报告或任何其他输出。应将图像的 URL 或 PATH 传递给代理。
安装
安装 crewai_tools 包
用法
为了使用 VisionTool,应在环境变量 OPENAI_API_KEY
中设置 OpenAI API 密钥。
代码
参数
VisionTool 需要以下参数
参数 | 类型 | 描述 |
---|---|---|
image_path_url | 字符串 | 强制。需要从中提取文本的图像文件的路径。 |