`VisionTool`

描述

此工具用于从图像中提取文本。当传递给代理时，它将从图像中提取文本，然后使用它来生成响应、报告或任何其他输出。应将图像的 URL 或 PATH 传递给代理。

安装

安装 crewai_tools 包

pip install 'crewai[tools]'

用法

为了使用 VisionTool，应在环境变量 OPENAI_API_KEY 中设置 OpenAI API 密钥。

代码
from crewai_tools import VisionTool

vision_tool = VisionTool()

@agent
def researcher(self) -> Agent:
    '''
    This agent uses the VisionTool to extract text from images.
    '''
    return Agent(
        config=self.agents_config["researcher"],
        allow_delegation=False,
        tools=[vision_tool]
    )

参数

VisionTool 需要以下参数

参数	类型	描述
image_path_url	`字符串`	强制。需要从中提取文本的图像文件的路径。

TXT RAG 搜索 Weaviate 向量搜索

本页目录

VisionTool
描述
安装
用法
参数

入门

指南

核心概念

工具

代理监控与可观测性

学习

遥测

视觉工具

`VisionTool`

描述

安装

用法

参数

入门

指南

核心概念

工具

代理监控与可观测性

学习

遥测

​VisionTool

​描述

​安装

​用法

​参数

`VisionTool`

描述

安装

用法

参数