MCP Catalogs
首页DINO-X-MCP screenshot

DINO-X-MCP

by IDEA-Research·114·综合分 44

DINO-X MCP 服务器通过图像对象检测、定位和标注 API 为 LLM 提供视觉感知能力。

ai-llmmediadeveloper-tools
9
Forks
2
活跃 Issue
7 个月前
最近提交
2 天前
收录于

概述

DINO-X MCP 是 IDEA-Research 官方服务器,为多模态应用提供细粒度对象检测和图像理解能力。它支持 STDIO 和可流式 HTTP 传输模式,具有全场景对象检测、文本提示对象检测、人体姿态估计和可视化功能。该服务器提供结构化输出,包含对象类别、数量、位置和属性,适用于 VQA 和多步推理任务。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:带有对象检测和定位的视觉内容分析
:通过自动对象计数进行库存管理
:用于健身和医疗保健应用的人体姿态估计
:支持哪些传输模式?
:支持哪些图像格式?

什么时候选它

当您的多模态 AI 应用需要细粒度视觉理解和结构化输出时,特别是在处理目标检测、定位和图像标注任务时,应选择 DINO-X MCP。

什么时候不要选它

如果您需要无 API 依赖的本地处理,或者需要在 HTTP 模式下通过本地路径处理图像文件,则不应选择此方案。

此 server 暴露的工具

从 README 抽取出 4 个工具
  • detect-all-objects

    Full-scene object detection to identify all objects in an image

  • detect-objects-by-text

    Text-prompted object detection to find specific objects based on text input

  • detect-human-pose-keypoints

    Human pose estimation to detect 17 keypoints in human figures

  • visualize-detection-result

    Create visualization of detection results with bounding boxes and labels

可对比工具

clip-mcpvision-mcpimage-analysis-tools

安装

安装

选项 A:官方托管可流式 HTTP(推荐)

在您的 MCP 客户端配置中添加:

{
  "mcpServers": {
    "dinox-mcp": {
      "url": "https://mcp.deepdataspace.com/mcp?key=your-api-key"
    }
  }
}

选项 B:在本地使用 NPM 包(STDIO)

首先安装 Node.js,然后配置:

{
  "mcpServers": {
    "dinox-mcp": {
      "command": "npx",
      "args": ["-y", "@deepdataspace/dinox-mcp"],
      "env": {
        "DINOX_API_KEY": "your-api-key-here",
        "IMAGE_STORAGE_DIRECTORY": "/path/to/your/image/directory"
      }
    }
  }
}

FAQ

支持哪些传输模式?
DINO-X MCP 支持 STDIO(默认)和可流式 HTTP 模式。STDIO 支持 file:// 和 https:// 图像源,而 HTTP 仅支持 https://。
支持哪些图像格式?
服务器支持 jpg、jpeg、webp 和 png 图像格式。

DINO-X-MCP 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。