DINO-X-MCP
by IDEA-Research·★ 114·综合分 44
DINO-X MCP 服务器通过图像对象检测、定位和标注 API 为 LLM 提供视觉感知能力。
ai-llmmediadeveloper-tools
9
Forks
2
活跃 Issue
7 个月前
最近提交
2 天前
收录于
概述
DINO-X MCP 是 IDEA-Research 官方服务器,为多模态应用提供细粒度对象检测和图像理解能力。它支持 STDIO 和可流式 HTTP 传输模式,具有全场景对象检测、文本提示对象检测、人体姿态估计和可视化功能。该服务器提供结构化输出,包含对象类别、数量、位置和属性,适用于 VQA 和多步推理任务。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:带有对象检测和定位的视觉内容分析
你:通过自动对象计数进行库存管理
你:用于健身和医疗保健应用的人体姿态估计
你:支持哪些传输模式?
你:支持哪些图像格式?
什么时候选它
当您的多模态 AI 应用需要细粒度视觉理解和结构化输出时,特别是在处理目标检测、定位和图像标注任务时,应选择 DINO-X MCP。
什么时候不要选它
如果您需要无 API 依赖的本地处理,或者需要在 HTTP 模式下通过本地路径处理图像文件,则不应选择此方案。
此 server 暴露的工具
从 README 抽取出 4 个工具detect-all-objectsFull-scene object detection to identify all objects in an image
detect-objects-by-textText-prompted object detection to find specific objects based on text input
detect-human-pose-keypointsHuman pose estimation to detect 17 keypoints in human figures
visualize-detection-resultCreate visualization of detection results with bounding boxes and labels
可对比工具
clip-mcpvision-mcpimage-analysis-tools
安装
安装
选项 A:官方托管可流式 HTTP(推荐)
在您的 MCP 客户端配置中添加:
{
"mcpServers": {
"dinox-mcp": {
"url": "https://mcp.deepdataspace.com/mcp?key=your-api-key"
}
}
}选项 B:在本地使用 NPM 包(STDIO)
首先安装 Node.js,然后配置:
{
"mcpServers": {
"dinox-mcp": {
"command": "npx",
"args": ["-y", "@deepdataspace/dinox-mcp"],
"env": {
"DINOX_API_KEY": "your-api-key-here",
"IMAGE_STORAGE_DIRECTORY": "/path/to/your/image/directory"
}
}
}
}FAQ
- 支持哪些传输模式?
- DINO-X MCP 支持 STDIO(默认)和可流式 HTTP 模式。STDIO 支持 file:// 和 https:// 图像源,而 HTTP 仅支持 https://。
- 支持哪些图像格式?
- 服务器支持 jpg、jpeg、webp 和 png 图像格式。
DINO-X-MCP 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。