MCP Catalogs
首页

luma-mcp

by JochenYang·59·综合分 46

多模型视觉理解MCP服务器,为不支持原生视觉能力的AI助手提供统一的图片分析能力。

ai-llmdeveloper-toolsother
8
Forks
1
活跃 Issue
1 个月前
最近提交
2 天前
收录于

概述

Luma MCP是一款多模型视觉理解服务器,集成了GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5等多种视觉模型。它通过统一的'image_understand'工具,对来自本地文件、远程URL和数据URI的图片进行标准化预处理流程。服务器针对复杂截图进行了优化,支持大图裁剪和文本密集场景的高保真处理。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:通过截图为AI编码助手提供代码分析
:通过视觉界面分析进行UI/UX评估
:使用错误截图进行错误调试
:支持哪些视觉模型?
:支持哪些图片格式?

什么时候选它

当您的 AI 编码模型不支持原生图像处理,但又需要视觉理解能力时,特别是在处理代码截图、UI 设计或文档图片时,选择 Luma MCP。

什么时候不要选它

如果您需要模型特有的功能,或需要处理超过 10MB 的复杂图像,不建议使用此服务器。

此 server 暴露的工具

从 README 抽取出 1 个工具
  • image_understandimage_understand({image_source: string, prompt: string})

    Analyze images from local files, URLs, or Data URIs based on user prompts

可对比工具

vision-mcpimage-analyzer-mcpmultimodal-mcp

安装

安装

npx -y luma-mcp

Claude Desktop 配置

添加到您的 config.json

{
  "mcpServers": {
    "luma": {
      "command": "npx",
      "args": ["-y", "luma-mcp"],
      "env": {
        "MODEL_PROVIDER": "zhipu",
        "ZHIPU_API_KEY": "your-api-key"
      }
    }
  }
}

MODEL_PROVIDER 和对应密钥替换为您选择的提供商。

FAQ

支持哪些视觉模型?
GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5
支持哪些图片格式?
JPG、PNG、WebP、GIF,最大输入大小为10MB

luma-mcp 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。