luma-mcp

Name: luma-mcp
Rating: 2.3 (59 reviews)
Author: JochenYang

by JochenYang·★ 59·综合分 46

多模型视觉理解MCP服务器，为不支持原生视觉能力的AI助手提供统一的图片分析能力。

ai-llmdeveloper-toolsother

Forks

活跃 Issue

2 个月前

概述

Luma MCP是一款多模型视觉理解服务器，集成了GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5等多种视觉模型。它通过统一的'image_understand'工具，对来自本地文件、远程URL和数据URI的图片进行标准化预处理流程。服务器针对复杂截图进行了优化，支持大图裁剪和文本密集场景的高保真处理。

试试问 AI

装完之后，这里有 5 个你可以让 AI 做的事：

你:通过截图为AI编码助手提供代码分析

你:通过视觉界面分析进行UI/UX评估

你:使用错误截图进行错误调试

你:支持哪些视觉模型？

你:支持哪些图片格式？

什么时候选它

当您的 AI 编码模型不支持原生图像处理，但又需要视觉理解能力时，特别是在处理代码截图、UI 设计或文档图片时，选择 Luma MCP。

什么时候不要选它

如果您需要模型特有的功能，或需要处理超过 10MB 的复杂图像，不建议使用此服务器。

此 server 暴露的工具

从 README 抽取出 1 个工具

image_understandimage_understand({image_source: string, prompt: string})
Analyze images from local files, URLs, or Data URIs based on user prompts

可对比工具

vision-mcpimage-analyzer-mcpmultimodal-mcp

安装

npx -y luma-mcp

Claude Desktop 配置

添加到您的 config.json：

{
  "mcpServers": {
    "luma": {
      "command": "npx",
      "args": ["-y", "luma-mcp"],
      "env": {
        "MODEL_PROVIDER": "zhipu",
        "ZHIPU_API_KEY": "your-api-key"
      }
    }
  }
}

将 MODEL_PROVIDER 和对应密钥替换为您选择的提供商。

FAQ

支持哪些视觉模型？: GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5
支持哪些图片格式？: JPG、PNG、WebP、GIF，最大输入大小为10MB

luma-mcp 对比

luma-mcp vs ultimate_mcp_server luma-mcp vs mcp-server-chart luma-mcp vs everything luma-mcp vs filesystem luma-mcp vs time

GitHub →

最后更新于 2026-05-17 · 由 README + GitHub 公开数据自动生成。