luma-mcp
by JochenYang·★ 59·综合分 46
多模型视觉理解MCP服务器,为不支持原生视觉能力的AI助手提供统一的图片分析能力。
ai-llmdeveloper-toolsother
8
Forks
1
活跃 Issue
1 个月前
最近提交
2 天前
收录于
概述
Luma MCP是一款多模型视觉理解服务器,集成了GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5等多种视觉模型。它通过统一的'image_understand'工具,对来自本地文件、远程URL和数据URI的图片进行标准化预处理流程。服务器针对复杂截图进行了优化,支持大图裁剪和文本密集场景的高保真处理。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:通过截图为AI编码助手提供代码分析
你:通过视觉界面分析进行UI/UX评估
你:使用错误截图进行错误调试
你:支持哪些视觉模型?
你:支持哪些图片格式?
什么时候选它
当您的 AI 编码模型不支持原生图像处理,但又需要视觉理解能力时,特别是在处理代码截图、UI 设计或文档图片时,选择 Luma MCP。
什么时候不要选它
如果您需要模型特有的功能,或需要处理超过 10MB 的复杂图像,不建议使用此服务器。
此 server 暴露的工具
从 README 抽取出 1 个工具image_understandimage_understand({image_source: string, prompt: string})Analyze images from local files, URLs, or Data URIs based on user prompts
可对比工具
vision-mcpimage-analyzer-mcpmultimodal-mcp
安装
安装
npx -y luma-mcpClaude Desktop 配置
添加到您的 config.json:
{
"mcpServers": {
"luma": {
"command": "npx",
"args": ["-y", "luma-mcp"],
"env": {
"MODEL_PROVIDER": "zhipu",
"ZHIPU_API_KEY": "your-api-key"
}
}
}
}将 MODEL_PROVIDER 和对应密钥替换为您选择的提供商。
FAQ
- 支持哪些视觉模型?
- GLM-4.6V、DeepSeek-OCR、Qwen3-VL-Flash、Doubao-Seed-1.6和Hunyuan-Vision-1.5
- 支持哪些图片格式?
- JPG、PNG、WebP、GIF,最大输入大小为10MB
luma-mcp 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。