MCP Catalogs
首页mineru-tianshu screenshot

mineru-tianshu

by magicyuan876·634·综合分 51

企业级AI预处理平台,支持MCP协议,可处理文档、图片、音频和视频等数据。

ai-llmdeveloper-toolsproductivity
88
Forks
12
活跃 Issue
1 个月前
最近提交
2 天前
收录于

概述

天枢(MinerU)是一个全面的AI预处理平台,能够将非结构化数据转换为AI可用的结构化格式。它提供文档、图片、音频和视频处理功能,具有GPU加速和MCP协议集成。该平台采用Vue3前端和FastAPI后端架构,支持Docker部署,适合企业级应用。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:文档解析并转换为Markdown/JSON格式
:为RAG应用处理多模态数据
:通过MCP协议与AI助手集成
:支持哪些文件格式?
:MCP集成如何工作?

什么时候选它

选择此平台用于需要多模态数据预处理和MCP集成的企业文档处理流程,特别是处理需要高保真转换的科学或专业文档时。

什么时候不要选它

如果您不需要GPU加速的轻量级文档处理或更喜欢部署模型更简单的解决方案,则应避免使用。对于基本文档转换需求,该平台可能过于复杂。

此 server 暴露的工具

从 README 抽取出 4 个工具
  • parse_document

    Parse documents (PDF, Word, Excel, etc.) into Markdown/JSON format

  • get_task_status

    Check the status of a document processing task

  • list_tasks

    List recent document processing tasks

  • get_queue_stats

    Get statistics about the document processing queue

可对比工具

minerupaddleocrllama-parseunstructured-apidocling

安装

安装

Docker部署(推荐)

# 一键部署
make setup

# 或使用脚本
./scripts/docker-setup.sh    # Linux/Mac
scripts\docker-setup.bat     # Windows

本地开发

cd backend
bash install.sh
python start_all.py --enable-mcp  # 启用MCP

cd frontend
npm install
npm run dev

Claude Desktop配置

添加到 claude_desktop_config.json

{
  "mcpServers": {
    "mineru-tianshu": {
      "url": "http://localhost:8002/sse",
      "transport": "sse"
    }
  }
}

FAQ

支持哪些文件格式?
平台支持PDF、Word、Excel、PowerPoint、图片(JPG/PNG)、音频文件(MP3/WAV)、视频文件(MP4/MKV)以及生物信息学格式(FASTA/GenBank)。
MCP集成如何工作?
平台通过模型上下文协议(MCP)暴露工具,使Claude Desktop等AI助手能够通过配置的端点直接调用文档解析服务。

mineru-tianshu 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。