
mineru-tianshu
by magicyuan876·★ 634·综合分 51
企业级AI预处理平台,支持MCP协议,可处理文档、图片、音频和视频等数据。
ai-llmdeveloper-toolsproductivity
88
Forks
12
活跃 Issue
1 个月前
最近提交
2 天前
收录于
概述
天枢(MinerU)是一个全面的AI预处理平台,能够将非结构化数据转换为AI可用的结构化格式。它提供文档、图片、音频和视频处理功能,具有GPU加速和MCP协议集成。该平台采用Vue3前端和FastAPI后端架构,支持Docker部署,适合企业级应用。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:文档解析并转换为Markdown/JSON格式
你:为RAG应用处理多模态数据
你:通过MCP协议与AI助手集成
你:支持哪些文件格式?
你:MCP集成如何工作?
什么时候选它
选择此平台用于需要多模态数据预处理和MCP集成的企业文档处理流程,特别是处理需要高保真转换的科学或专业文档时。
什么时候不要选它
如果您不需要GPU加速的轻量级文档处理或更喜欢部署模型更简单的解决方案,则应避免使用。对于基本文档转换需求,该平台可能过于复杂。
此 server 暴露的工具
从 README 抽取出 4 个工具parse_documentParse documents (PDF, Word, Excel, etc.) into Markdown/JSON format
get_task_statusCheck the status of a document processing task
list_tasksList recent document processing tasks
get_queue_statsGet statistics about the document processing queue
可对比工具
minerupaddleocrllama-parseunstructured-apidocling
安装
安装
Docker部署(推荐)
# 一键部署
make setup
# 或使用脚本
./scripts/docker-setup.sh # Linux/Mac
scripts\docker-setup.bat # Windows本地开发
cd backend
bash install.sh
python start_all.py --enable-mcp # 启用MCP
cd frontend
npm install
npm run devClaude Desktop配置
添加到 claude_desktop_config.json:
{
"mcpServers": {
"mineru-tianshu": {
"url": "http://localhost:8002/sse",
"transport": "sse"
}
}
}FAQ
- 支持哪些文件格式?
- 平台支持PDF、Word、Excel、PowerPoint、图片(JPG/PNG)、音频文件(MP3/WAV)、视频文件(MP4/MKV)以及生物信息学格式(FASTA/GenBank)。
- MCP集成如何工作?
- 平台通过模型上下文协议(MCP)暴露工具,使Claude Desktop等AI助手能够通过配置的端点直接调用文档解析服务。
mineru-tianshu 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。