pdf-reader-mcp
by SylphxAI·★ 711·综合分 55
生产级 PDF 处理 MCP 服务器,具有 5-10 倍更快的并行处理能力和全面测试覆盖率。
file-systemdeveloper-toolsai-llm
66
Forks
7
活跃 Issue
本月
最近提交
2 天前
收录于
概述
PDF Reader MCP 是一个强大的模型上下文协议服务器,旨在为 AI 代理提供企业级的 PDF 处理能力。它通过自动并行化相比传统顺序处理方式具有显著性能优势,使用户能够在几秒内处理大型 PDF 文档(50-100+ 页),而不是几分钟。服务器维护着一个简单优雅的 API,同时提供先进功能,如基于 Y 坐标的内容排序,这保留了文档布局的自然阅读流程,对于 AI 理解任务特别有价值。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:AI 代理分析研究论文并提取关键信息
你:文档自动化系统处理合同和协议
你:内容管理系统从存档的 PDF 文档中提取文本
你:这与传统 PDF 处理有何不同?
你:支持哪些类型的 PDF 文件?
什么时候选它
当您需要为AI应用提供高性能PDF处理,特别是处理大型文档时,并行处理能带来明显差异的情况下,选择它。
什么时候不要选它
如果您需要修改PDF内容(这只是只读的)或需要支持除PDF以外的文档格式,则不太理想。
此 server 暴露的工具
从 README 抽取出 1 个工具read_pdfsources: Array<{path?: string, url?: string, pages?: string | number[]}>, include_full_text?: boolean, include_metadata?: boolean, include_page_count?: boolean, include_images?: booleanExtract text, images, and metadata from PDF files with parallel processing
可对比工具
pdf-parsepdf2picpdf-lib
安装
安装
Claude Desktop
添加到 claude_desktop_config.json:
{
"mcpServers": {
"pdf-reader": {
"command": "npx",
"args": ["@sylphx/pdf-reader-mcp"]
}
}
}VS Code
code --add-mcp '{"name":"pdf-reader","command":"npx","args":["@sylphx/pdf-reader-mcp"]}'npm
npm install -g @sylphx/pdf-reader-mcpFAQ
- 这与传统 PDF 处理有何不同?
- PDF Reader MCP 使用并行处理实现比顺序处理快 5-10 倍的性能。它还提供基于 Y 坐标的内容排序,保留自然文档布局。
- 支持哪些类型的 PDF 文件?
- 该服务器支持本地文件(Windows/Unix 上的绝对和相对路径)和 HTTP/HTTPS URL。它可以处理具有文本、图像和元数据提取功能的各种文档。
pdf-reader-mcp 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。