MCP Catalogs
首页

pdf-reader-mcp

by SylphxAI·711·综合分 55

生产级 PDF 处理 MCP 服务器,具有 5-10 倍更快的并行处理能力和全面测试覆盖率。

file-systemdeveloper-toolsai-llm
66
Forks
7
活跃 Issue
本月
最近提交
2 天前
收录于

概述

PDF Reader MCP 是一个强大的模型上下文协议服务器,旨在为 AI 代理提供企业级的 PDF 处理能力。它通过自动并行化相比传统顺序处理方式具有显著性能优势,使用户能够在几秒内处理大型 PDF 文档(50-100+ 页),而不是几分钟。服务器维护着一个简单优雅的 API,同时提供先进功能,如基于 Y 坐标的内容排序,这保留了文档布局的自然阅读流程,对于 AI 理解任务特别有价值。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:AI 代理分析研究论文并提取关键信息
:文档自动化系统处理合同和协议
:内容管理系统从存档的 PDF 文档中提取文本
:这与传统 PDF 处理有何不同?
:支持哪些类型的 PDF 文件?

什么时候选它

当您需要为AI应用提供高性能PDF处理,特别是处理大型文档时,并行处理能带来明显差异的情况下,选择它。

什么时候不要选它

如果您需要修改PDF内容(这只是只读的)或需要支持除PDF以外的文档格式,则不太理想。

此 server 暴露的工具

从 README 抽取出 1 个工具
  • read_pdfsources: Array<{path?: string, url?: string, pages?: string | number[]}>, include_full_text?: boolean, include_metadata?: boolean, include_page_count?: boolean, include_images?: boolean

    Extract text, images, and metadata from PDF files with parallel processing

可对比工具

pdf-parsepdf2picpdf-lib

安装

安装

Claude Desktop

添加到 claude_desktop_config.json

{
  "mcpServers": {
    "pdf-reader": {
      "command": "npx",
      "args": ["@sylphx/pdf-reader-mcp"]
    }
  }
}

VS Code

code --add-mcp '{"name":"pdf-reader","command":"npx","args":["@sylphx/pdf-reader-mcp"]}'

npm

npm install -g @sylphx/pdf-reader-mcp

FAQ

这与传统 PDF 处理有何不同?
PDF Reader MCP 使用并行处理实现比顺序处理快 5-10 倍的性能。它还提供基于 Y 坐标的内容排序,保留自然文档布局。
支持哪些类型的 PDF 文件?
该服务器支持本地文件(Windows/Unix 上的绝对和相对路径)和 HTTP/HTTPS URL。它可以处理具有文本、图像和元数据提取功能的各种文档。

pdf-reader-mcp 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。