extract-llms-docs
by nirholas·★ 30·综合分 44
一个从网站提取 llms.txt 文档供 AI 使用的 MCP 服务器。
ai-llmdeveloper-toolsweb-scraping
4
Forks
1
活跃 Issue
本月
最近提交
2 天前
收录于
概述
llm.energy 是一个全面的应用程序和 MCP 服务器,可获取、解析和组织支持 llms.txt 和 install.md 标准的网站文档。它将原始文档转换为适合大型语言模型、AI 助手和开发工具的结构化格式。该项目既提供网页界面,又具备 MCP 服务器功能。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:为 AI 编码助手(如 Cursor 和 Windsurf)提供文档
你:使用最新文档构建上下文感知的 AI 代理
你:为 RAG 系统创建文档流程
你:什么是 llms.txt?
你:支持导出哪些文件格式?
什么时候选它
当您需要从支持 llms.txt 标准的网站提取和整理文档,用于 AI 助手和 RAG 系统时,选择此 MCP 服务器。
什么时候不要选它
如果您需要从不支持 llms.txt 标准的网站提取文档,请不要选择它,因为它依赖于此特定格式进行正确解析。
此 server 暴露的工具
从 README 抽取出 6 个工具extract_docsExtract documentation from a URL with llms.txt support
validate_urlCheck if a URL has llms.txt available
verify_llms_txtVerify llms.txt exists and get file info
discover_documentation_urlsFind documentation URLs for a domain
list_sitesGet directory of known llms.txt-enabled sites
search_sitesSearch the site directory by category or keyword
可对比工具
mcp-web-scrapermcp-documentation-extractorllms-txt-cliai-documentation-tools
安装
安装
网络应用程序
访问 [llm.energy](https://llm.energy) 使用托管版本。
MCP 服务器
将其添加到您的 MCP 客户端配置(Claude Desktop、Cursor 等)中:
{
"mcpServers": {
"llm-energy": {
"command": "npx",
"args": ["-y", "@llm-energy/mcp-server"]
}
}
}本地开发
# 克隆仓库
git clone https://github.com/nirholas/extract-llms-docs.git
cd extract-llms-docs
# 安装依赖
pnpm install
# 启动开发服务器
pnpm devFAQ
- 什么是 llms.txt?
- llms.txt 是专为 AI 系统设计的机器可读文档格式,使 AI 代理能够轻松理解和消费来自网站的文档。
- 支持导出哪些文件格式?
- 该应用程序支持将文档导出为 Markdown、JSON、YAML 或包含所有部分的 ZIP 压缩文件。
extract-llms-docs 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。