MCP Catalogs
首页

html-to-markdown-mcp

by levz0r·24·综合分 45

一个使用 Turndown.js 将 HTML 转换为 Markdown 的 MCP 服务器,带有 SSRF 保护功能。

web-scrapingdeveloper-toolsproductivity
4
Forks
1
活跃 Issue
2 个月前
最近提交
2 天前
收录于

概述

这是一个专门的 MCP 服务器,处理 HTML 到 Markdown 的转换。它提供两个主要工具:html_to_markdown 用于将 URL 或 HTML 内容转换为 Markdown,以及 save_markdown 用于将内容保存到文件。服务器默认包含 SSRF 保护,阻止对私有网络地址的请求,除非明确启用。它支持获取网页、保留格式,并通过截断或直接文件保存来处理大内容。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:将网页文章转换为 Markdown 以便离线阅读
:从杂乱的 HTML 页面提取干净内容
:自动将网页内容保存为 Markdown 文件
:这个服务器能否处理大型网页?
:SSRF 保护是如何实现的?

什么时候选它

当您需要将网页或原始 HTML 内容转换为格式良好的 Markdown 时,选择此 MCP 服务器。

什么时候不要选它

如果您需要处理需要浏览器渲染的复杂 JavaScript 重型网站,请不要选择此服务器,因为它仅获取静态 HTML。

此 server 暴露的工具

从 README 抽取出 2 个工具
  • html_to_markdownhtml_to_markdown(url?: string, html?: string, includeMetadata?: boolean, maxLength?: number, saveToFile?: string)

    Fetch HTML from a URL or convert provided HTML content to Markdown format.

  • save_markdownsave_markdown(content: string, filePath: string)

    Save markdown content to a file on disk.

可对比工具

html-to-text-mcpmarkdown-printerpuppeteer-mcp

安装

安装

npm install -g html-to-markdown-mcp

Claude Desktop 配置

{
  "mcpServers": {
    "html-to-markdown": {
      "command": "npx",
      "args": ["html-to-markdown-mcp"]
    }
  }
}

本地开发

git clone https://github.com/levz0r/html-to-markdown-mcp.git
cd html-to-markdown-mcp
npm install
npm start

FAQ

这个服务器能否处理大型网页?
是的,它有两种处理大内容的方式:使用 maxLength 参数截断或使用 saveToFile 参数直接保存到文件。
SSRF 保护是如何实现的?
服务器默认阻止对私有网络地址(127.0.0.0/8, 10.0.0.0/8, 172.16.0.0/12, 192.168.0.0/16, 169.254.0.0/16)和非 HTTP(S) 方案的请求。

html-to-markdown-mcp 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。