MCP Catalogs
首页

mcp-server-webscan

by bsmi021·12·综合分 37

MCP 服务器提供网页抓取、链接提取、爬虫和站点地图生成功能。

web-scrapingdeveloper-toolsproductivity
11
Forks
2
活跃 Issue
10 个月前
最近提交
2 天前
收录于

概述

MCP Webscan Server 是一个基于 TypeScript 的实现,提供网页抓取、分析和信息提取工具。它具有页面抓取并转换为 Markdown、链接提取和过滤、递归网站爬行和深度控制、断开链接检查、URL 模式匹配和 XML 站点地图生成等功能。该服务器运行在 stdio 传输上,与 Claude Desktop 等 MCP 客户端兼容。代码结构良好,服务、工具和类型之间有清晰的分离。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:通过抓取网页并将其转换为 Markdown 进行内容分析
:提取链接并检查页面中的断开链接进行网站审计
:通过爬虫发现网站结构并生成 XML 站点地图进行 SEO 分析
:网站爬行的最大深度是多少?
:可以按基础 URL 过滤链接吗?

什么时候选它

当您需要通过 AI 代理分析网页内容、执行网站审计或生成站点地图时,选择此 MCP 服务器。

什么时候不要选它

如果您需要实时监控、有严格的性能要求,或需要访问受保护内容的身份验证,请不要选择此服务器。

此 server 暴露的工具

从 README 抽取出 6 个工具
  • fetch-pageurl: string, selector?: string

    Fetches a web page and converts it to Markdown

  • extract-linksurl: string, baseUrl?: string, limit?: number

    Extracts all links from a web page with their text

  • crawl-siteurl: string, maxDepth?: number

    Recursively crawls a website up to a specified depth

  • check-linksurl: string

    Checks for broken links on a page

  • find-patternsurl: string, pattern: string

    Finds URLs matching a specific pattern

  • generate-site-mapurl: string, maxDepth?: number, limit?: number

    Generates a simple XML sitemap by crawling

可对比工具

mcp-server-web-scraperbrowser-mcpcurl-mcphttp-mcp

安装

通过 Smithery 安装

通过 [Smithery](https://smithery.ai/server/mcp-server-webscan) 自动为 Claude Desktop 安装 Webscan:

npx -y @smithery/cli install mcp-server-webscan --client claude

手动安装

# 克隆仓库
git clone <repository-url>
cd mcp-server-webscan

# 安装依赖
npm install

# 构建项目
npm run build

Claude Desktop 配置

{
  "mcpServers": {
    "webscan": {
      "command": "node",
      "args": ["path/to/mcp-server-webscan/build/index.js"],
      "env": {
        "NODE_ENV": "development",
        "LOG_LEVEL": "info"
      }
    }
  }
}

FAQ

网站爬行的最大深度是多少?
默认最大深度为 2,但可以在 0-5 之间配置爬行站点和生成站点地图工具。
可以按基础 URL 过滤链接吗?
是的,extract-links 工具接受可选的 baseUrl 参数来过滤链接。

mcp-server-webscan 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。