mcp-server-webscan

Name: mcp-server-webscan
Rating: 1.9 (12 reviews)
Author: bsmi021

by bsmi021·★ 12·综合分 37

MCP 服务器提供网页抓取、链接提取、爬虫和站点地图生成功能。

web-scrapingdeveloper-toolsproductivity

Forks

活跃 Issue

12 个月前

概述

MCP Webscan Server 是一个基于 TypeScript 的实现，提供网页抓取、分析和信息提取工具。它具有页面抓取并转换为 Markdown、链接提取和过滤、递归网站爬行和深度控制、断开链接检查、URL 模式匹配和 XML 站点地图生成等功能。该服务器运行在 stdio 传输上，与 Claude Desktop 等 MCP 客户端兼容。代码结构良好，服务、工具和类型之间有清晰的分离。

试试问 AI

装完之后，这里有 5 个你可以让 AI 做的事：

你:通过抓取网页并将其转换为 Markdown 进行内容分析

你:提取链接并检查页面中的断开链接进行网站审计

你:通过爬虫发现网站结构并生成 XML 站点地图进行 SEO 分析

你:网站爬行的最大深度是多少？

你:可以按基础 URL 过滤链接吗？

什么时候选它

当您需要通过 AI 代理分析网页内容、执行网站审计或生成站点地图时，选择此 MCP 服务器。

什么时候不要选它

如果您需要实时监控、有严格的性能要求，或需要访问受保护内容的身份验证，请不要选择此服务器。

此 server 暴露的工具

从 README 抽取出 6 个工具

fetch-pageurl: string, selector?: string
Fetches a web page and converts it to Markdown
extract-linksurl: string, baseUrl?: string, limit?: number
Extracts all links from a web page with their text
crawl-siteurl: string, maxDepth?: number
Recursively crawls a website up to a specified depth
check-linksurl: string
Checks for broken links on a page
find-patternsurl: string, pattern: string
Finds URLs matching a specific pattern
generate-site-mapurl: string, maxDepth?: number, limit?: number
Generates a simple XML sitemap by crawling

可对比工具

mcp-server-web-scraperbrowser-mcpcurl-mcphttp-mcp

安装

通过 Smithery 安装

通过 [Smithery](https://smithery.ai/server/mcp-server-webscan) 自动为 Claude Desktop 安装 Webscan：

npx -y @smithery/cli install mcp-server-webscan --client claude

手动安装

# 克隆仓库
git clone <repository-url>
cd mcp-server-webscan

# 安装依赖
npm install

# 构建项目
npm run build

Claude Desktop 配置

{
  "mcpServers": {
    "webscan": {
      "command": "node",
      "args": ["path/to/mcp-server-webscan/build/index.js"],
      "env": {
        "NODE_ENV": "development",
        "LOG_LEVEL": "info"
      }
    }
  }
}

FAQ

网站爬行的最大深度是多少？: 默认最大深度为 2，但可以在 0-5 之间配置爬行站点和生成站点地图工具。
可以按基础 URL 过滤链接吗？: 是的，extract-links 工具接受可选的 baseUrl 参数来过滤链接。

mcp-server-webscan 对比

mcp-server-webscan vs mcp-server-chart mcp-server-webscan vs everything mcp-server-webscan vs filesystem mcp-server-webscan vs time mcp-server-webscan vs memory

GitHub →

最后更新于 2026-05-17 · 由 README + GitHub 公开数据自动生成。