mcp-server-webscan
by bsmi021·★ 12·综合分 37
MCP 服务器提供网页抓取、链接提取、爬虫和站点地图生成功能。
概述
MCP Webscan Server 是一个基于 TypeScript 的实现,提供网页抓取、分析和信息提取工具。它具有页面抓取并转换为 Markdown、链接提取和过滤、递归网站爬行和深度控制、断开链接检查、URL 模式匹配和 XML 站点地图生成等功能。该服务器运行在 stdio 传输上,与 Claude Desktop 等 MCP 客户端兼容。代码结构良好,服务、工具和类型之间有清晰的分离。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
什么时候选它
当您需要通过 AI 代理分析网页内容、执行网站审计或生成站点地图时,选择此 MCP 服务器。
什么时候不要选它
如果您需要实时监控、有严格的性能要求,或需要访问受保护内容的身份验证,请不要选择此服务器。
此 server 暴露的工具
从 README 抽取出 6 个工具fetch-pageurl: string, selector?: stringFetches a web page and converts it to Markdown
extract-linksurl: string, baseUrl?: string, limit?: numberExtracts all links from a web page with their text
crawl-siteurl: string, maxDepth?: numberRecursively crawls a website up to a specified depth
check-linksurl: stringChecks for broken links on a page
find-patternsurl: string, pattern: stringFinds URLs matching a specific pattern
generate-site-mapurl: string, maxDepth?: number, limit?: numberGenerates a simple XML sitemap by crawling
可对比工具
安装
通过 Smithery 安装
通过 [Smithery](https://smithery.ai/server/mcp-server-webscan) 自动为 Claude Desktop 安装 Webscan:
npx -y @smithery/cli install mcp-server-webscan --client claude手动安装
# 克隆仓库
git clone <repository-url>
cd mcp-server-webscan
# 安装依赖
npm install
# 构建项目
npm run buildClaude Desktop 配置
{
"mcpServers": {
"webscan": {
"command": "node",
"args": ["path/to/mcp-server-webscan/build/index.js"],
"env": {
"NODE_ENV": "development",
"LOG_LEVEL": "info"
}
}
}
}FAQ
- 网站爬行的最大深度是多少?
- 默认最大深度为 2,但可以在 0-5 之间配置爬行站点和生成站点地图工具。
- 可以按基础 URL 过滤链接吗?
- 是的,extract-links 工具接受可选的 baseUrl 参数来过滤链接。
mcp-server-webscan 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。