网页抓取
爬虫、抓取器、网页结构化数据提取。
100 个 MCP server 在此分类下
- #01fetch官方★ 85,74876
一个MCP服务器,抓取网页内容并将HTML转换为Markdown,让大模型能读取网页信息。
- #02akshare-one-mcp★ 17275
通过 akshare-one API 提供全面的中国股市数据的 MCP 服务器。
- #03chrome-devtools-mcp★ 39,75765
Chrome DevTools MCP 服务器让 AI 编码代理通过 MCP 协议控制和检查实时 Chrome 浏览器。
- #04Scrapling★ 50,34662
自适应网页抓取框架,具备解析能力和反爬虫功能,现已集成为 MCP 服务器。
- #05gpt-researcher★ 27,10061
一个自主研究代理,使用任何 LLM 提供商进行深度研究,并通过 MCP 服务器连接专业数据源。
- #06firecrawl-mcp-server★ 6,31760
官方 Firecrawl MCP 服务器为兼容 MCP 的 AI 代理提供网页抓取、搜索和页面交互功能。
- #07fastapi_mcp★ 11,86360
FastAPI-MCP 将 FastAPI 端点作为 MCP 工具暴露,内置身份验证功能。
- #08xiaohongshu-mcp★ 13,61659
一个用于自动化小红书操作(发布内容、评论、用户互动等)的 MCP 服务器。
- #09XHS-Downloader★ 11,17259
XHS-Downloader 是一个支持 API 和 MCP 调用的小红书内容下载工具。
- #10exa-mcp-server★ 4,43659
支持多种AI客户端的Exa网络搜索和网络爬取功能的MCP服务器。
- #11brightdata-mcp★ 2,36657
一个强大的 MCP 服务器,为 AI 代理提供无阻塞的实时网络访问能力。
- #12design-extract★ 2,64057
一个全面的MCP服务器,可以从网站中提取设计系统,生成标记、组件和多平台输出。
- #13linkedin-mcp-server★ 1,90056
通过浏览器自动化提供LinkedIn API访问的MCP服务器,支持档案、公司、职位和消息功能。
- #14ENScan_GO★ 4,39256
ENScan_GO 是一款支持 MCP 服务器功能的中国企业信息收集工具。
- #15apify-mcp-server★ 1,22355
Apify MCP 服务器让 AI 代理使用数千个预构建的爬虫和自动化工具提取网络数据。
- #16mcp-gsc★ 84355
将 Google Search Console 与 AI 助手连接的 MCP 服务器,支持通过自然语言对话进行 SEO 分析。
- #17webclaw★ 1,15555
基于 Rust 的快速本地优先网页内容提取工具,具有为 AI 代理设计的 MCP 服务器。
- #18stealth-browser-mcp★ 64354
Stealth Browser MCP 提供反检测浏览器自动化功能,专为 MCP 兼容的 AI 代理设计。
- #19MCP★ 68054
Jina AI 远程 MCP 服务器提供网页搜索、内容阅读和AI工具,支持URL过滤功能。
- #20mcp★ 45953
高效的 Cloudflare API MCP 服务器,通过 Code Mode 提供 2500 个终端访问。
- #21redd-archiver★ 33352
PostgreSQL 支持的归档生成器,可从链接聚合平台创建可浏览的 HTML 归档,并提供 MCP server 集成。
- #22mcp★ 6,51051
Browser MCP 让 AI 应用程序能够本地控制浏览器,实现自动化任务。
- #23flyto-core★ 27051
一个AI代理自动化MCP服务器,拥有412个模块、执行追踪、回放功能和内置模板。
- #24XActions★ 26551
XActions 是一个全面的 X/Twitter 自动化工具包,包含 AI 代理的 MCP 服务器集成。
- #25google-surf-mcp★ 16950
一个无需 API 密钥的强大 Google MCP 服务器,集成搜索、内容提取和学术论文分析功能。
- #26kindly-web-search-mcp-server★ 32550
专为AI编程工具设计的MCP服务器,提供强大的网络搜索和内容检索功能。
- #27firefox-devtools-mcp★ 16250
Mozilla 开发的 MCP 服务器,通过 WebDriver BiDi 自动化 Firefox 开发工具,让 AI 助手可以控制和检查浏览器功能。
- #28charlotte★ 14250
高效浏览器 MCP 服务器,为 AI 代理提供结构化网页访问能力。
- #29mcp-screenshot-website-fast★ 10650
为AI视觉工作流优化的MCP服务器,能快速截图网页并自动分割。
- #30web3-research-mcp★ 15349
本地MCP服务器,可全面研究多种加密货币来源。
- #31browser-use-mcp-server★ 82249
MCP 服务器让 AI 智能体能通过 browser-use 控制浏览器。
- #32web-scout-mcp★ 12849
一个强大的 MCP 服务器,提供通过 DuckDuckGo 集成的网络搜索和内容提取功能。
- #33RivalSearchMCP★ 8949
RivalSearchMCP 是一个全面的研究型 MCP 服务器,提供对 5 个网络引擎、9 个社交平台、学术数据库、新闻来源和文档分析的确定性搜索。
- #34safari-mcp★ 6349
通过 AppleScript 提供 80 种工具的 Safari 原生浏览器自动化,零开销,比 Chrome DevTools 更省 CPU。
- #35facebook-ads-library-mcp★ 22549
Facebook广告库MCP服务器,可查询和分析广告活动,支持批量处理和视频分析功能。
- #36apitap★ 8348
ApiTap 通过 MCP 服务器将任何网站转化为 API,提供预映射端点和流量捕获功能。
- #37youtube-connector-mcp★ 7148
MCP 服务器,让 AI 助手可以搜索 YouTube 视频、频道、播放列表和字幕。
- #38Kagi-Session2API-MCP★ 13448
免费的Kagi搜索MCP服务器,使用会话令牌而非付费API,可与多个MCP客户端配合使用。
- #39web-agent-protocol★ 49748
Web Agent Protocol 记录浏览器交互并转换为 MCP 服务器,实现网页自动化重放。
- #40hanzi-browse★ 16148
MCP 服务器,让 AI 智能体能够使用浏览器自动化与复杂网站交互,提供特定网站的使用指导。
- #41oxylabs-mcp★ 9548
Oxylabs MCP 服务器使 AI 模型能够抓取并与真实世界网站交互。
- #42powhttp-mcp★ 7148
一个MCP服务器,让AI助手能够分析由powhttp捕获的HTTP流量,并提供高级调试功能。
- #43scrapegraph-mcp★ 7248
ScrapeGraph MCP 服务器提供 AI 驱动的网页抓取工具,包括提取、搜索、爬取、模式生成和监控功能。
- #44mcp-read-website-fast★ 14648
一个快速、高效的MCP服务器,可将网站转换为干净的Markdown文本,供AI代理使用。
- #45reddit-mcp★ 28548
通过 PRAW API 提供 Reddit 数据访问的 MCP 服务器,具有只读和身份验证功能。
- #46agentql-mcp★ 17048
AgentQL MCP服务器通过单个工具实现结构化网页数据提取,支持多个MCP客户端的清晰配置。
- #47RedNote-MCP★ 1,05347
小红书MCP服务器,提供笔记搜索和URL内容获取功能
- #48puppeteer-mcp-claude★ 3847
基于 Puppeteer 的浏览器自动化 MCP 服务器,为 Claude 提供网页控制、截图和交互能力。
- #49rust-docs-mcp★ 12447
功能全面的 MCP 服务器,为 AI 代理提供 Rust 包文档、源码分析、依赖关系和模块结构。
- #50parallel-browser-mcp★ 9947
一个支持多云提供商并行浏览器自动化、基于会话控制的MCP服务器
- #51tradingview-chart-mcp★ 9347
通过 Selenium 捕获 TradingView 图表图像的 MCP 服务器,使用浏览器池实现并发性能优化。
- #52reddit-research-mcp★ 11347
Reddit研究MCP服务器,提供竞争分析、客户发现和市场洞察,支持语义搜索功能。
- #53comet-mcp★ 15547
MCP服务器连接Claude Code与Perplexity Comet浏览器,实现智能网络浏览和研究功能。
- #54mcp-rest-api★ 9547
TypeScript MCP 服务器,可通过 Cline 等 MCP 客户端测试 REST API。
- #55crw★ 8847
快速轻量的Firecrawl替代品,用Rust开发,提供MCP服务器用于AI代理。网页抓取、爬取和搜索API。
- #56camofox-mcp★ 6147
反检测浏览器 MCP 服务器,提供47个自动化工具,可无障碍地进行网页交互。
- #57mcp-graphql★ 38547
MCP 服务器使 LLM 能够通过模式内省和查询执行与 GraphQL API 交互。
- #58one-search-mcp★ 11447
OneSearch MCP 服务器提供网络搜索、抓取和内容提取功能,支持多个搜索引擎和本地浏览器自动化。
- #59google-researcher-mcp★ 3546
MCP 服务器提供谷歌搜索、网页抓取和文档解析功能,具有高级过滤能力。
- #60x-twitter-scraper★ 8246
MCP 服务器提供两个工具,通过100多个端点实现 Twitter/X 数据提取和 API 交互。
- #61mcp-design-system-extractor★ 6446
MCP 服务器可从 Storybook 设计系统提取 HTML、样式和组件元数据,辅助开发工作。
- #62DrissionPageMCP★ 21446
基于DrissionPage和FastMCP的浏览器自动化MCP服务器,提供AI调用的网页操作API。
- #63crawl4ai-mcp-server★ 8546
一个轻量级 MCP 服务器,为 AI 代理提供 Crawl4AI 网页抓取工具,支持 Docker 部署。
- #64token-enhancer★ 6446
MCP服务器,可清理网页文本,减少86-99%的token使用。
- #65open-browser-use★ 8346
跨平台浏览器自动化MCP服务器,支持AI代理、CLI和多语言SDK。
- #66cortex-scout★ 6546
为AI代理提供统一网页抓取和有状态自动化引擎,支持MCP集成。
- #67mcp-link★ 60545
MCP Link 可将任何 OpenAPI V3 API 自动转换为功能完整的 MCP 服务器。
- #68kernel-mcp-server★ 3045
Kernel MCP 服务器通过 MCP 协议提供安全的云浏览器自动化和应用程序管理功能。
- #69google-search★ 59545
基于Playwright的Google搜索工具,通过MCP服务器集成绕过反机器人检测。
- #70crawlbase-mcp★ 5545
Crawlbase MCP 服务器通过结构化抓取、JavaScript 渲染和反机器人保护将 AI 代理连接到实时网络数据。
- #71mcp-browser-agent★ 3845
为 Claude 提供浏览器自动化能力的 MCP 服务器,支持 DOM 操作、JavaScript 执行和 API 请求。
- #72sample-agentic-ai-web★ 5045
Amazon Bedrock 网页自动化助手,具有 MCP 服务器支持浏览器自动化和视觉功能。
- #73mcp-llms-txt-explorer★ 7445
一个用于发现和分析带有 llms.txt 文件的网站的 MCP 服务器。
- #74opencode-browser★ 4645
OpenCode 的 MCP 插件,通过 Browser MCP 集成实现浏览器自动化功能。
- #75mcp-server-weibo★ 4545
功能完善的微博数据 MCP 服务器,支持自动认证并提供 HTTP 和 stdio 接口。
- #76plasmate★ 2145
Plasmate 是一个专为智能体设计的浏览器引擎,通过 MCP 将 HTML 转换为紧凑的语义对象模型 (SOM)。
- #77html-to-markdown-mcp★ 2445
一个使用 Turndown.js 将 HTML 转换为 Markdown 的 MCP 服务器,带有 SSRF 保护功能。
- #78decipher-research-agent★ 15145
使用 MCP 服务器的 AI 驱动研究助手,可从网络来源创建交互式笔记本。
- #79webmcp-bridge★ 2544
一个通过 Playwright 将本地 MCP 客户端连接到浏览器 WebMCP 工具的桥梁,支持原生和注入式适配器。
- #80mcp-reddit★ 40044
MCP 服务器,用于获取和分析 Reddit 内容,支持不同类型的帖子。
- #81cdpilot★ 2544
零依赖浏览器自动化CLI,带有MCP服务器,为AI代理提供70+命令和隐身模式。
- #82WEBGhosting-MCP★ 2944
智能隐身浏览器 MCP 服务器,具有反指纹识别功能,可让 AI 代理安全浏览网页。
- #83linkup-mcp-server★ 2844
Linkup MCP服务器提供网页搜索和内容抓取功能,支持实时数据和深度选项。
- #84extract-llms-docs★ 3044
一个从网站提取 llms.txt 文档供 AI 使用的 MCP 服务器。
- #85mcp-expose-abilities★ 2544
WordPress MCP服务器,提供61个核心能力和12个插件,支持AI代理进行内容、SEO和网站管理。
- #86real-browser-mcp★ 2043
MCP服务器 + Chrome扩展,让AI智能体能控制真实浏览器会话,保持现有登录和Cookie。
- #87mcp-wayback-machine★ 2443
用于互联网档案馆 Wayback Machine 的 MCP 服务器,提供 CDX 搜索、快照检索和对比功能。
- #88astro-mcp★ 5843
为 Astro 项目提供项目信息、运行时数据、文档搜索和集成数据的 MCP 服务器。
- #89BrowseAI-Dev★ 1743
BrowseAI Dev 是一个基于证据的网络搜索 MCP 服务器,提供引文和置信度评分,减少 AI 幻觉。
- #90mcp-twikit★ 23343
一个MCP服务器,提供Twitter搜索、时间线获取和情感分析功能。
- #91builtwith-api★ 2043
一个强大的 MCP 服务器,通过 LLM 代理暴露 13 个 BuiltWith API 工具,用于网站技术分析。
- #92trading-mcp★ 7143
Trading MCP 服务器提供股票筛选、基本面分析、内部交易、社交情绪和新闻分析功能。
- #93puppeteer-mcp-server★ 1942
自托管 Puppeteer MCP 服务器,提供浏览器自动化工具,支持多种传输方式和 API 密钥认证。
- #94webfetch-mcp★ 2641
MCP服务器提供实时网络访问功能,支持可调搜索和干净内容提取,适用于本地AI模型。
- #95izan.io★ 2941
Chrome扩展,将浏览器转化为AI自动化工具的MCP服务器。
- #96mcp-aoai-web-browsing★ 3341
基于FastMCP的MCP服务器,通过Playwright实现浏览器自动化,支持Azure和OpenAI API。
- #97mcp-webresearch★ 29741
MCP 服务器,让 Claude 能够进行网络研究,支持谷歌搜索、网页提取和截图功能。
- #98mcp-server-any-openapi★ 8240
一个MCP服务器,通过语义搜索OpenAPI规范,让Claude能够发现和调用任何API端点。
- #99Custom-MCP-Server★ 7540
一个提供LinkedIn、Facebook、Instagram和Google搜索抓取工具的MCP服务器。
- #100scraperapi-mcp★ 439
ScraperAPI MCP 服务器让 LLM 能够使用 ScraperAPI 检索和处理网页抓取请求。