MCP Catalogs
首页

crawlbase-mcp

by crawlbase·55·综合分 45

Crawlbase MCP 服务器通过结构化抓取、JavaScript 渲染和反机器人保护将 AI 代理连接到实时网络数据。

web-scrapingai-llmdeveloper-tools
14
Forks
0
活跃 Issue
1 个月前
最近提交
2 天前
收录于

概述

Crawlbase MCP 是一个模型上下文协议服务器,它连接 AI 代理和实时网络,使 LLM 能够获取新鲜的、结构化的内容,而不是依赖过时的训练数据。它通过为现代 Web 应用程序提供 JavaScript 渲染、代理轮换以避免反机器人检测以及结构化输出(HTML、Markdown 或截图格式)来处理网络抓取的复杂性。该服务器支持与流行 AI 客户端的集成,如 Claude、Cursor 和 Windsurf。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:通过从竞争对手、新闻和报告中提取实时数据进行市场研究
:实时跟踪产品、评论和价格的电子商务监控
:能够访问当前网络信息的自主 AI 代理
:Crawlbase MCP 有什么功能?
:Crawlbase MCP 提供哪些命令?

什么时候选它

当您需要在 AI 工作流中获取可靠、实时的网络数据,并希望使用具有反机器人保护的成熟爬虫基础设施时,选择此服务器。

什么时候不要选它

如果您需要无限制的免费使用,或偏好自托管解决方案而不希望有供应商锁定问题,应避免使用此服务器,因为 Crawlbase 的令牌最终需要付费计划。

此 server 暴露的工具

从 README 抽取出 3 个工具
  • crawl

    Fetch raw HTML from a webpage

  • crawl_markdown

    Extract clean Markdown from a webpage

  • crawl_screenshot

    Capture screenshots of a webpage

可对比工具

browserless-mcpscrapingbee-mcpapify-mcpoctoparse-mcppuppeteer-mcp

安装

安装

Claude Desktop

  1. 打开 Claude Desktop → 设置 → 开发者 → 编辑配置
  2. 添加到 claude_desktop_config.json 文件中:
{
  "mcpServers": {
    "crawlbase": {
      "type": "stdio",
      "command": "npx",
      "args": ["@crawlbase/mcp@latest"],
      "env": {
        "CRAWLBASE_TOKEN": "your_token_here",
        "CRAWLBASE_JS_TOKEN": "your_js_token_here"
      }
    }
  }
}

HTTP 模式(适用于多用户环境)

git clone https://github.com/crawlbase/crawlbase-mcp.git
cd crawlbase-mcp
npm install

# 启动 HTTP 服务器
CRAWLBASE_TOKEN=your_token CRAWLBASE_JS_TOKEN=your_js_token npm run start:http

FAQ

Crawlbase MCP 有什么功能?
Crawlbase MCP 通过结构化抓取、JavaScript 渲染和反机器人保护将 AI 代理连接到实时网络数据,在 AI 工作流中实现新鲜数据获取。
Crawlbase MCP 提供哪些命令?
服务器提供三个主要命令:'crawl'(获取原始 HTML)、'crawl_markdown'(提取干净的 Markdown)和 'crawl_screenshot'(捕获截图)。

crawlbase-mcp 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。