crawlbase-mcp
by crawlbase·★ 55·综合分 45
Crawlbase MCP 服务器通过结构化抓取、JavaScript 渲染和反机器人保护将 AI 代理连接到实时网络数据。
web-scrapingai-llmdeveloper-tools
14
Forks
0
活跃 Issue
1 个月前
最近提交
2 天前
收录于
概述
Crawlbase MCP 是一个模型上下文协议服务器,它连接 AI 代理和实时网络,使 LLM 能够获取新鲜的、结构化的内容,而不是依赖过时的训练数据。它通过为现代 Web 应用程序提供 JavaScript 渲染、代理轮换以避免反机器人检测以及结构化输出(HTML、Markdown 或截图格式)来处理网络抓取的复杂性。该服务器支持与流行 AI 客户端的集成,如 Claude、Cursor 和 Windsurf。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:通过从竞争对手、新闻和报告中提取实时数据进行市场研究
你:实时跟踪产品、评论和价格的电子商务监控
你:能够访问当前网络信息的自主 AI 代理
你:Crawlbase MCP 有什么功能?
你:Crawlbase MCP 提供哪些命令?
什么时候选它
当您需要在 AI 工作流中获取可靠、实时的网络数据,并希望使用具有反机器人保护的成熟爬虫基础设施时,选择此服务器。
什么时候不要选它
如果您需要无限制的免费使用,或偏好自托管解决方案而不希望有供应商锁定问题,应避免使用此服务器,因为 Crawlbase 的令牌最终需要付费计划。
此 server 暴露的工具
从 README 抽取出 3 个工具crawlFetch raw HTML from a webpage
crawl_markdownExtract clean Markdown from a webpage
crawl_screenshotCapture screenshots of a webpage
可对比工具
browserless-mcpscrapingbee-mcpapify-mcpoctoparse-mcppuppeteer-mcp
安装
安装
Claude Desktop
- 打开 Claude Desktop → 设置 → 开发者 → 编辑配置
- 添加到
claude_desktop_config.json文件中:
{
"mcpServers": {
"crawlbase": {
"type": "stdio",
"command": "npx",
"args": ["@crawlbase/mcp@latest"],
"env": {
"CRAWLBASE_TOKEN": "your_token_here",
"CRAWLBASE_JS_TOKEN": "your_js_token_here"
}
}
}
}HTTP 模式(适用于多用户环境)
git clone https://github.com/crawlbase/crawlbase-mcp.git
cd crawlbase-mcp
npm install
# 启动 HTTP 服务器
CRAWLBASE_TOKEN=your_token CRAWLBASE_JS_TOKEN=your_js_token npm run start:httpFAQ
- Crawlbase MCP 有什么功能?
- Crawlbase MCP 通过结构化抓取、JavaScript 渲染和反机器人保护将 AI 代理连接到实时网络数据,在 AI 工作流中实现新鲜数据获取。
- Crawlbase MCP 提供哪些命令?
- 服务器提供三个主要命令:'crawl'(获取原始 HTML)、'crawl_markdown'(提取干净的 Markdown)和 'crawl_screenshot'(捕获截图)。
crawlbase-mcp 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。