crawl4ai-mcp-server
by sadiuysal·★ 85·综合分 46
一个轻量级 MCP 服务器,为 AI 代理提供 Crawl4AI 网页抓取工具,支持 Docker 部署。
web-scrapingdeveloper-toolsai-llm
11
Forks
1
活跃 Issue
3 个月前
最近提交
2 天前
收录于
概述
Crawl4AI MCP Server 是一个专门实现的 MCP 服务器,通过模型上下文协议提供网页抓取和爬取功能。它提供四个主要工具:抓取工具用于单页内容提取,爬取工具用于多页广度优先爬取和自适应停止,网站爬取工具用于全面的网站爬取,以及站点地图爬取工具。该服务器是自托管且免费的,为 Firecrawl API 提供替代方案,同时提供类似功能。它支持多种 AI 开发环境,包括 OpenAI Agents SDK、Cursor 和 Claude Code。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:研究助手从多个网页收集信息
你:从网站提取结构化数据的分析工具
你:需要浏览和理解网页内容作为其工作流程一部分的 AI 代理
你:这个服务器与 Firecrawl 相似吗?
你:服务器实现了哪些安全功能?
什么时候选它
当需要自托管、免费的网页抓取 API 替代方案(如 Firecrawl)时,尤其是处理敏感数据或需要离线功能的情况下。
什么时候不要选它
如果需要网站高级 OCR 功能或需要带有服务等级协议的官方企业支持,不建议使用此方案。
此 server 暴露的工具
从 README 抽取出 4 个工具scrapescrape(url, output_dir, crawler, browser, script, timeout_sec)Fetch a single URL and return markdown content.
crawlcrawl(seed_url, max_depth, max_pages, same_domain_only, include_patterns, exclude_patterns, adaptive, output_dir, crawler, browser, script, timeout_sec)Multi-page breadth-first crawling with filtering and adaptive stopping.
crawl_sitecrawl_site(entry_url, output_dir, max_depth, max_pages, ...)Comprehensive site crawling with persistence.
crawl_sitemapcrawl_sitemap(sitemap_url, output_dir, max_entries, ...)Sitemap-based crawling with persistence.
可对比工具
firecrawl-mcpbrowserless-mcpscrapingbee-api
安装
使用 Docker 快速安装(推荐)
# 拉取预构建镜像
docker pull uysalsadi/crawl4ai-mcp-server:latest
# 测试安装
python test-config.py手动安装
git clone https://github.com/uysalsadi/crawl4ai-mcp-server.git
cd crawl4ai-mcp-server
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromiumClaude Desktop 配置
添加到 ~/.claude/claude_desktop_config.json:
{
"mcpServers": {
"crawl4ai-mcp": {
"command": "docker",
"args": [
"run", "--rm", "-i",
"--volume", "/tmp/crawl4ai-crawls:/app/crawls",
"uysalsadi/crawl4ai-mcp-server:latest"
],
"env": {
"CRAWL4AI_MCP_LOG": "INFO"
}
}
}
}FAQ
- 这个服务器与 Firecrawl 相似吗?
- 是的,它提供与 Firecrawl API 类似的功能,但它是自托管的且免费的,无需 API 密钥。
- 服务器实现了哪些安全功能?
- 服务器默认阻止内部网络、本地主机和私有 IP,以防止抓取敏感或私密内容。
crawl4ai-mcp-server 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。