crawl4ai-mcp-server

Name: crawl4ai-mcp-server
Rating: 2.3 (85 reviews)
Author: sadiuysal

by sadiuysal·★ 85·综合分 46

一个轻量级 MCP 服务器，为 AI 代理提供 Crawl4AI 网页抓取工具，支持 Docker 部署。

web-scrapingdeveloper-toolsai-llm

Forks

活跃 Issue

5 个月前

概述

Crawl4AI MCP Server 是一个专门实现的 MCP 服务器，通过模型上下文协议提供网页抓取和爬取功能。它提供四个主要工具：抓取工具用于单页内容提取，爬取工具用于多页广度优先爬取和自适应停止，网站爬取工具用于全面的网站爬取，以及站点地图爬取工具。该服务器是自托管且免费的，为 Firecrawl API 提供替代方案，同时提供类似功能。它支持多种 AI 开发环境，包括 OpenAI Agents SDK、Cursor 和 Claude Code。

试试问 AI

装完之后，这里有 5 个你可以让 AI 做的事：

你:研究助手从多个网页收集信息

你:从网站提取结构化数据的分析工具

你:需要浏览和理解网页内容作为其工作流程一部分的 AI 代理

你:这个服务器与 Firecrawl 相似吗？

你:服务器实现了哪些安全功能？

什么时候选它

当需要自托管、免费的网页抓取 API 替代方案（如 Firecrawl）时，尤其是处理敏感数据或需要离线功能的情况下。

什么时候不要选它

如果需要网站高级 OCR 功能或需要带有服务等级协议的官方企业支持，不建议使用此方案。

此 server 暴露的工具

从 README 抽取出 4 个工具

scrapescrape(url, output_dir, crawler, browser, script, timeout_sec)
Fetch a single URL and return markdown content.
crawlcrawl(seed_url, max_depth, max_pages, same_domain_only, include_patterns, exclude_patterns, adaptive, output_dir, crawler, browser, script, timeout_sec)
Multi-page breadth-first crawling with filtering and adaptive stopping.
crawl_sitecrawl_site(entry_url, output_dir, max_depth, max_pages, ...)
Comprehensive site crawling with persistence.
crawl_sitemapcrawl_sitemap(sitemap_url, output_dir, max_entries, ...)
Sitemap-based crawling with persistence.

可对比工具

firecrawl-mcpbrowserless-mcpscrapingbee-api

安装

使用 Docker 快速安装（推荐）

# 拉取预构建镜像
docker pull uysalsadi/crawl4ai-mcp-server:latest

# 测试安装
python test-config.py

手动安装

git clone https://github.com/uysalsadi/crawl4ai-mcp-server.git
cd crawl4ai-mcp-server
python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromium

Claude Desktop 配置

添加到 ~/.claude/claude_desktop_config.json：

{
  "mcpServers": {
    "crawl4ai-mcp": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "--volume", "/tmp/crawl4ai-crawls:/app/crawls",
        "uysalsadi/crawl4ai-mcp-server:latest"
      ],
      "env": {
        "CRAWL4AI_MCP_LOG": "INFO"
      }
    }
  }
}

FAQ

这个服务器与 Firecrawl 相似吗？: 是的，它提供与 Firecrawl API 类似的功能，但它是自托管的且免费的，无需 API 密钥。
服务器实现了哪些安全功能？: 服务器默认阻止内部网络、本地主机和私有 IP，以防止抓取敏感或私密内容。

crawl4ai-mcp-server 对比

crawl4ai-mcp-server vs ultimate_mcp_server crawl4ai-mcp-server vs mcp-server-chart crawl4ai-mcp-server vs everything crawl4ai-mcp-server vs filesystem crawl4ai-mcp-server vs time

GitHub →

最后更新于 2026-05-17 · 由 README + GitHub 公开数据自动生成。