MCP Catalogs
首页

crawl4ai-mcp-server

by sadiuysal·85·综合分 46

一个轻量级 MCP 服务器,为 AI 代理提供 Crawl4AI 网页抓取工具,支持 Docker 部署。

web-scrapingdeveloper-toolsai-llm
11
Forks
1
活跃 Issue
3 个月前
最近提交
2 天前
收录于

概述

Crawl4AI MCP Server 是一个专门实现的 MCP 服务器,通过模型上下文协议提供网页抓取和爬取功能。它提供四个主要工具:抓取工具用于单页内容提取,爬取工具用于多页广度优先爬取和自适应停止,网站爬取工具用于全面的网站爬取,以及站点地图爬取工具。该服务器是自托管且免费的,为 Firecrawl API 提供替代方案,同时提供类似功能。它支持多种 AI 开发环境,包括 OpenAI Agents SDK、Cursor 和 Claude Code。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:研究助手从多个网页收集信息
:从网站提取结构化数据的分析工具
:需要浏览和理解网页内容作为其工作流程一部分的 AI 代理
:这个服务器与 Firecrawl 相似吗?
:服务器实现了哪些安全功能?

什么时候选它

当需要自托管、免费的网页抓取 API 替代方案(如 Firecrawl)时,尤其是处理敏感数据或需要离线功能的情况下。

什么时候不要选它

如果需要网站高级 OCR 功能或需要带有服务等级协议的官方企业支持,不建议使用此方案。

此 server 暴露的工具

从 README 抽取出 4 个工具
  • scrapescrape(url, output_dir, crawler, browser, script, timeout_sec)

    Fetch a single URL and return markdown content.

  • crawlcrawl(seed_url, max_depth, max_pages, same_domain_only, include_patterns, exclude_patterns, adaptive, output_dir, crawler, browser, script, timeout_sec)

    Multi-page breadth-first crawling with filtering and adaptive stopping.

  • crawl_sitecrawl_site(entry_url, output_dir, max_depth, max_pages, ...)

    Comprehensive site crawling with persistence.

  • crawl_sitemapcrawl_sitemap(sitemap_url, output_dir, max_entries, ...)

    Sitemap-based crawling with persistence.

可对比工具

firecrawl-mcpbrowserless-mcpscrapingbee-api

安装

使用 Docker 快速安装(推荐)

# 拉取预构建镜像
docker pull uysalsadi/crawl4ai-mcp-server:latest

# 测试安装
python test-config.py

手动安装

git clone https://github.com/uysalsadi/crawl4ai-mcp-server.git
cd crawl4ai-mcp-server
python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromium

Claude Desktop 配置

添加到 ~/.claude/claude_desktop_config.json

{
  "mcpServers": {
    "crawl4ai-mcp": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "--volume", "/tmp/crawl4ai-crawls:/app/crawls",
        "uysalsadi/crawl4ai-mcp-server:latest"
      ],
      "env": {
        "CRAWL4AI_MCP_LOG": "INFO"
      }
    }
  }
}

FAQ

这个服务器与 Firecrawl 相似吗?
是的,它提供与 Firecrawl API 类似的功能,但它是自托管的且免费的,无需 API 密钥。
服务器实现了哪些安全功能?
服务器默认阻止内部网络、本地主机和私有 IP,以防止抓取敏感或私密内容。

crawl4ai-mcp-server 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。