MCP Catalogs
首页

brightdata-mcp-adk-hackathon

by arjunprabhulal·1·综合分 34

BrightData MCP 服务器,集成 50+ 工具和 Google ADK,提供专业网页抓取服务。

web-scrapingdeveloper-toolsai-llm
1
Forks
0
活跃 Issue
12 个月前
最近提交
2 天前
收录于

概述

这是一个完整的网页抓取平台,结合了 BrightData 的 MCP 服务器和 Google 的代理开发工具包。它提供了包含 React 前端、FastAPI 后端和通过 BrightData 代理网络的企业级抓取功能的完整解决方案。该系统支持多种数据提取场景,包括电子商务、社交媒体和商业数据,由 Google Gemini 2.0 Flash 提供智能工具选择支持。

试试问 AI

装完之后,这里有 7 个你可以让 AI 做的事:

:电商价格比较和产品数据提取
:社交媒体趋势分析和内容监控
:商业情报和竞争研究
:新闻聚合和内容分析
:这个平台可以抓取哪些类型的网站?
:这个平台与其他网页抓取工具有什么不同?
:速率限制和定价如何?

什么时候选它

如果您需要全面的网页抓取功能,拥有针对各种数据源的专业工具,并且已经使用或愿意集成 BrightData 的代理网络,请选择此方案。

什么时候不要选它

如果您需要无厂商锁定的开源解决方案,或者只需要基本抓取功能而不需要 BrightData 提供的专业工具,请不要选择此方案。

此 server 暴露的工具

从 README 抽取出 12 个工具
  • search_engine

    Multi-engine search results from Google, Bing, Yandex

  • scrape_as_markdown

    Clean webpage extraction to markdown format

  • scraping_browser_amazon

    Extract product information from Amazon

  • scraping_browser_walmart

    Extract product information from Walmart

  • scraping_browser_ebay

    Extract product information from eBay

  • scraping_linkedin

    Extract professional data from LinkedIn

  • scraping_instagram

    Extract social media data from Instagram

  • scraping_youtube

    Extract video data from YouTube

  • scraping_crunchbase

    Extract business data from Crunchbase

  • scraping_yahoo_finance

    Extract financial data from Yahoo Finance

  • scraping_google_maps

    Extract location data from Google Maps

  • scraping_zillow

    Extract real estate data from Zillow

可对比工具

browserless-mcpscrapingbee-mcpfirecrawl-mcpoctoscrape-mcp

安装

安装

前置要求

  • Python 3.11+
  • Node.js 20+
  • Docker & Docker Compose
  • BrightData API 凭据
  • Google AI API 密钥

快速开始

  1. 克隆仓库:
git clone https://github.com/arjunprabhulal/brightdata-mcp-adk-hackathon.git
cd brightdata-mcp-adk-hackathon
  1. 配置环境:
cp backend/config/.env.example backend/config/.env
# 编辑 .env 文件添加您的 API 凭据
  1. 使用 Docker 启动:
docker compose up -d

Claude Desktop 配置

{
  "mcpServers": {
    "brightdata-mcp": {
      "command": "python",
      "args": ["path/to/brightdata/mcp/server.py"],
      "env": {
        "BRIGHTDATA_API_TOKEN": "your_token_here"
      }
    }
  }
}

FAQ

这个平台可以抓取哪些类型的网站?
该平台支持抓取各种类型的网站,包括电子商务平台(亚马逊、沃尔玛)、社交媒体(领英、Instagram)、新闻来源、商业数据平台以及通过 BrightData 代理网络具有反机器人保护的自定义网站。
这个平台与其他网页抓取工具有什么不同?
该平台将 BrightData 的 MCP 服务器与 Google 的代理开发工具包和 Gemini 2.0 Flash AI 相结合,能够实现智能工具选择以实现最佳抓取效果。它提供包含 UI、API 和企业基础设施的完整解决方案,而不仅仅是抓取库。
速率限制和定价如何?
定价和速率限制取决于您的 BrightData 订阅计划和 API 使用情况。该平台包含用于管理 API 令牌和身份验证凭据的环境变量配置。

brightdata-mcp-adk-hackathon 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。