MCP Catalogs
首页gemini-skill screenshot

gemini-skill

by WJZ-P·813·综合分 52

通过浏览器自动化实现 Google Gemini AI 生图、对话和图片提取的 MCP 服务器。

ai-llmbrowser-automationproductivity
121
Forks
7
活跃 Issue
1 个月前
最近提交
2 天前
收录于

概述

Gemini-Skill 是一个通过 Chrome DevTools Protocol (CDP) 控制 Google Gemini 网页界面的综合 MCP 服务器。它提供对 Gemini 功能的自动化访问,包括 AI 图像生成及高清下载、多轮对话、图像上传生成以及从会话中提取图像。服务器采用守护进程模式,在后台维护浏览器实例,实现快速后续请求而无需每次重新启动浏览器。

试试问 AI

装完之后,这里有 4 个你可以让 AI 做的事:

:通过 AI 助手根据文本提示生成图像
:自动执行与 Gemini 的多轮对话
:自动提取和下载会话中的图像
:将 Gemini 功能集成到 AI 工作流中

什么时候选它

当您需要在 AI 工作流中使用 Gemini 进行 AI 图片生成,并需要具有隐形功能的持久浏览器自动化时,选择此 MCP 服务器。

什么时候不要选它

如果您需要直接访问 Gemini API 而非浏览器自动化,或需要尚未支持的多浏览器并行处理,应避免使用此服务器。

此 server 暴露的工具

从 README 抽取出 12 个工具
  • gemini_generate_imagegemini_generate_image(prompt, newSession, referenceImages, fullSize, timeout)

    Generate an image through Gemini AI with prompt

  • gemini_new_chatgemini_new_chat()

    Start a new blank conversation with Gemini

  • gemini_temp_chatgemini_temp_chat()

    Enter temporary conversation mode with Gemini

  • gemini_switch_modelgemini_switch_model(model)

    Switch between different Gemini models

  • gemini_send_messagegemini_send_message(message, timeout)

    Send a text message to Gemini and wait for a reply

  • gemini_upload_imagesgemini_upload_images(images)

    Upload images to Gemini as reference for image generation

  • gemini_get_imagesgemini_get_images()

    Retrieve all image metadata from the current conversation

  • gemini_extract_imagegemini_extract_image(imageUrl)

    Extract an image as base64 and save it locally

  • gemini_download_full_size_imagegemini_download_full_size_image(index)

    Download the full-size high-resolution version of an image

  • gemini_share_latest_imagegemini_share_latest_image(index, timeout, copyToClipboard, closeDialog)

    Create a public share link for the latest image

  • gemini_get_all_text_responsesgemini_get_all_text_responses()

    Get all text responses from the current conversation

  • gemini_get_latest_text_responsegemini_get_latest_text_response()

    Get the latest text response from Gemini

可对比工具

google-gemini-api-mcpbrowser-mcppuppeteer-mcp

安装

安装

前置条件

  • Node.js ≥ 18
  • Chrome/Edge/Chromium 浏览器并已登录 Google 账号

步骤

git clone https://github.com/WJZ-P/gemini-skill.git
cd gemini-skill
npm install

配置

在项目根目录创建 .env 文件:

BROWSER_DEBUG_PORT=40821
BROWSER_HEADLESS=false
DAEMON_TTL_MS=1800000
OUTPUT_DIR=./gemini-image

Claude Desktop 配置

添加到 Claude Desktop 的 claude_desktop_config.json

{
  "mcpServers": {
    "gemini": {
      "command": "node",
      "args": ["<gemini-skill绝对路径>/src/mcp-server.js"]
    }
  }
}

gemini-skill 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。