llm-app-exploration
by ForrestKim42·★ 23·综合分 43
通过可访问性 API 进行自动化应用探索的 MCP 服务器,构建完整的 UI 图和转换表。
developer-toolsai-llmproductivity
4
Forks
1
活跃 Issue
1 个月前
最近提交
2 天前
收录于
概述
这个仓库展示了一种模式,让 LLM 智能体通过设备访问系统地探索任何应用程序(移动或桌面)。该方法使用可访问性 API 而不是基于视觉的方法,将应用视为图结构,其中每个屏幕是一个节点,交互元素是边。过程包括三个阶段:探索(捕获每个屏幕和元素)、组织(构建路线图和转换表)和分析(使用完整数据进行用户流程、竞争分析和 UX 审计)。两个 MCP 服务器实现了此模式:mobile-mcp 用于 Android/iOS,desktop-mcp 用于 macOS 原生应用和 Electron 应用。
试试问 AI
装完之后,这里有 5 个你可以让 AI 做的事:
你:对移动和桌面应用程序进行系统性 UI 映射和文档编制
你:通过探索整个应用生态系统进行自动化竞争分析
你:为自动化测试或用户辅助构建确定性用户流程
你:支持哪些平台?
你:元素识别是如何工作的?
什么时候选它
当你需要系统化、全面的应用探索而非基于视觉的UI自动化时,特别是无障碍优先分析场景。
什么时候不要选它
不要选择它进行基于视觉的UI自动化,或当需要超出已实现平台(Android、iOS、macOS)的跨平台支持时。
此 server 暴露的工具
从 README 抽取出 2 个工具mobile_doReads the screen and executes actions on mobile devices using accessibility tree
desktop_doReads the screen and executes actions on desktop apps via accessibility API or Chrome DevTools Protocol
可对比工具
browserless-mcppuppeteer-mcpplaywright-mcpmobile-mcpdesktop-mcp
安装
安装
mobile-mcp (Android/iOS)
- 克隆仓库:
git clone https://github.com/ForrestKim42/mobile-mcp.git - 遵循特定于平台的 Android 或 iOS 设置说明
- 添加到您的 MCP 配置中:
{
"mcpServers": {
"mobile": {
"command": "node",
"args": ["/path/to/mobile-mcp/index.js"]
}
}
}desktop-mcp (macOS)
- 克隆仓库:
git clone https://github.com/ForrestKim42/desktop-mcp.git - 遵循 macOS 可访问性权限设置说明
- 添加到您的 MCP 配置中:
{
"mcpServers": {
"desktop": {
"command": "node",
"args": ["/path/to/desktop-mcp/index.js"]
}
}
}FAQ
- 支持哪些平台?
- 此模式支持移动设备(Android、iOS)和桌面(macOS 原生应用、Electron 应用)。每个平台都有其自己的 MCP 服务器实现。
- 元素识别是如何工作的?
- 元素通过格式为 'TYPE:Label' 的稳定 ID 进行标识(例如 'BUTTON:Save')。此格式在会话和平台之间保持一致,使目标确定。
llm-app-exploration 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。