
py-xiaozhi
by huangjunsen0406·★ 3,309·综合分 56
基于Python的小智AI语音助手,集成MCP工具,支持GUI/CLI/GPI界面和多模态交互。
ai-llmdeveloper-toolsproductivity
696
Forks
4
活跃 Issue
本月
最近提交
2 天前
收录于
概述
Py-Xiaozhi是一个基于Python实现的小智AI语音助手,允许用户在没有专用硬件的情况下体验完整的语音交互功能。项目提供AI语音交互、视觉多模态能力、智能唤醒检测、自动对话模式和MCP工具生态集成。支持多种界面模式,包括GUI(PySide6 + QML)、命令行界面和GPIO模式,兼容Windows、macOS和Linux等跨平台系统。项目架构包含插件系统、多种通信协议(WebSocket/MQTT)以及多种音频编解码功能。
试试问 AI
装完之后,这里有 6 个你可以让 AI 做的事:
你:具有多模态功能的语音控制桌面助手
你:通过语音命令和工具集成的家庭自动化
你:定制语音助手应用的开发平台
你:Py-Xiaozhi的系统要求是什么?
你:如何向系统添加自定义MCP工具?
你:Py-Xiaozhi能否离线工作?
什么时候选它
选择 py-xiaozhi 用于构建具有多模态 AI 能力的语音控制应用,尤其当您需要跨平台支持且不依赖特定硬件时。
什么时候不要选它
如果您需要纯 MCP 服务器而无需语音交互功能,或者更喜欢基于云的 AI 服务而非本地部署,则应避免使用。
此 server 暴露的工具
从 README 抽取出 6 个工具music_playPlay music through the music player
camera_captureCapture images using the camera
screenshotTake a screenshot of the current display
app_controlControl running applications
weather_queryGet weather information for a location
volume_controlAdjust system volume levels
可对比工具
xiaozhi-desktopopen-assistantvoiceflowraspberry-pi-voice-assistant
安装
# 克隆项目
git clone https://github.com/huangjunsen0406/py-xiaozhi.git
cd py-xiaozhi
# 基础安装(CLI/GPIO模式)
uv sync
# 或: pip install -e .
# GUI模式安装(额外依赖)
uv sync --extra gui
# 或: pip install -e '.[gui]'
# 运行应用
python main.py # GUI模式(默认)
python main.py --mode cli # CLI模式
python main.py --protocol mqtt # MQTT协议FAQ
- Py-Xiaozhi的系统要求是什么?
- Python >= 3.10,麦克风和扬声器,稳定的网络连接。兼容Windows 10+、macOS 10.15+和Linux系统。
- 如何向系统添加自定义MCP工具?
- 可以通过`src/plugins/mcp/tools/`目录下的插件系统添加自定义工具。项目支持通过自定义实现扩展MCP工具生态。
- Py-Xiaozhi能否离线工作?
- 唤醒词检测基于Sherpa-ONNX离线识别,但部分功能需要网络连接以进行云端AI处理。
py-xiaozhi 对比
最后更新于 · 由 README + GitHub 公开数据自动生成。