MCP Catalogs
首页

ai-testing-mcp

by groovy-web·18·综合分 43

全面的MCP服务器,提供AI测试、评估和质量保证的标准化方法。

ai-llmdeveloper-toolsmonitoring
1
Forks
0
活跃 Issue
2 个月前
最近提交
2 天前
收录于

概述

AI Testing MCP 是一个专业的模型上下文协议(MCP)服务器,为AI/ML系统提供标准化的测试方法、评估指标和自动化测试工作流。它实现了MCP规范,可与AI开发工具无缝集成,提供全面的测试功能,包括单元测试、集成测试、性能测试、安全测试和质量测试,并包含准确性、质量、安全性、性能和成本效率等详细评估指标。

试试问 AI

装完之后,这里有 3 个你可以让 AI 做的事:

:开发流水线中的AI模型验证和质量保证
:针对提示注入和对抗性攻击的自动化安全测试
:AI系统的性能基准测试和优化

什么时候选它

当您需要对 AI 模型进行多维度标准化评估,并希望将测试直接集成到 AI 开发工作流程中时,选择 AI Testing MCP。

什么时候不要选它

如果您的自定义模型架构不被 OpenAI/Anthropic 支持,或者您需要具有广泛可视化功能的测试框架,请避免使用。

此 server 暴露的工具

从 README 抽取出 3 个工具
  • run_test_suiterun_test_suite(model, testCategory, testCases)

    Execute a comprehensive test suite for an AI model

  • evaluate_outputevaluate_output(output, expected, metrics)

    Evaluate AI model outputs against metrics

  • generate_test_casesgenerate_test_cases(scenario, count)

    Generate test cases for specific scenarios

可对比工具

mlflowlangchain-testweaviate-mcp

安装

# 克隆仓库
git clone https://github.com/groovy-web/ai-testing-mcp.git
cd ai-testing-mcp

# 安装依赖
npm install

# 配置环境
cp .env.example .env
# 编辑您的API密钥

# 启动MCP服务器
npm start

添加到Claude Desktop配置中:

{
  "mcpServers": {
    "ai-testing": {
      "command": "node",
      "args": ["/path/to/ai-testing-mcp/dist/index.js"],
      "env": {
        "OPENAI_API_KEY": "your-key",
        "ANTHROPIC_API_KEY": "your-key"
      }
    }
  }
}

ai-testing-mcp 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。