MCP Catalogs
首页

tokio-prompt-orchestrator

by Mattbusel·55·综合分 45

支持MCP服务器的多核Tokio LLM管道编排系统。

ai-llmdeveloper-toolsops-infra
5
Forks
2
活跃 Issue
2 个月前
最近提交
2 天前
收录于

概述

Tokio-prompt-orchestrator 是一个用 Rust 构建的生产级 LLM 编排框架。它提供高级功能,包括有界回压 DAG 处理、去重、断路器、速率限制、提示注入检测和提供商仲裁。该系统支持 MCP(模型上下文协议)集成,用于 Claude Desktop,同时提供 REST、WebSocket 和其他 API。它支持多种 LLM 后端,包括 Anthropic、OpenAI、llama.cpp 和 vLLM。

试试问 AI

装完之后,这里有 5 个你可以让 AI 做的事:

:企业级 LLM API 编排,支持提供商故障转移和成本优化
:具有提示注入保护和请求去重的生产 LLM 服务
:多模型部署,支持负载均衡和自适应工作池调整
:支持哪些 LLM 提供商?
:去重功能如何工作?

什么时候选它

当您需要一个生产就绪、多核心的LLM流水线编排系统,具有提供商套利和请求去重等高级功能时选择它。

什么时候不要选它

如果您需要简单的单提供商解决方案,或者您的技术栈中没有使用Rust/Tokio,请避免使用它。

此 server 暴露的工具

从 README 抽取出 12 个工具
  • create_ab_test

    Create or replace an A/B testing experiment for prompt variants

  • get_ab_test

    Retrieve details of a specific A/B test experiment

  • create_session

    Create a new conversation session with optional system prompt

  • append_message

    Add a message to an existing conversation session

  • get_session

    Retrieve metadata and messages from a session

  • delete_session

    Remove a conversation session entirely

  • render_template

    Render a prompt template with variable substitution

  • register_template

    Store a new named prompt template for later use

  • list_templates

    Show all available prompt templates

  • query_audit_log

    Search and filter the audit log of LLM requests

  • get_audit_stats

    Get aggregate statistics from the audit log

  • export_audit_log

    Download all audit log entries as JSONL

说明:Inferred tool names from REST API endpoints and documentation. The README shows API endpoints but doesn't explicitly list them as MCP tools.

可对比工具

llama-cpp-mcpopenai-mcpanthropic-mcpvllm-mcp

安装

添加到您的 Cargo.toml:

tokio-prompt-orchestrator = "1.9"

对于 Claude Desktop MCP 集成,添加到 claude_desktop_config.json:

{
  "mcpServers": {
    "tokio-prompt-orchestrator": {
      "command": "cargo",
      "args": ["run", "--release", "--package", "tokio-prompt-orchestrator", "--", "--mcp"]
    }
  }
}

FAQ

支持哪些 LLM 提供商?
该系统通过其可扩展架构支持 Anthropic、OpenAI、llama.cpp、vLLM 以及任何自定义后端。
去重功能如何工作?
它使用 SHA-256 哈希识别相同的飞行中请求,将它们合并为单个后端调用,并设置 30 秒 TTL 以防止内存泄漏。

Hacker News 讨论

开发者社区最近的相关讨论。

tokio-prompt-orchestrator 对比

GitHub →

最后更新于 · 由 README + GitHub 公开数据自动生成。