AgentScope 中的实时语音处理 (Realtime Voice)
范围:本文档深入研究 AgentScope 如何实现实时语音处理,包括其多模型适配、事件驱动架构以及独特的“语音 聊天室”多智能体交互机制。
异步流式、WebSocket 模式和实时通信
查看所有标签范围:本文档深入研究 AgentScope 如何实现实时语音处理,包括其多模型适配、事件驱动架构以及独特的“语音 聊天室”多智能体交互机制。
Related topics: [[streaming-comparison]]
范围:深入分析 OpenAI Codex 的流式处理机制,包括 WebSocket 实时对话、SSE 回退、流事件处理和音频流处理
范围:LiveKit Agents 中两个核心低延迟优化机制的完整实现:FlushSentinel(TTS 分段信号)和 PREFLIGHT_TRANSCRIPT(意图预判与抢占生成)
范围:LiveKit Agents 的 ASR→LLM→TTS 级联管道设计、双工流式实现、关键架构亮点(低延迟、中断处理、动态端点检测)以及面向 Agent 开发者的基础 API
Related topics: [[websocket-streaming-support]], [[streaming-comparison]]
范围:VAD 模块的架构设计、Silero 实现、CPU 部署及与其他模块的协作
Related topics: [[streaming-comparison]], [[llm-abstraction-comparison]]
Related topics: [[llm-abstraction-comparison]], [[kosong]], [[republic]], [[litai]], [[pydantic-ai]], [[langchain]]
范围:本文档对比分析了 AgentScope 的 Realtime 模块与 Kimi-CLI 的 Kosong 框架在处理“实时性”上的不同哲学、架构实现及设计亮点。
Related topics: [[streaming-comparison]], [[llm-abstraction-comparison]], [[typed-message-parts-pydantic-ai]]