共 2 篇文章
记录将大模型应用从原型推进到生产环境的核心经验:上下文管理、错误处理、成本控制、可观测性。不讲基础概念,只谈实际踩坑。
记录构建 ASR→LLM→TTS 实时语音链路的过程:为什么延迟高、流水线并发如何降低首字节延迟、VAD 端点检测踩坑,以及各组件的实际选型经验。