{"code":0,"msg":"","data":{"biz_code":0,"biz_msg":"","biz_data":{"id":"file-b10a2aca-39e9-4a38-be9d-9f22e398cb62","status":"PENDING","file_name":"DS2API_HISTORY.txt","from_share":false,"file_size":732,"model_kind":"NORMAL","token_usage":null,"error_code":null,"inserted_at":1777485015.255,"updated_at":1777485015.255,"is_image":false,"audit_result":null}}} event: ready data: {"request_message_id":1,"response_message_id":2,"model_type":"default"} event: update_session data: {"updated_at":1777485019.550396} data: {"v":{"response":{"message_id":2,"parent_id":1,"model":"","role":"ASSISTANT","thinking_enabled":true,"ban_edit":false,"ban_regenerate":false,"status":"WIP","incomplete_message":null,"accumulated_token_usage":0,"feedback":null,"inserted_at":1777485019.542662,"search_enabled":false,"fragments":[{"id":2,"type":"THINK","content":"我们","elapsed_secs":null,"references":[],"stage_id":1}],"conversation_mode":"DEFAULT","has_pending_fragment":false,"auto_continue":false}}} data: {"p":"response/fragments/-1/content","o":"APPEND","v":"被"} data: {"v":"要求"} data: {"v":"写"} data: {"v":"一篇"} data: {"v":"120"} data: {"v":"0"} data: {"v":"字"} data: {"v":"的中"} data: {"v":"文"} data: {"v":"说明"} data: {"v":","} data: {"v":"比较"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"与"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"在"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出"} data: {"v":"中的"} data: {"v":"多个"} data: {"v":"方面"} data: {"v":":"} data: {"v":"可靠性"} data: {"v":"、"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"、"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"、"} data: {"v":"代理"} data: {"v":"兼容"} data: {"v":"性"} data: {"v":"、"} data: {"v":"成本和"} data: {"v":"可"} data: {"v":"观测"} data: {"v":"性"} data: {"v":","} data: {"v":"并"} data: {"v":"给出"} data: {"v":"分层"} data: {"v":"架构"} data: {"v":"建议"} data: {"v":"。"} data: {"v":"需要"} data: {"v":"非常"} data: {"v":"彻底"} data: {"v":","} data: {"v":"不能"} data: {"v":"走"} data: {"v":"捷径"} data: {"v":"。"} data: {"v":"我们将"} data: {"v":"逐步"} data: {"v":"思考"} data: {"v":"并"} data: {"v":"写出"} data: {"v":"完整"} data: {"v":"文章"} data: {"v":"。\n\n"} data: {"v":"首先"} data: {"v":"理解"} data: {"v":"背景"} data: {"v":":"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出"} data: {"v":","} data: {"v":"比如"} data: {"v":"大"} data: {"v":"语言"} data: {"v":"模型"} data: {"v":"生成"} data: {"v":"文本"} data: {"v":"时"} data: {"v":"逐"} data: {"v":"字"} data: {"v":"或"} data: {"v":"逐"} data: {"v":"句"} data: {"v":"输出"} data: {"v":"。"} data: {"v":"SS"} data: {"v":"E"} data: {"v":" ("} data: {"v":"Server"} data: {"v":"-S"} data: {"v":"ent"} data: {"v":" Events"} data: {"v":")"} data: {"v":" "} data: {"v":"和"} data: {"v":" Web"} data: {"v":"Socket"} data: {"v":" "} data: {"v":"是"} data: {"v":"两种"} data: {"v":"常见"} data: {"v":"技术"} data: {"v":"。"} data: {"v":"我们需要"} data: {"v":"比较"} data: {"v":"它们在"} data: {"v":"上述"} data: {"v":"维度"} data: {"v":"上的"} data: {"v":"优劣"} data: {"v":"。\n\n"} data: {"v":"1"} data: {"v":"."} data: {"v":" "} data: {"v":"可靠性"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"基于"} data: {"v":"HTTP"} data: {"v":","} data: {"v":"单向"} data: {"v":"从"} data: {"v":"服务器"} data: {"v":"到"} data: {"v":"客户端"} data: {"v":","} data: {"v":"有"} data: {"v":"重"} data: {"v":"连"} data: {"v":"机制"} data: {"v":"("} data: {"v":"内置"} data: {"v":"Event"} data: {"v":"Source"} data: {"v":"自动"} data: {"v":"重"} data: {"v":"连"} data: {"v":"),"} data: {"v":"但"} data: {"v":"需要"} data: {"v":"手动"} data: {"v":"处理"} data: {"v":"上次"} data: {"v":"接收"} data: {"v":"位置"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"全"} data: {"v":"双"} data: {"v":"工"} data: {"v":","} data: {"v":"但"} data: {"v":"需要"} data: {"v":"自己"} data: {"v":"实现"} data: {"v":"心跳"} data: {"v":"和"} data: {"v":"重"} data: {"v":"连"} data: {"v":"逻辑"} data: {"v":"。"} data: {"v":"可靠性"} data: {"v":"上"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"简单"} data: {"v":"自动"} data: {"v":"重"} data: {"v":"连"} data: {"v":","} data: {"v":"但"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"可以"} data: {"v":"更"} data: {"v":"灵活"} data: {"v":"控制"} data: {"v":"。\n\n"} data: {"v":"2"} data: {"v":"."} data: {"v":" "} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"可以通过"} data: {"v":"Last"} data: {"v":"-"} data: {"v":"Event"} data: {"v":"-ID"} data: {"v":"头"} data: {"v":"来"} data: {"v":"恢复"} data: {"v":"丢失"} data: {"v":"的消息"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"没有"} data: {"v":"内置"} data: {"v":"机制"} data: {"v":","} data: {"v":"需要"} data: {"v":"应用"} data: {"v":"层"} data: {"v":"实现"} data: {"v":"序列"} data: {"v":"号和"} data: {"v":"确认"} data: {"v":"。\n\n"} data: {"v":"3"} data: {"v":"."} data: {"v":" "} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"是"} data: {"v":"HTTP"} data: {"v":"长"} data: {"v":"连接"} data: {"v":","} data: {"v":"大多数"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"支持"} data: {"v":"HTTP"} data: {"v":","} data: {"v":"但"} data: {"v":"需要注意"} data: {"v":"超"} data: {"v":"时"} data: {"v":"设置"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"需要"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"支持"} data: {"v":"协议"} data: {"v":"升级"} data: {"v":"("} data: {"v":"如"} data: {"v":"NG"} data: {"v":"IN"} data: {"v":"X"} data: {"v":"、"} data: {"v":"HA"} data: {"v":"Proxy"} data: {"v":"支持"} data: {"v":"),"} data: {"v":"且"} data: {"v":"需要"} data: {"v":"会话"} data: {"v":"保持"} data: {"v":"("} data: {"v":"st"} data: {"v":"icky"} data: {"v":" session"} data: {"v":"),"} data: {"v":"因为"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"是有"} data: {"v":"状态的"} data: {"v":"。\n\n"} data: {"v":"4"} data: {"v":"."} data: {"v":" "} data: {"v":"代理"} data: {"v":"兼容"} data: {"v":"性"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"兼容"} data: {"v":"性好"} data: {"v":","} data: {"v":"因为"} data: {"v":"就是"} data: {"v":"HTTP"} data: {"v":","} data: {"v":"代理"} data: {"v":"和"} data: {"v":"CD"} data: {"v":"N"} data: {"v":"都"} data: {"v":"支持"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"可能"} data: {"v":"被"} data: {"v":"一些"} data: {"v":"老"} data: {"v":"代理"} data: {"v":"阻塞"} data: {"v":","} data: {"v":"需要"} data: {"v":"明确"} data: {"v":"支持"} data: {"v":"。\n\n"} data: {"v":"5"} data: {"v":"."} data: {"v":" "} data: {"v":"成本"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"开销"} data: {"v":"小"} data: {"v":","} data: {"v":"HTTP"} data: {"v":"头"} data: {"v":","} data: {"v":"但"} data: {"v":"每个"} data: {"v":"连接"} data: {"v":"占用"} data: {"v":"服务器"} data: {"v":"资源"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"有"} data: {"v":"额外的"} data: {"v":"帧"} data: {"v":"开销"} data: {"v":","} data: {"v":"但"} data: {"v":"更"} data: {"v":"高效"} data: {"v":"的双"} data: {"v":"向"} data: {"v":"传输"} data: {"v":"。"} data: {"v":"对于"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":","} data: {"v":"主要是"} data: {"v":"服务器"} data: {"v":"成本"} data: {"v":","} data: {"v":"两者"} data: {"v":"类似"} data: {"v":"。"} data: {"v":"但"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"可能"} data: {"v":"增加"} data: {"v":"复杂度"} data: {"v":"成本"} data: {"v":"。\n\n"} data: {"v":"6"} data: {"v":"."} data: {"v":" "} data: {"v":"可"} data: {"v":"观测"} data: {"v":"性"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"作为"} data: {"v":"HTTP"} data: {"v":","} data: {"v":"可以用"} data: {"v":"标准"} data: {"v":"监控"} data: {"v":"工具"} data: {"v":"("} data: {"v":"如"} data: {"v":"日志"} data: {"v":"、"} data: {"v":"指标"} data: {"v":")。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"自定义"} data: {"v":"协议"} data: {"v":","} data: {"v":"监控"} data: {"v":"较"} data: {"v":"难"} data: {"v":","} data: {"v":"需要"} data: {"v":"专门"} data: {"v":"工具"} data: {"v":"。\n\n"} data: {"v":"最后"} data: {"v":"给出"} data: {"v":"分层"} data: {"v":"架构"} data: {"v":"建议"} data: {"v":":"} data: {"v":"例如"} data: {"v":","} data: {"v":"对于"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出"} data: {"v":","} data: {"v":"建议"} data: {"v":"使用"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"作为"} data: {"v":"主要"} data: {"v":"方式"} data: {"v":","} data: {"v":"因为"} data: {"v":"简单"} data: {"v":"、"} data: {"v":"兼容"} data: {"v":"性好"} data: {"v":","} data: {"v":"且"} data: {"v":"单向"} data: {"v":"流"} data: {"v":"足够"} data: {"v":"。"} data: {"v":"但"} data: {"v":"如果有"} data: {"v":"双向"} data: {"v":"交互"} data: {"v":"需求"} data: {"v":"("} data: {"v":"如"} data: {"v":"用户"} data: {"v":"打断"} data: {"v":"生成"} data: {"v":"),"} data: {"v":"则"} data: {"v":"考虑"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"。"} data: {"v":"也可以"} data: {"v":"混合"} data: {"v":":"} data: {"v":"前端"} data: {"v":"用"} data: {"v":"SS"} data: {"v":"E"} data: {"v":","} data: {"v":"后端"} data: {"v":"用"} data: {"v":"消息"} data: {"v":"队列"} data: {"v":"等"} data: {"v":"。\n\n"} data: {"v":"文章"} data: {"v":"需要"} data: {"v":"120"} data: {"v":"0"} data: {"v":"字"} data: {"v":","} data: {"v":"结构"} data: {"v":"清晰"} data: {"v":","} data: {"v":"分"} data: {"v":"点"} data: {"v":"论述"} data: {"v":","} data: {"v":"最后"} data: {"v":"总结"} data: {"v":"和建议"} data: {"v":"。\n\n"} data: {"v":"我们"} data: {"v":"写出"} data: {"v":"完整"} data: {"v":"文章"} data: {"v":"。"} data: {"p":"response/fragments/-1/elapsed_secs","o":"SET","v":11.374845301} data: {"p":"response/fragments","o":"APPEND","v":[{"id":3,"type":"RESPONSE","content":"##","references":[],"stage_id":1}]} data: {"p":"response/fragments/-1/content","v":" "} data: {"v":"比较"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"与"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"在"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出"} data: {"v":"中的"} data: {"v":"关键"} data: {"v":"特性"} data: {"v":"与"} data: {"v":"分层"} data: {"v":"架构"} data: {"v":"建议"} data: {"v":"\n\n"} data: {"v":"在"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"("} data: {"v":"如"} data: {"v":"大"} data: {"v":"语言"} data: {"v":"模型"} data: {"v":"流"} data: {"v":"式"} data: {"v":"生成"} data: {"v":")"} data: {"v":"场景"} data: {"v":"中"} data: {"v":","} data: {"v":"服务"} data: {"v":"端"} data: {"v":"需要"} data: {"v":"将"} data: {"v":"计算结果"} data: {"v":"以"} data: {"v":"增量"} data: {"v":"方式"} data: {"v":"持续"} data: {"v":"推"} data: {"v":"送给"} data: {"v":"客户端"} data: {"v":"。"} data: {"v":"Server"} data: {"v":"-S"} data: {"v":"ent"} data: {"v":" Events"} data: {"v":"("} data: {"v":"SS"} data: {"v":"E"} data: {"v":")"} data: {"v":"与"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"是"} data: {"v":"两种"} data: {"v":"主流"} data: {"v":"的技术"} data: {"v":"方案"} data: {"v":"。"} data: {"v":"本文"} data: {"v":"将从"} data: {"v":"可靠性"} data: {"v":"、"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"、"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"、"} data: {"v":"代理"} data: {"v":"兼容"} data: {"v":"性"} data: {"v":"、"} data: {"v":"成本"} data: {"v":"及"} data: {"v":"可"} data: {"v":"观测"} data: {"v":"性"} data: {"v":"六个"} data: {"v":"维度"} data: {"v":"进行"} data: {"v":"系统"} data: {"v":"比较"} data: {"v":","} data: {"v":"并"} data: {"v":"给出"} data: {"v":"面向"} data: {"v":"实际"} data: {"v":"生产"} data: {"v":"环境"} data: {"v":"的分"} data: {"v":"层"} data: {"v":"架构"} data: {"v":"建议"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"一"} data: {"v":"、"} data: {"v":"可靠性"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":":"} data: {"v":"基于"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"1"} data: {"v":"."} data: {"v":"1"} data: {"v":"或"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"2"} data: {"v":","} data: {"v":"采用"} data: {"v":"标准的"} data: {"v":"`"} data: {"v":"text"} data: {"v":"/"} data: {"v":"event"} data: {"v":"-stream"} data: {"v":"`"} data: {"v":"内容"} data: {"v":"类型"} data: {"v":"。"} data: {"v":"连接"} data: {"v":"由"} data: {"v":"客户端"} data: {"v":"发起"} data: {"v":","} data: {"v":"服务器"} data: {"v":"单向"} data: {"v":"推送"} data: {"v":"。"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"规范"} data: {"v":"内置"} data: {"v":"了"} data: {"v":"自动"} data: {"v":"重"} data: {"v":"连"} data: {"v":"机制"} data: {"v":"——"} data: {"v":"当"} data: {"v":"连接"} data: {"v":"意外"} data: {"v":"中断"} data: {"v":"时"} data: {"v":","} data: {"v":"`"} data: {"v":"Event"} data: {"v":"Source"} data: {"v":"`"} data: {"v":" API"} data: {"v":"会自动"} data: {"v":"尝试"} data: {"v":"重新"} data: {"v":"建立"} data: {"v":"连接"} data: {"v":","} data: {"v":"并"} data: {"v":"可通过"} data: {"v":"`"} data: {"v":"Last"} data: {"v":"-"} data: {"v":"Event"} data: {"v":"-ID"} data: {"v":"`"} data: {"v":"头"} data: {"v":"传递"} data: {"v":"最后"} data: {"v":"收到的"} data: {"v":"消息"} data: {"v":"ID"} data: {"v":"。"} data: {"v":"这种"} data: {"v":"机制"} data: {"v":"使得"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"在"} data: {"v":"纯"} data: {"v":"推送"} data: {"v":"场景"} data: {"v":"下"} data: {"v":"具有"} data: {"v":"较高的"} data: {"v":"基础"} data: {"v":"可靠性"} data: {"v":"。"} data: {"v":"但"} data: {"v":"需"} data: {"v":"注意"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"不支持"} data: {"v":"客户端"} data: {"v":"主动"} data: {"v":"发送"} data: {"v":"数据"} data: {"v":","} data: {"v":"若"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"过程"} data: {"v":"需要"} data: {"v":"客户端"} data: {"v":"提供"} data: {"v":"额外"} data: {"v":"上下文"} data: {"v":"("} data: {"v":"如"} data: {"v":"用户"} data: {"v":"打断"} data: {"v":"生成"} data: {"v":"),"} data: {"v":"则"} data: {"v":"必须"} data: {"v":"通过"} data: {"v":"另一个"} data: {"v":"HTTP"} data: {"v":"请求"} data: {"v":"完成"} data: {"v":","} data: {"v":"增加了"} data: {"v":"交互"} data: {"v":"复杂性"} data: {"v":"。\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"**"} data: {"v":":"} data: {"v":"全"} data: {"v":"双"} data: {"v":"工"} data: {"v":"、"} data: {"v":"持久"} data: {"v":"化的"} data: {"v":"二进制"} data: {"v":"协议"} data: {"v":","} data: {"v":"通过"} data: {"v":"HTTP"} data: {"v":" Upgrade"} data: {"v":"握手"} data: {"v":"建立"} data: {"v":"。"} data: {"v":"其"} data: {"v":"可靠性"} data: {"v":"完全"} data: {"v":"依赖"} data: {"v":"应用"} data: {"v":"层"} data: {"v":"实现"} data: {"v":":"} data: {"v":"心跳"} data: {"v":"机制"} data: {"v":"("} data: {"v":"P"} data: {"v":"ing"} data: {"v":"/P"} data: {"v":"ong"} data: {"v":")"} data: {"v":"需"} data: {"v":"自行"} data: {"v":"设计"} data: {"v":","} data: {"v":"断"} data: {"v":"线"} data: {"v":"检测"} data: {"v":"和"} data: {"v":"重"} data: {"v":"连"} data: {"v":"逻辑"} data: {"v":"("} data: {"v":"指数"} data: {"v":"退"} data: {"v":"避"} data: {"v":"、"} data: {"v":"随机"} data: {"v":"抖动"} data: {"v":")"} data: {"v":"也"} data: {"v":"需"} data: {"v":"编码"} data: {"v":"完成"} data: {"v":"。"} data: {"v":"好处"} data: {"v":"是"} data: {"v":"灵活"} data: {"v":"度高"} data: {"v":","} data: {"v":"可"} data: {"v":"针对"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"定制"} data: {"v":"确认"} data: {"v":"重"} data: {"v":"传"} data: {"v":"、"} data: {"v":"流量"} data: {"v":"控制"} data: {"v":"等"} data: {"v":"策略"} data: {"v":"。"} data: {"v":"坏"} data: {"v":"处"} data: {"v":"是"} data: {"v":"原生"} data: {"v":"缺少"} data: {"v":"标准"} data: {"v":"化的"} data: {"v":"重"} data: {"v":"连"} data: {"v":"与"} data: {"v":"恢复"} data: {"v":"语义"} data: {"v":","} data: {"v":"实现"} data: {"v":"不当"} data: {"v":"易"} data: {"v":"导致"} data: {"v":"数据"} data: {"v":"丢失"} data: {"v":"或"} data: {"v":"重复"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"对于"} data: {"v":"“"} data: {"v":"仅"} data: {"v":"服务器"} data: {"v":"推送"} data: {"v":"推理"} data: {"v":"结果"} data: {"v":"”"} data: {"v":"的"} data: {"v":"典型"} data: {"v":"场景"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的"} data: {"v":"默认"} data: {"v":"可靠"} data: {"v":"行为"} data: {"v":"更"} data: {"v":"简单"} data: {"v":"稳健"} data: {"v":";"} data: {"v":"若"} data: {"v":"需"} data: {"v":"复杂"} data: {"v":"双向"} data: {"v":"控制"} data: {"v":","} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"可通过"} data: {"v":"精心"} data: {"v":"设计"} data: {"v":"达到"} data: {"v":"更高"} data: {"v":"可靠性"} data: {"v":","} data: {"v":"但"} data: {"v":"开发"} data: {"v":"成本"} data: {"v":"显著"} data: {"v":"上升"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"二"} data: {"v":"、"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":":"} data: {"v":"利用"} data: {"v":"`"} data: {"v":"Last"} data: {"v":"-"} data: {"v":"Event"} data: {"v":"-ID"} data: {"v":"`"} data: {"v":"实现"} data: {"v":"天然"} data: {"v":"断"} data: {"v":"点"} data: {"v":"续"} data: {"v":"传"} data: {"v":"。"} data: {"v":"服务器"} data: {"v":"为"} data: {"v":"每个"} data: {"v":"推送"} data: {"v":"事件"} data: {"v":"分配"} data: {"v":"单调"} data: {"v":"递增"} data: {"v":"ID"} data: {"v":","} data: {"v":"客户端"} data: {"v":"重"} data: {"v":"连"} data: {"v":"时"} data: {"v":"自动"} data: {"v":"携带"} data: {"v":"最后"} data: {"v":"收到"} data: {"v":"ID"} data: {"v":","} data: {"v":"服务"} data: {"v":"端"} data: {"v":"据此"} data: {"v":"回"} data: {"v":"补"} data: {"v":"丢失"} data: {"v":"消息"} data: {"v":"。"} data: {"v":"这使得"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"中间"} data: {"v":"断开"} data: {"v":"后"} data: {"v":"能够"} data: {"v":"无"} data: {"v":"遗漏"} data: {"v":"恢复"} data: {"v":"输出"} data: {"v":","} data: {"v":"对"} data: {"v":"用户体验"} data: {"v":"至关重要"} data: {"v":"。\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"**"} data: {"v":":"} data: {"v":"无"} data: {"v":"任何"} data: {"v":"内"} data: {"v":"建"} data: {"v":"恢复"} data: {"v":"机制"} data: {"v":"。"} data: {"v":"需要在"} data: {"v":"应用"} data: {"v":"协议"} data: {"v":"中"} data: {"v":"自行"} data: {"v":"设计"} data: {"v":"序列"} data: {"v":"号"} data: {"v":"("} data: {"v":"如"} data: {"v":"每个"} data: {"v":"推理"} data: {"v":"token"} data: {"v":"带"} data: {"v":"序号"} data: {"v":")"} data: {"v":"和"} data: {"v":"确认"} data: {"v":"应答"} data: {"v":"("} data: {"v":"ACK"} data: {"v":"),"} data: {"v":"客户端"} data: {"v":"重"} data: {"v":"连"} data: {"v":"后"} data: {"v":"发送"} data: {"v":"已"} data: {"v":"确认"} data: {"v":"序号"} data: {"v":","} data: {"v":"服务"} data: {"v":"端"} data: {"v":"重"} data: {"v":"放"} data: {"v":"丢失"} data: {"v":"部分"} data: {"v":"。"} data: {"v":"这"} data: {"v":"增加了"} data: {"v":"协议"} data: {"v":"设计"} data: {"v":"负担"} data: {"v":","} data: {"v":"且"} data: {"v":"需"} data: {"v":"处理"} data: {"v":"消息"} data: {"v":"边界"} data: {"v":"与"} data: {"v":"缓存"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"在"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"上"} data: {"v":"胜"} data: {"v":"出"} data: {"v":"——"} data: {"v":"开"} data: {"v":"箱"} data: {"v":"即"} data: {"v":"用"} data: {"v":","} data: {"v":"适合"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"这类"} data: {"v":"需要"} data: {"v":"连续"} data: {"v":"输出"} data: {"v":"且"} data: {"v":"不允许"} data: {"v":"跳"} data: {"v":"帧"} data: {"v":"的场景"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"三"} data: {"v":"、"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":":"} data: {"v":"本质"} data: {"v":"是"} data: {"v":"长"} data: {"v":"连接"} data: {"v":"HTTP"} data: {"v":"请求"} data: {"v":"。"} data: {"v":"大多数"} data: {"v":"七"} data: {"v":"层"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"("} data: {"v":"NG"} data: {"v":"IN"} data: {"v":"X"} data: {"v":"、"} data: {"v":"HA"} data: {"v":"Proxy"} data: {"v":"、"} data: {"v":"AWS"} data: {"v":" AL"} data: {"v":"B"} data: {"v":")"} data: {"v":"对"} data: {"v":"HTTP"} data: {"v":"长"} data: {"v":"连接"} data: {"v":"支持"} data: {"v":"成熟"} data: {"v":","} data: {"v":"只需"} data: {"v":"配置"} data: {"v":"较"} data: {"v":"长的"} data: {"v":"`"} data: {"v":"keep"} data: {"v":"al"} data: {"v":"ive"} data: {"v":"_time"} data: {"v":"out"} data: {"v":"`"} data: {"v":"("} data: {"v":"如"} data: {"v":"300"} data: {"v":"秒"} data: {"v":")"} data: {"v":"和"} data: {"v":"连接"} data: {"v":"数"} data: {"v":"限制"} data: {"v":"。"} data: {"v":"由于"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"连接"} data: {"v":"可"} data: {"v":"识别"} data: {"v":"为"} data: {"v":"普通"} data: {"v":"HTTP"} data: {"v":"流"} data: {"v":","} data: {"v":"不"} data: {"v":"要求"} data: {"v":"会话"} data: {"v":"保持"} data: {"v":"("} data: {"v":"session"} data: {"v":" persistence"} data: {"v":"),"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"可"} data: {"v":"自由"} data: {"v":"分配"} data: {"v":"请求"} data: {"v":","} data: {"v":"扩展"} data: {"v":"性好"} data: {"v":"。\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"**"} data: {"v":":"} data: {"v":"要求"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"显"} data: {"v":"式"} data: {"v":"支持"} data: {"v":"协议"} data: {"v":"升级"} data: {"v":"和"} data: {"v":"隧道"} data: {"v":"传输"} data: {"v":"。"} data: {"v":"通常"} data: {"v":"需要"} data: {"v":"开启"} data: {"v":"“"} data: {"v":"st"} data: {"v":"icky"} data: {"v":" session"} data: {"v":"”("} data: {"v":"基于"} data: {"v":"IP"} data: {"v":"哈希"} data: {"v":"或"} data: {"v":"Cookie"} data: {"v":"),"} data: {"v":"因为"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"连接"} data: {"v":"建立"} data: {"v":"后"} data: {"v":"状态"} data: {"v":"固定"} data: {"v":"于"} data: {"v":"某"} data: {"v":"台"} data: {"v":"后端"} data: {"v":"服务器"} data: {"v":","} data: {"v":"一旦"} data: {"v":"断"} data: {"v":"线"} data: {"v":"重"} data: {"v":"连"} data: {"v":"可能"} data: {"v":"被"} data: {"v":"路由"} data: {"v":"到"} data: {"v":"不同"} data: {"v":"节点"} data: {"v":","} data: {"v":"导致"} data: {"v":"会话"} data: {"v":"丢失"} data: {"v":"。"} data: {"v":"这对"} data: {"v":"水平"} data: {"v":"伸缩"} data: {"v":"和"} data: {"v":"故障"} data: {"v":"转移"} data: {"v":"带来"} data: {"v":"挑战"} data: {"v":","} data: {"v":"需"} data: {"v":"配合"} data: {"v":"共享"} data: {"v":"存储"} data: {"v":"("} data: {"v":"如"} data: {"v":"Redis"} data: {"v":")"} data: {"v":"存储"} data: {"v":"会话"} data: {"v":"状态"} data: {"v":","} data: {"v":"或"} data: {"v":"采用"} data: {"v":"一致性"} data: {"v":"哈希"} data: {"v":"路由"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"在"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"层面"} data: {"v":"更"} data: {"v":"简单"} data: {"v":"、"} data: {"v":"更"} data: {"v":"无"} data: {"v":"状态"} data: {"v":","} data: {"v":"更适合"} data: {"v":"云"} data: {"v":"原生"} data: {"v":"环境中"} data: {"v":"频繁"} data: {"v":"扩"} data: {"v":"缩"} data: {"v":"容"} data: {"v":"的"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"服务"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"四"} data: {"v":"、"} data: {"v":"代理"} data: {"v":"兼容"} data: {"v":"性"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":":"} data: {"v":"几乎"} data: {"v":"100"} data: {"v":"%"} data: {"v":"兼容"} data: {"v":"所有"} data: {"v":"HTTP"} data: {"v":"代理"} data: {"v":"、"} data: {"v":"CD"} data: {"v":"N"} data: {"v":"、"} data: {"v":"网关"} data: {"v":"("} data: {"v":"包括"} data: {"v":"企业"} data: {"v":"防火墙"} data: {"v":")。"} data: {"v":"因"} data: {"v":"它"} data: {"v":"只是"} data: {"v":"分"} data: {"v":"块"} data: {"v":"传输"} data: {"v":"的"} data: {"v":"普通"} data: {"v":"HTTP"} data: {"v":"响应"} data: {"v":","} data: {"v":"代理"} data: {"v":"不会"} data: {"v":"特殊"} data: {"v":"处理"} data: {"v":","} data: {"v":"只需"} data: {"v":"注意"} data: {"v":"关闭"} data: {"v":"代理"} data: {"v":"的"} data: {"v":"响应"} data: {"v":"缓冲"} data: {"v":"("} data: {"v":"`"} data: {"v":"X"} data: {"v":"-A"} data: {"v":"cc"} data: {"v":"el"} data: {"v":"-B"} data: {"v":"uff"} data: {"v":"ering"} data: {"v":":"} data: {"v":" no"} data: {"v":"`"} data: {"v":"或"} data: {"v":"`"} data: {"v":"proxy"} data: {"v":"_b"} data: {"v":"uff"} data: {"v":"ering"} data: {"v":" off"} data: {"v":"`"} data: {"v":")"} data: {"v":"即可"} data: {"v":"实现"} data: {"v":"实时"} data: {"v":"流传"} data: {"v":"。\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"**"} data: {"v":":"} data: {"v":"需要"} data: {"v":"代理"} data: {"v":"完全"} data: {"v":"理解"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"握手"} data: {"v":"和"} data: {"v":"帧"} data: {"v":"格式"} data: {"v":"。"} data: {"v":"部分"} data: {"v":"老旧"} data: {"v":"代理"} data: {"v":"、"} data: {"v":"反向"} data: {"v":"代理"} data: {"v":"或"} data: {"v":"CD"} data: {"v":"N"} data: {"v":"可能"} data: {"v":"不支持"} data: {"v":"或"} data: {"v":"错误"} data: {"v":"拦截"} data: {"v":"Up"} data: {"v":"grade"} data: {"v":"请求"} data: {"v":"。"} data: {"v":"即使"} data: {"v":"支持"} data: {"v":","} data: {"v":"也"} data: {"v":"往往"} data: {"v":"需要"} data: {"v":"单独"} data: {"v":"配置"} data: {"v":"协议"} data: {"v":"升级"} data: {"v":"("} data: {"v":"如"} data: {"v":"NG"} data: {"v":"IN"} data: {"v":"X"} data: {"v":"的"} data: {"v":"`"} data: {"v":"Up"} data: {"v":"grade"} data: {"v":":"} data: {"v":" webs"} data: {"v":"ocket"} data: {"v":"`"} data: {"v":"头"} data: {"v":")。"} data: {"v":"此外"} data: {"v":","} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"流量"} data: {"v":"经过"} data: {"v":"代理"} data: {"v":"时"} data: {"v":","} data: {"v":"某些"} data: {"v":"超"} data: {"v":"时"} data: {"v":"设置"} data: {"v":"不"} data: {"v":"匹配"} data: {"v":"会导致"} data: {"v":"静"} data: {"v":"默"} data: {"v":"断"} data: {"v":"连"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的"} data: {"v":"代理"} data: {"v":"兼容"} data: {"v":"性"} data: {"v":"显著"} data: {"v":"优于"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":","} data: {"v":"尤其在"} data: {"v":"混合"} data: {"v":"网络"} data: {"v":"环境"} data: {"v":"("} data: {"v":"移动"} data: {"v":"网络"} data: {"v":"、"} data: {"v":"公司"} data: {"v":"代理"} data: {"v":")"} data: {"v":"中"} data: {"v":"更为"} data: {"v":"可靠"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"五"} data: {"v":"、"} data: {"v":"成本"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"连接"} data: {"v":"开销"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的"} data: {"v":"HTTP"} data: {"v":"头部"} data: {"v":"每"} data: {"v":"请求"} data: {"v":"约"} data: {"v":"200"} data: {"v":"~"} data: {"v":"500"} data: {"v":"字节"} data: {"v":","} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"握手"} data: {"v":"后"} data: {"v":"帧"} data: {"v":"头"} data: {"v":"仅"} data: {"v":"2"} data: {"v":"~"} data: {"v":"14"} data: {"v":"字节"} data: {"v":","} data: {"v":"且"} data: {"v":"无"} data: {"v":"每次"} data: {"v":"推送"} data: {"v":"的"} data: {"v":"重复"} data: {"v":"HTTP"} data: {"v":"头"} data: {"v":"。"} data: {"v":"对于"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"中"} data: {"v":"高频"} data: {"v":"逐"} data: {"v":"token"} data: {"v":"输出"} data: {"v":"("} data: {"v":"数百"} data: {"v":"至"} data: {"v":"数千"} data: {"v":"次"} data: {"v":"推送"} data: {"v":"),"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"的"} data: {"v":"带宽"} data: {"v":"效率"} data: {"v":"略"} data: {"v":"高"} data: {"v":"。\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"服务器"} data: {"v":"资源"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"每个"} data: {"v":"连接"} data: {"v":"占用"} data: {"v":"一个"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"1"} data: {"v":"."} data: {"v":"1"} data: {"v":"线程"} data: {"v":"或"} data: {"v":"事件"} data: {"v":"循环"} data: {"v":"中的"} data: {"v":"文件"} data: {"v":"描述"} data: {"v":"符"} data: {"v":";"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"类似"} data: {"v":"但"} data: {"v":"无"} data: {"v":"HTTP"} data: {"v":"解析"} data: {"v":"负担"} data: {"v":"。"} data: {"v":"现代"} data: {"v":"异步"} data: {"v":"框架"} data: {"v":"("} data: {"v":"如"} data: {"v":"Net"} data: {"v":"ty"} data: {"v":"、"} data: {"v":"Node"} data: {"v":".js"} data: {"v":")"} data: {"v":"下"} data: {"v":"两者"} data: {"v":"资源"} data: {"v":"消耗"} data: {"v":"相近"} data: {"v":"。\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"开发"} data: {"v":"与"} data: {"v":"运维"} data: {"v":"成本"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"实现"} data: {"v":"简单"} data: {"v":","} data: {"v":"无需"} data: {"v":"自定义"} data: {"v":"心跳"} data: {"v":"、"} data: {"v":"重"} data: {"v":"连"} data: {"v":"、"} data: {"v":"序列"} data: {"v":"号"} data: {"v":","} data: {"v":"大幅"} data: {"v":"降低"} data: {"v":"编码"} data: {"v":"与"} data: {"v":"调试"} data: {"v":"成本"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"需"} data: {"v":"额外"} data: {"v":"处理"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"、"} data: {"v":"会话"} data: {"v":"迁移"} data: {"v":"、"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"粘"} data: {"v":"性"} data: {"v":"等"} data: {"v":","} data: {"v":"总体"} data: {"v":"拥有"} data: {"v":"成本"} data: {"v":"("} data: {"v":"T"} data: {"v":"CO"} data: {"v":")"} data: {"v":"更高"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"对于"} data: {"v":"大多数"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"业务"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的开发"} data: {"v":"运维"} data: {"v":"成本"} data: {"v":"远"} data: {"v":"低于"} data: {"v":"其"} data: {"v":"微小"} data: {"v":"带宽"} data: {"v":"浪费"} data: {"v":","} data: {"v":"因此"} data: {"v":"总体"} data: {"v":"成本"} data: {"v":"更"} data: {"v":"优"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"六"} data: {"v":"、"} data: {"v":"可"} data: {"v":"观测"} data: {"v":"性"} data: {"v":"\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":":"} data: {"v":"基于"} data: {"v":"HTTP"} data: {"v":"标准"} data: {"v":","} data: {"v":"可直接"} data: {"v":"利用"} data: {"v":"现有"} data: {"v":"监控"} data: {"v":"体系"} data: {"v":":"} data: {"v":"通过"} data: {"v":"网关"} data: {"v":"日志"} data: {"v":"获取"} data: {"v":"请求"} data: {"v":"耗时"} data: {"v":"、"} data: {"v":"状态"} data: {"v":"码"} data: {"v":"、"} data: {"v":"响应"} data: {"v":"大小"} data: {"v":";"} data: {"v":"通过"} data: {"v":"追踪"} data: {"v":"ID"} data: {"v":"实现"} data: {"v":"分布式"} data: {"v":"链路"} data: {"v":"追踪"} data: {"v":"("} data: {"v":"Open"} data: {"v":"Tele"} data: {"v":"metry"} data: {"v":"自动"} data: {"v":"支持"} data: {"v":");"} data: {"v":"错误"} data: {"v":"率"} data: {"v":"、"} data: {"v":"重"} data: {"v":"连"} data: {"v":"次数"} data: {"v":"等"} data: {"v":"指标"} data: {"v":"均可"} data: {"v":"从"} data: {"v":"标准"} data: {"v":"指标"} data: {"v":"采集"} data: {"v":"器"} data: {"v":"获得"} data: {"v":"。"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的"} data: {"v":"每个"} data: {"v":"事件"} data: {"v":"天然"} data: {"v":"是"} data: {"v":"结构化"} data: {"v":"文本"} data: {"v":","} data: {"v":"便于"} data: {"v":"记录"} data: {"v":"和分析"} data: {"v":"。\n\n"} data: {"v":"-"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"**"} data: {"v":":"} data: {"v":"自定义"} data: {"v":"二进制"} data: {"v":"协议"} data: {"v":"使得"} data: {"v":"通用"} data: {"v":"HTTP"} data: {"v":"监控"} data: {"v":"工具"} data: {"v":"失效"} data: {"v":"。"} data: {"v":"需要"} data: {"v":"专门"} data: {"v":"埋"} data: {"v":"点"} data: {"v":":"} data: {"v":"记录"} data: {"v":"消息"} data: {"v":"发送"} data: {"v":"速率"} data: {"v":"、"} data: {"v":"延迟"} data: {"v":"、"} data: {"v":"重"} data: {"v":"连"} data: {"v":"计数"} data: {"v":"、"} data: {"v":"异常"} data: {"v":"关闭"} data: {"v":"码"} data: {"v":"。"} data: {"v":"链路"} data: {"v":"追踪"} data: {"v":"需"} data: {"v":"在"} data: {"v":"应用"} data: {"v":"层"} data: {"v":"手动"} data: {"v":"注入"} data: {"v":"上下文"} data: {"v":","} data: {"v":"无法"} data: {"v":"依赖"} data: {"v":"代理"} data: {"v":"自动"} data: {"v":"生成"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"连接"} data: {"v":"的生命"} data: {"v":"周期"} data: {"v":"事件"} data: {"v":"("} data: {"v":"打开"} data: {"v":"、"} data: {"v":"关闭"} data: {"v":"、"} data: {"v":"ping"} data: {"v":"/p"} data: {"v":"ong"} data: {"v":")"} data: {"v":"也"} data: {"v":"需"} data: {"v":"额外"} data: {"v":"暴露"} data: {"v":"为"} data: {"v":"指标"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"结论"} data: {"v":"**"} data: {"v":":"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"的可"} data: {"v":"观测"} data: {"v":"性"} data: {"v":"实现"} data: {"v":"成本"} data: {"v":"极"} data: {"v":"低"} data: {"v":"且"} data: {"v":"标准化"} data: {"v":","} data: {"v":"而"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"需"} data: {"v":"大量"} data: {"v":"定制"} data: {"v":"代码"} data: {"v":"才能"} data: {"v":"达到"} data: {"v":"同等"} data: {"v":"可见"} data: {"v":"性"} data: {"v":"。\n\n"} data: {"v":"###"} data: {"v":" "} data: {"v":"分层"} data: {"v":"架构"} data: {"v":"建议"} data: {"v":"\n\n"} data: {"v":"基于"} data: {"v":"以上"} data: {"v":"分析"} data: {"v":","} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出的"} data: {"v":"最佳"} data: {"v":"实践"} data: {"v":"建议"} data: {"v":"采用"} data: {"v":"**"} data: {"v":"分层"} data: {"v":"混合"} data: {"v":"架构"} data: {"v":"**"} data: {"v":":\n\n"} data: {"v":"1"} data: {"v":"."} data: {"v":" **"} data: {"v":"接入"} data: {"v":"层"} data: {"v":"**"} data: {"v":":"} data: {"v":"使用"} data: {"v":"支持"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"2"} data: {"v":"或"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"1"} data: {"v":"."} data: {"v":"1"} data: {"v":"的"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"器"} data: {"v":"("} data: {"v":"如"} data: {"v":"AL"} data: {"v":"B"} data: {"v":"、"} data: {"v":"NG"} data: {"v":"IN"} data: {"v":"X"} data: {"v":"),"} data: {"v":"开启"} data: {"v":"响应"} data: {"v":"缓冲"} data: {"v":"关闭"} data: {"v":"("} data: {"v":"`"} data: {"v":"proxy"} data: {"v":"_b"} data: {"v":"uff"} data: {"v":"ering"} data: {"v":" off"} data: {"v":"`"} data: {"v":")"} data: {"v":"和"} data: {"v":"长"} data: {"v":"连接"} data: {"v":"超"} data: {"v":"时"} data: {"v":"("} data: {"v":"如"} data: {"v":"600"} data: {"v":"秒"} data: {"v":")。\n"} data: {"v":"2"} data: {"v":"."} data: {"v":" **"} data: {"v":"协议"} data: {"v":"层"} data: {"v":"**"} data: {"v":":"} data: {"v":"**"} data: {"v":"优先"} data: {"v":"选择"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"**"} data: {"v":"作为"} data: {"v":"客户端"} data: {"v":"与服务"} data: {"v":"端"} data: {"v":"之间的"} data: {"v":"主要"} data: {"v":"流"} data: {"v":"式"} data: {"v":"协议"} data: {"v":"**"} data: {"v":","} data: {"v":"理由"} data: {"v":"如下"} data: {"v":":\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" AI"} data: {"v":"推理"} data: {"v":"是"} data: {"v":"典型的"} data: {"v":"服务器"} data: {"v":"向"} data: {"v":"客户端"} data: {"v":"推送"} data: {"v":"单向"} data: {"v":"流"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"天然"} data: {"v":"匹配"} data: {"v":"。\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" "} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"内置"} data: {"v":","} data: {"v":"极大"} data: {"v":"提升"} data: {"v":"用户体验"} data: {"v":","} data: {"v":"尤其"} data: {"v":"适合"} data: {"v":"生"} data: {"v":"成长"} data: {"v":"度"} data: {"v":"可达"} data: {"v":"数千"} data: {"v":"token"} data: {"v":"的"} data: {"v":"推理"} data: {"v":"任务"} data: {"v":"。\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" "} data: {"v":"无需"} data: {"v":"自定义"} data: {"v":"粘"} data: {"v":"性"} data: {"v":"会话"} data: {"v":","} data: {"v":"水平"} data: {"v":"扩展"} data: {"v":"简单"} data: {"v":"。\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" "} data: {"v":"运维"} data: {"v":"与"} data: {"v":"监控"} data: {"v":"可直接"} data: {"v":"复用"} data: {"v":"现有"} data: {"v":"HTTP"} data: {"v":"生态"} data: {"v":"。\n"} data: {"v":"3"} data: {"v":"."} data: {"v":" **"} data: {"v":"双向"} data: {"v":"交互"} data: {"v":"补充"} data: {"v":"**"} data: {"v":":"} data: {"v":"如果"} data: {"v":"业务"} data: {"v":"的确"} data: {"v":"需要"} data: {"v":"用户"} data: {"v":"打断"} data: {"v":"生成"} data: {"v":"或"} data: {"v":"实时"} data: {"v":"调整"} data: {"v":"推理"} data: {"v":"参数"} data: {"v":"("} data: {"v":"如"} data: {"v":"温度"} data: {"v":"、"} data: {"v":"top"} data: {"v":"_p"} data: {"v":"),"} data: {"v":"可通过"} data: {"v":"以下"} data: {"v":"两种"} data: {"v":"方式"} data: {"v":"实现"} data: {"v":":\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" **"} data: {"v":"SS"} data: {"v":"E"} data: {"v":" +"} data: {"v":" "} data: {"v":"独立"} data: {"v":"HTTP"} data: {"v":" POST"} data: {"v":"**"} data: {"v":":"} data: {"v":"客户端"} data: {"v":"另"} data: {"v":"发起"} data: {"v":"一个"} data: {"v":"HTTP"} data: {"v":"请求"} data: {"v":"发送"} data: {"v":"控制"} data: {"v":"指令"} data: {"v":","} data: {"v":"服务"} data: {"v":"端"} data: {"v":"通过"} data: {"v":"共享"} data: {"v":"会话"} data: {"v":"ID"} data: {"v":"("} data: {"v":"如"} data: {"v":"`"} data: {"v":"X"} data: {"v":"-S"} data: {"v":"ession"} data: {"v":"-"} data: {"v":"Id"} data: {"v":"`"} data: {"v":"头"} data: {"v":")"} data: {"v":"影响"} data: {"v":"已有"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"流"} data: {"v":"。"} data: {"v":"这"} data: {"v":"保持了"} data: {"v":"架构"} data: {"v":"简单"} data: {"v":"。\n"} data: {"v":" "} data: {"v":" -"} data: {"v":" **"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"("} data: {"v":"仅"} data: {"v":"当"} data: {"v":"频繁"} data: {"v":"双向"} data: {"v":"交互"} data: {"v":")"} data: {"v":"**"} data: {"v":":"} data: {"v":"只有在"} data: {"v":"要求"} data: {"v":"全"} data: {"v":"双"} data: {"v":"工"} data: {"v":"毫"} data: {"v":"秒"} data: {"v":"级"} data: {"v":"交互"} data: {"v":"("} data: {"v":"如"} data: {"v":"实时"} data: {"v":"对话"} data: {"v":"且"} data: {"v":"用户"} data: {"v":"频繁"} data: {"v":"插"} data: {"v":"话"} data: {"v":")"} data: {"v":"时才"} data: {"v":"引入"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":","} data: {"v":"但"} data: {"v":"必须"} data: {"v":"自行"} data: {"v":"实现"} data: {"v":"上述"} data: {"v":"负载"} data: {"v":"均衡"} data: {"v":"亲和"} data: {"v":"、"} data: {"v":"断"} data: {"v":"线"} data: {"v":"恢复"} data: {"v":"和"} data: {"v":"监控"} data: {"v":"。\n"} data: {"v":"4"} data: {"v":"."} data: {"v":" **"} data: {"v":"后端"} data: {"v":"内部"} data: {"v":"通信"} data: {"v":"**"} data: {"v":":"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"引擎"} data: {"v":"与"} data: {"v":"网关"} data: {"v":"之间"} data: {"v":"可采用"} data: {"v":"g"} data: {"v":"R"} data: {"v":"PC"} data: {"v":"流"} data: {"v":"式"} data: {"v":"("} data: {"v":"基于"} data: {"v":"HTTP"} data: {"v":"/"} data: {"v":"2"} data: {"v":"),"} data: {"v":"利用"} data: {"v":"其"} data: {"v":"内置"} data: {"v":"流"} data: {"v":"控"} data: {"v":"和"} data: {"v":"双向"} data: {"v":"特性"} data: {"v":","} data: {"v":"但"} data: {"v":"对外"} data: {"v":"层"} data: {"v":"仍"} data: {"v":"可通过"} data: {"v":"协议"} data: {"v":"适配"} data: {"v":"器"} data: {"v":"转换为"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"。\n\n"} data: {"v":"**"} data: {"v":"总结"} data: {"v":"**"} data: {"v":":"} data: {"v":"对于"} data: {"v":"绝大多数"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"流"} data: {"v":"式"} data: {"v":"输出"} data: {"v":"场景"} data: {"v":","} data: {"v":"SS"} data: {"v":"E"} data: {"v":"凭借"} data: {"v":"其"} data: {"v":"简单"} data: {"v":"、"} data: {"v":"可靠"} data: {"v":"、"} data: {"v":"易"} data: {"v":"观测"} data: {"v":"、"} data: {"v":"高"} data: {"v":"兼容"} data: {"v":"性的"} data: {"v":"优势"} data: {"v":","} data: {"v":"应"} data: {"v":"作为"} data: {"v":"标准"} data: {"v":"选"} data: {"v":"型"} data: {"v":"。"} data: {"v":"Web"} data: {"v":"Socket"} data: {"v":"仅在"} data: {"v":"需要"} data: {"v":"复杂"} data: {"v":"双向"} data: {"v":"实时"} data: {"v":"控制"} data: {"v":"且"} data: {"v":"能"} data: {"v":"承担"} data: {"v":"额外"} data: {"v":"工程"} data: {"v":"成本"} data: {"v":"时"} data: {"v":"才有"} data: {"v":"竞争力"} data: {"v":"。"} data: {"v":"通过"} data: {"v":"分层"} data: {"v":"设计"} data: {"v":"("} data: {"v":"接入"} data: {"v":"层"} data: {"v":"+"} data: {"v":"SS"} data: {"v":"E"} data: {"v":"会话"} data: {"v":"层"} data: {"v":"+"} data: {"v":"推理"} data: {"v":"引擎"} data: {"v":"层"} data: {"v":"),"} data: {"v":"可以"} data: {"v":"构建"} data: {"v":"高"} data: {"v":"可靠的"} data: {"v":"AI"} data: {"v":"推理"} data: {"v":"服务"} data: {"v":"。"} data: {"p":"response/fragments","v":[{"id":4,"type":"TIP","content":"本回答由 AI 生成,内容仅供参考,请仔细甄别。","style":"WARNING","hide_on_wip":true}]} data: {"p":"response","o":"BATCH","v":[{"p":"accumulated_token_usage","v":2024},{"p":"quasi_status","v":"FINISHED"}]} data: {"p":"response/status","o":"SET","v":"FINISHED"} event: update_session data: {"updated_at":1777485073.9337459} event: title data: {"content":"SSE与WebSocket比较与架构建议"} event: close data: {"click_behavior":"none","auto_resume":false}