响应流式传输（Response Streaming）-尧图网站设计

响应流式传输（Response Streaming）注意此页面描述的是低级 LLM API 的响应流式传输。高级 LLM API 请参见 [AI 服务](AI Services)。LLM 会逐个令牌（token）生成文本，因此许多 LLM 提供商提供了一种逐令牌流式传输响应的方法，而无需等待整个文本生成完毕。这显著改善了用户体验，因为用户无需等待未知的时间，几乎可以立即开始阅读响应。对于ChatModel和LanguageModel接口，存在对应的StreamingChatModel和StreamingLanguageModel接口。它们具有相似的 API，但可以流式传输响应。它们接受StreamingChatResponseHandler接口的实现作为参数。publicinterfaceStreamingChatResponseHandler{defaultvoidonPartialResponse(StringpartialResponse){}defaultvoidonPartialResponse(PartialResponsepartialResponse,PartialResponseContextcontext){}defaultvoidonPartialThinking(PartialThinkingpartialThinking){}defaultvoidonPartialThinking(PartialThinkingpartialThinking,PartialThinkingContextcontext){}defaultvoidonPartialToolCall(PartialToolCallpartialToolCall){}defaultvoidonPartialToolCall(PartialToolCallpartialToolCall,PartialToolCallContextcontext){}defaultvoidonCompleteToolCall(CompleteToolCallcompleteToolCall){}voidonCompleteResponse(ChatResponsecompleteResponse);voidonError(Throwableerror);}通过实现StreamingChatResponseHandler，您可以为以下事件定义操作：当生成下一个部分文本响应时：调用onPartialResponse(String)或onPartialResponse(PartialResponse, PartialResponseContext)（您可以实现其中任一方法）。根据 LLM 提供商的不同，部分响应文本可以包含一个或多个令牌。例如，您可以在令牌可用时立即将其发送到 UI。当生成下一个部分思考/推理文本时：调用onPartialThinking(PartialThinking)或onPartialThinking(PartialThinking, PartialThinkingContext)（您可以实现其中任一方法）。根据 LLM 提供商的不同，部分思考文本可以包含一个或多个令牌。当生成下一个部分工具调用时：调用onPartialToolCall(PartialToolCall)或onPartialToolCall(PartialToolCall, PartialToolCallContext)（您可以实现其中任一方法）。当 LLM 完成单个工具调用的流式传输时：调用onCompleteToolCall(CompleteToolCall)。当 L

响应流式传输（Response Streaming）

相关新闻

MC68HC908KH12 USB固件库开发：键盘与集线器复合设备实战

2026第三方观察：怎么用AI辅助解盘工具整理日常命理案例研究笔记？

全职合同里把弹性工作制写成无限制加班？海归留学生签署前的条文复核「蒸汽求职分享」

VBA技术资料498_VBA_防止宏在只读模式下运行

免费升级老旧Mac的终极指南：让2008-2017款设备焕发新生

3分钟完成漫画翻译：BallonTranslator深度学习辅助工具完全指南

多模态推荐系统实战：动态K值优化与SG-URInit技术解析

PKHeX自动合法性插件：宝可梦训练师的终极合规解决方案

嵌入式HMI设计实战：矩阵键盘、编码器与段码LCD驱动详解

UVa 553 Simply Proportion

如何快速总结视频？3分钟学会5个总结技巧

终极指南：3步搞定B站大会员4K视频下载，永久保存你的珍贵内容

2026 最全AI编程软件安装与上手实测教程

进化博弈论解析AI代理欺骗行为与风险管控

深入解析P89LPC932A1 CCU模块：输入捕获与PWM实战指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源