Android开发转AI Agent:第2天——temperature调到1.5,LLM开始胡说八道

发布时间:2026/5/27 22:36:15

Android开发转AI Agent:第2天——temperature调到1.5,LLM开始胡说八道 作者一位Android开发工程师 | 2026年5月26日系列第1天已跑通基础API调用本篇拆解 temperature 和 max_tokens前言第1天我学会了用3行代码调用LLMresponseclient.chat.completions.create(modelturing/gpt-4o-mini,messages[{role:user,content:问题}],)answerresponse.choices[0].message.content但这3行代码里还藏着几个关键参数没有动过。今天的目标把temperature和max_tokens拆开看它们到底控制什么。temperature控制LLM的创造力temperature影响LLM输出时的随机性。类似Kotlin中Random(seed)的概念——种子固定输出就固定种子随机输出就随机。实验设计同一个问题给我3个App名字的建议面向健身人群用了三档temperaturefortempin[0.0,1.0,1.5]:responseclient.chat.completions.create(modelturing/gpt-4o-mini,messages[{role:user,content:question}],temperaturetemp,max_tokens200,)print(f--- temperature{temp}---)print(response.choices[0].message.content)实验结果temperature0.01. FitJourney - 强调健身过程中的成长与进步 2. PowerPulse - 传达力量与活力的感觉 3. WellnessHub - 集中于整体健康与健身temperature1.01. FitJourney - 强调健身过程中的旅程 2. PowerPace - 强调增强力量和运动节奏 3. HealthHaven - 传达健康的避风港概念前两档看起来挺正常。前两个名字几乎一样第三个换了个说法。temperature1.51. 动全力(MoveFull) - 强调全面性的连贯锻炼体验 2. 健身伙伴(FitBuddy) - 与好友一起参与健身 3. 强身日记(StrengthDiary) - 代览个人进展与可以为悄供密貼广阴展定位她 同时也兼修设目标与360度评 Lamb protein goods死皮加强米好gem设计发展意义...后半段直接变成了无意义乱码死皮加强米好gem设计、Lamb protein goods——LLM疯了。这不是API故障。temperature1.5时概率分布过于平坦低概率token包括无意义字符也被采样出来。修正实验安全区间把温度改成[0.0, 0.3, 0.7]重新跑全部正常输出temperature名字描述0.0FitJourney/PowerPulse/WellnessHub长描述正经0.3FitJourney/PowerPulse/FlexTrack长描述微调0.7FitJourney/PowerPulse/WellnessHub短描述随意temperature使用指南0.0 → 代码生成、JSON输出每次结果必须一致 0.3~0.5 → 翻译、格式化任务稳定但有点变化 0.7 → 日常聊天自然不死板 1.0 → 头脑风暴、起名字但要小心别超过1.2max_tokens控制回答长度另一个参数max_tokens限制LLM输出的最大长度。不设的话LLM可能一直写到自己停不下来。实验设计同一问题详细介绍Kotlin协程原理和使用场景设三档上限formax_tokin[30,100,300]:responseclient.chat.completions.create(modelturing/gpt-4o-mini,messages[{role:user,content:long_question}],temperature0.7,max_tokensmax_tok,)实验结果max_tokens30输出约38字Kotlin协程是一种轻量级的线程管理工具旨在简化异步编程和并发编程。它话说到一半就被截断了。max_tokens100输出约144字Kotlin协程是用于简化异步编程的一种机制...下面详细介绍原理和使用场景。 ### 原理 1. 协程的概念协程是一种轻量级的线程它们讲完了概念原理部分又被截断。max_tokens300输出约479字完整介绍了概念、挂起函数、协程构建器(launch/async)、 调度器(Dispatchers.Main/IO/Default)、使用场景...结构完整、内容充分。max_tokens使用指南50 → 一句话回答 200 → 一段话 500 → 长文章或详细分析如果怕浪费token先设小一点看看够不够不够再放大。比不限制让LLM写了删要好得多。今天的一句话总结temperature0是你给我老实点temperature1.5是放开说——但放开太狠LLM直接说胡话了。安全区间0~0.7生产环境建议0.3。下一篇预告第3天system prompt——同一个API换一行人设输出从代码变成产品报告再变成生活比喻。本系列记录一位Android开发者转行AI Agent的完整学习过程欢迎关注交流。

相关新闻