
1. 项目缘起当代码遇见十四行诗几年前我还在为一个自然语言处理项目焦头烂额调试着那些永远不够“智能”的模型。某天深夜盯着屏幕上滚动的日志一行行冰冷的代码和报错信息让我突然冒出一个念头这些被我们用来处理客服对话、生成商品描述的算法如果让它们去触碰诗歌——这个人类情感与语言艺术的结晶会发生什么是会产生一堆毫无意义的字符乱码还是能意外地捕捉到一丝灵感的闪光这个念头像一颗种子在我心里埋了下来。“My Experiments With AI Poetry And Some Random Thoughts”这个项目标题准确地概括了我过去两年多时间里断断续续进行的一系列探索。它不是一个严谨的学术研究更像是一个程序员兼诗歌爱好者的个人实验室笔记。核心目标很简单用当下流行的生成式AI模型去尝试创作不同风格、不同主题的诗歌并在这个过程中观察、记录和思考技术与艺术碰撞时产生的所有火花、烟雾和那些令人困惑的残骸。这适合任何对AI内容生成感兴趣的人无论是想了解技术边界的产品经理还是寻找创作灵感的文字工作者亦或是单纯好奇“机器能否拥有创造力”的普通读者。我们即将踏上的是一场关于算法、语言美感和创作本质的跨界漫游。2. 实验设计与核心思路拆解2.1 为何选择诗歌作为实验场在开始堆砌代码之前我花了大量时间思考实验的载体。为什么是诗歌而不是小说、新闻或剧本这背后有几个核心考量。首先诗歌是语言的“压力测试”。它篇幅短小但密度极高每一个词的选择、每一处空格的留白、每一行节奏的起伏都承载着巨大的信息量和情感张力。对于AI模型而言生成一段通顺的五百字说明文或许不难但要在四行诗里构建意象、押韵、并传递某种统一的情绪其难度是指数级上升的。这能更尖锐地暴露出模型在语言理解、连贯性和创造性方面的真实水平。其次诗歌具有相对明确的评价维度。虽然“美”是主观的但我们可以从技术层面进行观察韵律是否工整意象是否新颖且自洽语法是否破格但有意义主题是否集中这些维度为我们分析AI输出提供了相对客观的锚点避免了陷入纯粹“我觉得好或不好”的模糊争论。最后诗歌是探索“可控生成”的绝佳场景。我们可以给模型非常具体的“提示词”比如“写一首关于夜晚离别的现代诗模仿海子的风格包含‘铁轨’和‘星光’的意象押‘ang’韵。”这种多约束条件下的创作能让我们清晰地看到模型对复杂指令的理解与执行能力这比让它自由发挥更有研究价值。基于这些思考我的实验框架围绕三个核心展开自由生成观察模型的“本能”、风格模仿测试模型的学习与迁移能力、条件创作探索人机协作的精细控制。整个技术栈建立在Python之上主要调用了OpenAI的GPT系列API和一些开源的文本生成模型如GPT-2的变体并辅以简单的韵律分析工具和自定义的评估脚本。2.2 工具选型与提示词工程心法工欲善其事必先利其器。在模型选择上我没有死磕某一个最先进的模型而是采用了“高低搭配”的策略。主力模型我选择了GPT-3.5-turbo和后来的GPT-4作为主要实验对象。原因在于它们的通用性强对自然语言指令的理解能力在闭源模型中首屈一指且API稳定易用。这对于快速进行大量提示词迭代实验至关重要。对比模型我同时运行了一些在诗歌语料上微调过的开源模型例如在古典诗词数据集上训练过的GPT-2。这些模型在特定风格上可能更“专精”但通用性和指令跟随能力较弱。将它们与GPT系列对比能看出“通才”和“专才”在诗歌创作上的不同表现。整个实验的灵魂不在于模型本身而在于提示词工程。我把它称为“与AI对话的艺术”。经过无数次试错我总结出几个有效的提示词构建心法角色设定法不要直接说“写一首诗”。而是说“你是一位深受东方美学影响的现代诗人擅长运用凝练的意象表达深邃的孤独感。请以这个身份创作一首短诗。”为AI赋予一个具体的“人格”其输出往往会更加聚焦和有特色。结构化指令法将复杂要求分解。例如主题都市夜晚的疏离感。 形式十四行诗Sonnet。 要求前八行提出一种观察或情绪后六行进行转折或深化尝试使用ABAB CDCD EFEF GG的韵式在第三行和第十行必须出现“玻璃”和“回声”这两个词。这种结构化的指令比一段散文式的描述更能被模型准确解析。示例引导法提供一两句你想要的风格示例。比如“请模仿下面诗句的语感和节奏‘雨是一生过错雨是悲欢离合’。写一首关于‘风’的诗。”模型会尝试捕捉示例中的语法结构和修辞特点。注意提示词不是越详细越好。过于冗长复杂的指令有时会让模型困惑导致它试图满足所有要求而产出不伦不类的结果。我的经验是核心约束不超过3条其余作为风格暗示即可。3. 核心实验过程与现象实录3.1 实验一自由生成——AI的“诗歌本能”我首先进行了最小干预的实验只给模型一个简单的主题词如“秋天”、“离别”、“灯塔”然后让模型自由发挥生成一首短诗。这个实验旨在剥离风格模仿和条件限制观察当前大语言模型在诗歌创作上的“原始冲动”或“基底风格”。过程我使用GPT-4以“请写一首关于‘记忆’的短诗不超过8行。”为提示进行了超过50次生成并记录了结果。典型输出示例记忆是锈蚀的钥匙 试图开启一扇不存在的门。 回声在走廊里堆积 灰尘般的光落满黄昏。 我们打捞沉船的词句 甲板上只有水渍的印痕。 所谓永恒不过是 潮汐反复擦拭的一道吻。现象分析意象的堆砌与关联AI非常擅长快速组合常见的诗歌意象如“锈蚀的钥匙”、“不存在的门”、“灰尘般的光”、“沉船的词句”。这些意象本身具有诗意且它们之间能通过“开启”、“堆积”、“打捞”等动词形成一种表面上的逻辑或情感关联。这显示出模型从海量语料中学到的“诗歌语言模式”。语法破格与陌生化像“灰尘般的光”这样的通感搭配是诗歌中常见的陌生化手法。AI能够习得并运用这种打破常规语法搭配的模式这是令人惊讶的一点。情感的“空转”这首诗读起来有氛围、有意象但缺乏一个真正打动人心的、具体的情感内核。它像是一个精美的、关于“记忆”的意象集合体但背后的情感是模糊的、泛化的。AI似乎能模仿情感的“形状”但难以注入情感的“重量”。结构的偶然性在多次生成中模型偶尔能产出结构工整如四行一节押大致相近的韵的诗但更多时候是自由体。押韵对于它来说并非必须遵守的规则而是一种概率性的输出。实操心得自由生成是获取灵感碎片的好方法。当你陷入创作瓶颈时让AI围绕一个主题生成几十个诗句其中总会有那么一两个意想不到的意象组合能点亮你的思路。但它不能替代真正的创作因为它缺乏意图性和情感的连贯性。3.2 实验二风格模仿——从李白到艾略特接下来我测试了AI的模仿能力。我选择了跨度极大的几位诗人中国古诗的李白豪放飘逸、现代诗的余秀华尖锐粗粝、西方现代主义的T.S.艾略特晦涩隐喻以及日本俳句的松尾芭蕉凝练静寂。过程我为每位诗人构建了特定的提示词包括对其风格的文字描述、1-2句代表作引用以及相同的创作主题如“山”。以模仿“李白风格”写“山”为例的提示词 “你正在模仿中国唐代诗人李白的诗歌风格。李白的特点是想象瑰丽、气势豪放、语言夸张流畅常融入神话元素和饮酒主题表达对自由和自然的向往。他的诗句如‘飞流直下三千尺疑是银河落九天’。请以李白的口吻和风格写一首关于‘山’的五言或七言古诗。”典型输出示例登昆仑 手可摘星辰足下生云烟。 仙人邀我饮玉液出石泉。 长啸震林壑群峰皆垂颜。 醉卧松风里不知今何年。现象分析表面特征抓取得很好这首诗里出现了“星辰”、“云烟”、“仙人”、“玉液”、“长啸”、“醉卧”等非常“李白”的词汇和意象整体气象也显得开阔不羁。在格式上它甚至模仿了五言古诗的句式。内核精神的缺失李白的诗豪放背后是深刻的孤独、怀才不遇的愤懑以及天人合一的哲学追求。而AI的这首诗更像是一个“李白元素”拼贴画有其形缺其神。它写出了“登高”和“饮酒”但诗句之间缺乏情感递进和思想深度最后落在“不知今何年”这种常见的仿古感叹上略显空洞。跨语言模仿的失真在模仿艾略特时问题更明显。AI能生成一些支离破碎的意象和看似深奥的句子但完全无法复制《荒原》中那种深厚的历史文化典故嵌套和整体的象征结构。它模仿的是“晦涩”的表象而非其复杂的肌理。避坑技巧让AI模仿风格时最好提供该诗人具体某首诗的分析作为上下文而不仅仅是风格描述。例如将《静夜思》的译文和“以月光思乡”的简单解析喂给模型再让它写“望月”效果会比单纯说“模仿李白”好很多。AI需要具体的“例子”而非抽象的“概念”。3.3 实验三条件创作——人机协作的精细舞蹈这是我最感兴趣的部分将人类创作者明确的意图通过精细的提示词“编译”给AI让AI成为实现创意的工具。我尝试扮演“诗歌导演”的角色给AI设定具体的场景、情绪、修辞手法甚至分行要求。一次完整的过程记录我的创作意图我想写一首诗表达在繁忙都市地铁站瞬间感受到的、与陌生人的微妙情感连接但这种连接转瞬即逝重回孤独。诗要冷峻、克制用具体的细节呈现避免直抒胸臆。构建提示词 “创作一首现代诗。场景下班高峰期的地铁站台。核心事件我与一个陌生人的目光有短暂接触。情绪瞬间的共鸣与接踵而至的更深的疏离感。风格极简主义白描手法语言冷峻如摄影镜头。要求全诗不超过12行必须出现‘荧光灯’、‘列车进站的风’、‘手机屏幕光’这三个意象避免使用‘孤独’、‘温暖’这类抽象情感词汇结尾要收得突然有悬停感。”AI输出经过3次微调提示后的版本荧光灯漂白所有颜色。 她抬头在玻璃的倒影里 与我共享一秒的失重。 列车进站的风掀动 同一页报纸的角落。 油墨字迹瞬间潮湿。 车门切开人群。 她低头没入手机屏幕的光晕 那枚小小的明亮的茧。 我留在原地成为 另一盏等待被校准的 钟。我的分析与调整AI很好地理解了“避免抽象词汇”的指令全程使用具象描写。“共享一秒的失重”、“油墨字迹瞬间潮湿”、“明亮的茧”这几处意象新颖且精准超出了我的预期我保留了。原输出结尾是“成为/地图上一个移动的错误的点。”我觉得“错误的点”这个比喻有点刻意和说教。我手动将其修改为“另一盏等待被校准的/钟。”让“钟”这个意象与开头的“荧光灯”都是人造光、规则之物形成呼应强调那种被系统规训的孤独感更含蓄有力。现象分析AI是强大的意象生成器和组合器在明确的约束下它能提供令人惊喜的、突破常规思维的意象连接如“手机屏幕光”与“茧”。人类是不可替代的编辑与品控AI无法判断哪个比喻更优、哪种结尾更有余韵。它提供选项和素材而人类需要基于整体的艺术感觉进行筛选、修改和定稿。上文中替换结尾就是一个典型例子。提示词是协作的协议协作的成败八成取决于提示词是否精准传达了人类的审美意图。这要求创作者本身对自己的需求有极其清晰的认知。4. 随机思考技术、艺术与创作本质的碰撞实验做多了输出的诗歌攒了几百首一些超越技术细节的“随机思考”便不由自主地浮现出来。这些思考没有定论更像是在人机交互的迷雾中插下的几根路标。4.1 AI是在“创作”吗何为创作这是一个老生常谈但每次实验都会逼我重新面对的问题。我的结论是目前的AI不是在创作而是在进行高度复杂的模式重组与概率生成。它没有表达的欲望没有非要诉说的情感没有对世界独特的观察。它所有的输出都是对训练数据中“在类似提示下哪些词句经常一起出现”这一统计规律的反映。当它写出一句优美的诗时并不意味着它理解了“美”而是意味着在它的参数空间中这个词序组合被计算为高概率的、“像诗”的输出。但这引出了另一个问题人类的创作是否完全脱离于“模式”我们学习写作不也是大量阅读输入数据模仿前辈的风格学习模式然后才逐渐形成自己的声音吗AI与人类的区别或许在于人类的学习过程中融入了具身经验、情感体验和主动的意图性选择。AI缺乏“体验”这一环它的“模式”是扁平的、文本的。因此更准确的描述可能是AI是一个拥有无限素材库和强大组合能力的“灵感模拟器”。它不能替代从情感到表达的那个完整创作闭环但它可以在这个闭环的多个环节如寻找初始意象、突破思维定式、提供修辞可能性提供前所未有的辅助。4.2 诗人会失业吗新角色的诞生完全不会。相反我认为AI诗歌生成可能会催生一种新的角色“诗歌策展人”或“语言雕塑家”。传统诗人的工作是从无到有地“挖掘”一首诗。而未来一个善于运用AI的创作者其工作流程可能变为定义核心情感与概念 - 设计精细的提示词“雕琢模具” - 从AI生成的大量变体中筛选、拼接、修改“筛选矿石与精加工” - 注入最终的个人判断与灵魂“点睛”。诗人的核心技能将从“词汇量”和“修辞技巧”部分转向“意图的精确澄清”、“审美判断力”和“编辑能力”。知道“自己要什么”比知道“怎么写”更重要。这其实是对创作者提出了更高的要求——你必须有更坚固的审美体系和更清晰的思想内核才能驾驭好AI这个强大的、但方向模糊的工具。4.3 伦理与真实性的薄冰当一首由AI生成、经过人类轻微修改的诗发表在杂志上并打动了许多读者它的“作者”是谁荣誉和版权归属于谁这是即将面临的现实问题。在我的实验中那些最让我满意的作品无一不是经过我深度干预和重写的。AI提供了最初的宝石或毛坯而我进行了切割、抛光、镶嵌。最终的作品是“混血”的。我认为透明度是关键。如果作品的核心创意、关键意象和最终结构来自AI那么坦率地说明协作过程是对读者和艺术本身的尊重。将AI产出稍作修改便完全据为己有宣称是个人独创这不仅涉及伦理长远看也会损害创作者自己的声誉。此外AI基于全网数据训练其生成可能无意中模仿了某位在世或去世诗人的特定句子或风格存在潜在的抄袭风险。作为使用者我们需要有意识地用AI生成的内容作为跳板走向更个人化的表达而不是停留在模仿的层面。5. 实操指南如何开始你的AI诗歌实验如果你看了以上内容也想亲手试试这里有一份从零开始的极简指南。5.1 环境准备与工具选择对于绝大多数初学者我强烈建议从云端API开始无需本地部署复杂模型。核心工具注册一个OpenAI的账户获取API Key。他们的Playground界面友好非常适合实验。初期使用GPT-3.5-turbo即可成本低能力对于诗歌探索已绰绰有余。辅助工具文本编辑器任何你喜欢的都可以用于保存和整理提示词与生成结果。韵律检查工具可选如果你写古体诗词可以找一些在线的平仄检测工具。但对于现代诗更重要的是语感和节奏这部分依赖你自己的耳朵。思维导图工具可选在构思复杂提示词时可以用它来梳理主题、意象、情绪、形式要求等维度。5.2 分步实验流程你可以完全遵循我上面的“三阶段”实验法由浅入深。第一步热身——自由联想动作在Playground里系统选择选择GPT-3.5或GPT-4在输入框写下简单的提示“写一首关于[你喜欢的任何事物如旧书店、雨声、失眠]的短诗4-8行。”目标感受AI生成的基本面貌收集让你心头一动的词语或句子。不要追求完整收集碎片。第二步定向挖掘——风格模仿动作找到一首你非常喜爱的短诗最好是现代诗。将这首诗和一句简单的指令输入“请模仿下面这首诗的语言风格和主题写一首关于‘[新主题]’的新诗。” 然后对比输出与原作的差异。目标理解AI如何解构和重组一种风格。第三步主动创造——条件生成动作这是最关键的一步。在动手写提示词前先在一张纸上回答这首诗想表达的核心情绪或观点是什么一句话说清我希望它发生在什么具体的场景或画面里必须出现哪2-3个核心意象我希望它读起来是舒缓的、急促的、沉重的还是轻盈的目标将你的答案组合成一段结构清晰的指令输入给AI。生成后将其作为草稿大胆删改、重组、增写。5.3 提示词编写高级技巧与常见问题当你熟悉基础流程后可以尝试这些技巧来提升输出质量温度参数在API中temperature参数控制随机性0.0到2.0。写诗时我通常设置在0.7到0.9之间。太低如0.2输出会过于保守和重复太高如1.5可能会变得荒谬不通。0.8左右能较好地平衡创造性与连贯性。系统消息在API调用中你可以设置一个system角色消息来固定AI的行为模式比如“你是一位才华横溢、意象新颖的当代诗人。你总是用具体、感性的意象来表达抽象的情感避免陈词滥调。”这相当于为整个对话设定了一个持久的“人格背景”。迭代与追问不要指望一次成功。把AI当成一个有时会跑偏的合作伙伴。如果它第一次生成不理想你可以指出问题并让它重写。例如“第二段的比喻太俗套了请换一个更出人意料但又贴切的比喻。”或者“整体情绪太悲观了请保留孤独感但加入一丝微弱的希望。”常见问题与解决速查表问题现象可能原因解决思路生成内容空洞全是陈词滥调提示词太宽泛如“写一首优美的诗”增加具体约束场景、感官细节视觉、听觉、一个具体的矛盾。诗歌结构散乱东一句西一句模型未能理解整体结构要求在提示词中明确分段指示如“诗分三段第一段写景第二段叙事第三段抒情”。完全无视押韵或格式要求模型不擅长严格的格律对于古体诗先让它生成内容你再后期调整平仄押韵。或使用专门微调过的古典诗词模型。输出过于晦涩难懂意象混乱Temperature参数可能过高或提示词中有矛盾指令调低Temperature至0.7以下。检查提示词确保情绪、意象、风格指令是自洽的而非互相冲突。生成内容总是很长不精简模型默认倾向于生成更多内容在提示词开头或结尾强调“简短”、“凝练”、“不超过X行”并设定max_tokens最大生成长度参数。6. 我的个人体会与未来遐想经历了这么多实验我最大的体会是AI是一面镜子它照出的不是它自己而是使用它的人。你输入模糊的意念它还你一堆华丽的碎片你输入清晰而独特的灵魂它才有可能成为帮你放大声音的喇叭。这个过程极大地训练了我自己——迫使我去厘清自己到底想表达什么什么样的意象才是真正属于我的而不是拾人牙慧。它没有让我写诗变得更“容易”因为真正的困难从来不是把字句码成行的技术而是那份需要被表达出来的、独一无二的感受。但它让这个过程变得更“丰富”了。以前卡在一个比喻上可能枯坐半小时现在我可以让AI给我十个、二十个关于“孤独”的比喻虽然大部分是糟粕但偶尔那一两个奇怪的角度就能像一把钥匙打开一扇新的门。至于未来我可能会尝试更复杂的协作形式。比如用AI生成多个诗歌的“开头”或“碎片”然后像拼贴画一样用人类的逻辑和情感线将它们串联、改编成一组主题相关的组诗。或者反过来我写好一个核心句子让AI围绕它去生成前因后果的段落看看它能将我的核心意象引向何方。技术会继续演进模型会越来越“聪明”。但诗歌或者说所有艺术最珍贵的那部分或许永远关乎于那颗在语言背后跳动着的、属于人的心灵。AI实验于我最终是一场关于如何更好地认识自己、表达自我的漫长练习。工具始终是工具而如何使用工具永远取决于那个握工具的手和它背后所承载的视野与生命体验。