微调大语言模型报错-尧图网站设计

模型微调时报错ValueError: Expected input batch_size (8) to match target batch_size (256).处理我这边是两种情况数据处理错误传入def preprocess_function(examples):函数中的examples数据格式有问题训练器错误。这个也是我自己比较粗心在创建训练器时指定的评估函数定义错误评估函数写成了数据处理函数。而在训练中传入评估函数的是三维数组的数据此时再调用tokenizer传入三维数组的token去处理数据就会报错# 创建训练器 trainer Seq2SeqTrainer( modelmodel, # 指定模型 argstraining_args, # 指定训练参数对象 train_datasettokenized_tarin_datasets, # 训练数据 eval_datasettokenized_validation_dataset, # 评估数据 tokenizertokenizer, # 指定tokenizer # data_collatordata_collator, compute_metricscompute_metrics, # 指定评估函数该函数会在每个评估点被调用以计算特定的评估指标。compute_metrics函数通常接受预测结果和真实标签作为输入并返回一个字典其中包含各种评估指标 )最后。我这个出现问题就是训练器的评估函数写错了附带好用的评估函数代码import numpy as np rouge load(D:\\project\\llm\\evaluate\\evaluate-main\\metrics\\rouge) # 评估函数 def compute_metrics(evaPred): # 获取predictions模型返回的预测文本, labels给定预期结果 inputs, predictions, labels evaPred decode_preds tokenizer.batch_decode(predictions, skip_special_tokensTrue) # 替换labels中的-100为pad填充 # np.where表达式数据替换条件-真-假 # 在序列到序列任务中-100 通常被用作一个特殊的占位符用来标记那些在计算损失时应该被忽略的位置 labels np.where(labels ! -100, labels, tokenizer.pad_token_id) decode_labels tokenizer.batch_decode(labels, skip_special_tokensTrue) scores rouge.compute(predictionsdecode_preds, referencesdecode_labels) print(scores) return scores

微调大语言模型报错

相关新闻

如何定制Docgen模板：创建个性化API文档样式的完整指南

AI方案铺完整条业务链，工业企业搞AI转型不用盲人摸象

Azure DevOps MCP Server源码解析：TypeScript实现MCP服务器的完整架构

别再傻傻分不清了！给嵌入式新手的FPGA与CPLD选型避坑指南

告别Keil MDK：在Win10上用VSCode + CMake + gcc-arm-none-eabi搭建STM32开发环境（保姆级避坑指南）

2026 Java面试宝典（春招/社招/秋招通用）：没有前言，只有答案，直接开背

MATLAB凸轮设计教学工具：拖拽调参+轮廓实时绘图+从动件运动仿真

TensorFlow中文社区官方文档项目深度解析：从入门到精通的深度学习实战指南与核心概念详解

基于51单片机的数字电压表Proteus仿真全套资料（含DSN电路、Keil源码、设计文档与调试记录）

MATLAB多用户MIMO下行预编码实现：块对角化干扰抑制方案

暗黑破坏神2终极优化指南：d2dx宽屏补丁让经典游戏焕发新生

深圳弱电箱生产厂家怎么选？采购前建议了解这几点

【英语学习笔记】基于“底层逻辑转换”与“去动词化”的英汉互译核心方法论及写作高分公式

终极视频下载解决方案：VideoDownloadHelper 完全指南

2026最新！AI论文写作工具测评：这几款知网都认可

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源