30天，4位杰青，3所985：一个退学博士如何用统计揪出学术造假-尧图网站设计

源自风暴统计网一键统计分析与绘图的网站2026年4月到5月一个叫“耿同学讲故事”的B站UP主用30天时间实名举报了4位国家杰青。覆盖同济、南开、中山三所985。同济大学已发布通报确认学术不端——院长免职第一作者解聘。其余三所高校的调查仍在进行。其最新视频表示“杰青造假的素材我手里还有而且不止一个同济大学、华东师范大学、湖南大学和中山大学等4所高校5个杰青。请各位自查。”这场由民间发起的学术打假风暴处理力度在中国学术界极为罕见。而耿同学最核心的武器不是什么黑科技——是你我都学过的统计学。√时间线盘点4月12日第一枪。耿同学质疑同济大学生命科学与技术学院院长、长江学者、国家杰青王平团队发表于《自然》的论文存在数据异常与图片重复。4月16日追加举报王平团队另一篇Nature子刊论文。4月25日第二枪。举报南开大学生命科学学院院长、院士候选人、国家杰青陈佺发表于Nature子刊《Nature Cancer》的论文数据造假。5月4日第三枪。举报中山大学肿瘤防治中心副主任、国家杰青康铁邦存在图片异常与数据造假嫌疑论文发表于《Nature Cell Biology》。5月7日第四枪。同一所大学举报中山大学生命科学学院副院长、国家杰青邝栋明。√耿同学的核心武器对原始数据的复查耿同学的本硕专业是生物学博士退学前读的是北航生物医学工程。他不是统计学教授但他懂一个最基本的道理真实实验数据一定有自然波动。造假的人不懂这个。他们以为“整齐”的数据看起来更漂亮却不知道——太整齐恰恰是最大的破绽。耿同学在采访中反复提到一个数字“70个数据有51个小数点后一位是0或5。”图源耿同学讲故事在真实的连续测量中小数点后一位的数字应该大致均匀分布在0-9之间。0或5出现的概率各是1/10合计20%。但51/70≈73%。这个偏离程度不可能是巧合。换个说法单个数据末位是0或5的概率是20%。70个数据中出现51个以上的概率是多少这个数字你翻遍概率表都找不到——因为太小了小到可以忽略不计。而南开大学证据更直接论文补充材料中64个实验数据的小数点后两位完全相同。图源耿同学讲故事64组独立测量数据小数点后两位全部相同。小数点后两位可以取00到99共100种可能。64组数据全部相同的概率是100的64次方分之一。这个数字有多大比宇宙中的原子总数还大得多。不是“不太可能”是绝对不可能。耿同学自己说了一句话被多家媒体引用“单个数据异常的事件发生概率极低如亿分之一你遇到一次是幸运。可一篇论文里这类‘小概率事件’反复出现就绝非巧合。”√他是怎么做到的耿同学在采访中披露了他的方法第一步用AI工具对论文原始数据进行初筛——重点看数字末位分布、小数位规律、不同表格之间的数据是否雷同。第二步人工复核。他会把异常数据发给志愿加入打假的同学进行多人交叉验证。第三步只有反复确认“百分百造假”后才对外发布。他的打假逻辑本质上是一套假设检验原假设H₀数据是真实测量得到的。如果数据存在极端规律性末位大量集中在0和5、多组数据完全相同那么H₀成立的概率极低——拒绝H₀判定为造假。这不是“我觉得有问题”这是“数据自己说了话”。√为什么造假者会犯这种错误从统计角度看这是一种行为经济学现象造假者不知道真实数据的统计特征方差、末位分布、小数位变化他们以为“整齐”的数据看起来更“漂亮”他们不知道统计学里有一条铁律真实数据的“不完美”恰恰是它的“防伪标记”耿同学在采访中直接点破“有些造假手段之低劣让我觉得很想笑。作者连演都不演了只要稍微掩饰一下其实我看出不来。可是他们仿佛已经造假造习惯了有种‘你还能拿我怎么样’的猖狂感。”√学术验证机制的疏漏我在之前的文章里聊过两个案例NEJM皮尺事件标尺刻度乱掉。图像是数据AI修图改变测量参照系等于破坏证据。Lancet造假引用参考文献不存在。中国医生用AI修图导致一篇NEJM病例报告在发表11天后被撤稿Lancet主刊大语言模型普及后引用造假暴涨12倍98.4%问题文章未被处理今天这篇说的是同一个道理数据的特征是真实性的天然指纹。三个事件指向同一个核心问题当前的学术验证机制默认数据是真的。没有人系统性地检验“数据是否像真的”。√事件小结耿同学在接受采访时说了一句话引人深思“自打假以来没有任何一篇问题论文是官方自己去找出来的。这是迄今为止让我感到最失望的一点。”30天4位杰青3所985。每一个线索都来自网友投稿。他收到的线索太多根本看不完只能“随缘、按顺序核查”。这不是正常的状态。学术监督不应该靠一个退学博士在B站发视频来完成。但至少现在有人把窗户纸捅破了。关于郑老师团队及公众号【因果推断与机器学习】未来医学科研的大势所趋临床、护理、公卫的朋友们2026年将是诸位因果推断方法革新的一年。郑老师团队推出“因果推断与机器学习”训练营丰富的因果推断方法教学课程理论结合R语言实操覆盖从基础到进阶的完整链条欢迎参加模块一理论1.流行病任务与因果推断2.因果推断与偏倚控制模块二回归与G方法3.回归的方法及其应用4.G方法及实践模块三倾向得分5.倾向得分方法6.倾向得分加权模块四机器学习7.机器学习理论8. 机器学习与 G方法9.机器学习与倾向得分模块五双重稳健估计方法10.双重稳健方法11.双重机器学习模块六TMLE方法12.TMLE 方法13.机器学习与 TMLE方法模块七缺失数据填补与因果推断14.缺失数据填补与机器学习15.缺失数据填补后双重稳健估计模块八中介分析与因果中介16.中介分析与因果中介17.双重稳健估计下的中介分析模块九处理效应异质性分析18.处理异质性分析方法19.因果森林方法报名训练营请添加郑老师助教微信咨询微信aq566665

30天，4位杰青，3所985：一个退学博士如何用统计揪出学术造假

相关新闻

M3U8下载器：3分钟快速下载在线视频的终极指南

避坑指南：在Ubuntu 20.04上从零搭建MIT BEVFusion环境（含CUDA 11.3、PyTorch 1.10配置）

AI CLI 三巨头横评：Claude Code vs Codex CLI vs Gemini CLI（2026实测）

终极指南：Browsershot - PHP开发者必备的网页截图与PDF生成神器

AI Agent客服已过概念期——2024Q2行业渗透率突增至41.6%，但仅7.3%企业实现L3级自主决策闭环（附自评诊断表）

Windows 版 Codex Desktop 配合 APINebula 中转站配置指南（非 CLI）

开发者速领！小米 MiMo 期间大模型 Token 免费申请保姆级教程（附亿级额度过审模板）

DECA加速器：突破LLM推理内存瓶颈的硬件优化方案

Kiro AI 编程工具企业版 vs 个人版：25+ 人团队真实费用对比与选型指南（2026）

2026 主流技术栈：hermes agent多环境安装配置：Windows/Mac/Linux

机器学习评价指标之综合指标的关系

HS2-HF_Patch：Honey Select 2 终极汉化与功能增强完整指南

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程