AI项目失败率达95%,数据治理成高质量数据集生产关键,企业该怎么做?

发布时间:2026/7/3 4:14:58

AI项目失败率达95%,数据治理成高质量数据集生产关键,企业该怎么做? 高质量数据集到底高在哪里AI并非遥不可及的玄学也不只是技术人的工具用其解决文案、数据整理等高频痛点可轻松提升生产力。某制药公司耗时一年、投入数千万想用AI辅助识别皮肤恶性肿瘤却出现尺子问题。据MIT统计企业中95%的AI项目以失败告终原因多为垃圾进垃圾出。2026年这逐渐成为共识6月国家数据局发布相关方案表明从以模型为中心转向以数据为中心。很多人对高质量数据集理解有误国家数据局文件明确其定义及要求且高质量并非数据天生属性而是经数据治理加工的结果。数据治理是高质量的生产车间多数企业对待数据如同工厂采购原材料后直接投入生产线无质检等环节。企业各系统数据定义和分类标准不同数据治理可解决这些问题体现在数据标准化、质量管控、血缘追踪和元数据管理四个层面。亿信华辰2025年项目实践显示引入大模型辅助数据治理后大型金融机构成本降低25%实施周期缩短30%数据治理是高质量数据集持续运营的底层基础设施。数据飞轮治理与质量的螺旋上升今年数据圈高频出现数据飞轮国家数据局文件描述其为良性循环安徽省数据局将其列为核心目标。以智能客服为例数据治理得到高质量数据训练模型模型部署后反哺数据集使数据质量、模型能力和业务价值提升但前提是数据治理要做好。行业的真实差距谁在认真做治理谁就赢在起跑线国家数据局方案指出全球人工智能发展转向以数据为中心高质量数据集是核心生产要素。现实中多数企业AI投入排序错误对比两家智能制造企业A企业数据治理好开展预测性维护AI模型效果好B企业数据治理空白问题不断。国家数据局发布方案是看到中国数据治理能力短板方案部署的六大专项行动旨在建立国家级标准和体系。企业该怎么做三个优先级负责企业数据工作可按三个优先级操作。第一明确用于AI的核心数据先求小而精再求大而全第二解决数据标准问题从核心业务指标入手第三用AI进行数据治理2025 - 2026年Data Agent工具已可落地。数据治理和高质量数据集是同一事物两面做好数据治理AI才能更好应用。

相关新闻