
1. CSV/JSON 迁移不是“点几下就完事”的事,而是上下文管理的临界点我接手一个遗留系统数据清洗任务时,原以为用 DBeaver 导入 23 万行 CSV 就是勾选几个框的事。结果第一次执行后,17% 的字段值全变成NULL,时间字段被强制转成1970-01-01,而 JSON 数组字段直接被截断成字符串"["—— 不是"["后面带内容,就是纯"["。重试三次,每次失败原因都不一样:一次是编码识别错把 UTF-8-BOM 当 GBK,一次是分隔符自动检测把\t误判为,,还有一次是 AI 辅助生成的导入脚本里漏写了jsonb类型强制转换,导致 PostgreSQL 报invalid input syntax for type json。这根本不是 DBeaver 的 bug。这是数据迁移中“隐性上下文”失控的典型症状:CSV 的编码、换行、引号嵌套、空值表示;JSON 的嵌套深度、特殊字符转义、数组 vs 对象歧义;数据库表结构对 NULL 的容忍度、约束触发时机、默认值覆盖逻辑——这些信息不会自动对齐,也不会被 AI 工具“看懂”,除非你把它变成可配置、可验证、可回滚的显式声明。更关键的是,当我在 DBeaver 里启用 AI 编程插件(比如集成 Claude Code 或本地部署的 DeepSeek-Coder 33B)辅助生成导入语句时,发现它默认只处理“理想 CSV”:无 BOM、无嵌套引号、无混合类型列、无缺