# AI 驱动数据治理常见失败案例避坑指南

## 案例 1：AI 输出直接当成治理标准

**问题**：团队把 AI 生成的数据目录和指标口径直接发布，未经业务审核。

**后果**：
- 业务方发现指标口径与实际理解不符
- 数据仓库和 BI 仍在用旧口径，治理产物无法落地
- 重复沟通成本高于传统治理方式

**正确做法**：
- AI 输出只能作为候选标准，必须由业务、技术和安全负责人审核
- 审核记录要留痕：谁确认了什么、基于哪些数据、哪些内容有修改
- 发布前要确认治理产物能被 ETL、BI 和查询实际使用

## 案例 2：扫描范围未确认就接入生产库

**问题**：AI 扫描工具直接接入生产库，未限定只读范围和脱敏规则。

**后果**：
- 扫描过程触发生产库性能问题
- 敏感数据（客户邮箱、身份证）未经脱敏处理
- 安全团队紧急叫停项目

**正确做法**：
- 扫描前要确认只读范围、时间窗口和资源限制
- 涉及敏感数据的表必须脱敏或导出到测试环境
- 扫描过程要有安全和 DBA 监控

## 案例 3：合规边界由技术团队单方面确认

**问题**：敏感数据分级和权限规则由技术团队制定，未征求安全和法务意见。

**后果**：
- 合规审计发现数据分级不符合行业要求
- 对外报送数据的权限边界不清
- 需要重新评估和调整，浪费前期投入

**正确做法**：
- 合规边界必须由安全、法务和业务负责人共同确认
- 涉及个人信息、财务数据和对外报送的规则要书面确认
- 合规结论要纳入治理验收标准

## 案例 4：治理产物停留在文档层面

**问题**：数据目录、指标口径和质量规则只存在于 Word 或 PDF，无法被实际数据工作引用。

**后果**：
- ETL 和 BI 仍在用各自的理解和口径
- 治理投入无法转化为实际价值
- 后续维护成本高于建设成本

**正确做法**：
- 治理产物要落到字段级、可查询、可追溯
- 指标口径要连接到 ETL 规则、BI 模型和查询语句
- 质量规则要能在数据 pipeline 中实际执行

## 案例 5：证据链不完整导致无法审计

**问题**：治理变更只有最终标准，缺少扫描结果、模型建议和审核记录。

**后果**：
- 无法追溯"为什么当时这样确认"
- 审计或复盘时无法还原决策过程
- 争议处理时缺少依据

**正确做法**：
- 每次治理动作都要记录输入范围、扫描结果、参考来源、模型建议、人工修改和确认人
- 证据要保留版本信息和时间戳
- 有争议的内容要保留状态和复查计划

## 案例 6：启动范围过大导致无法收尾

**问题**：首次治理试图覆盖所有系统和数据，未限定优先级和试点范围。

**后果**：
- 项目启动后陷入无休止的协调和补充
- 核心业务域的问题被淹没在细节中
- 团队士气下降，项目半途而废

**正确做法**：
- 首次治理限定在一个业务域或一组核心表
- 验证流程后再扩展到更多系统
- 优先处理高频使用、高风险和已有争议的治理项

## 通用避坑原则

1. **AI 生成建议，人确认责任**：模型输出不能替代责任人的审核和确认
2. **只读或脱敏先行**：扫描和验证要在安全边界内进行
3. **合规边界共同确认**：涉及合规的内容必须由安全、法务和业务共同确认
4. **证据链完整可追溯**：每次治理动作都要保留完整的审计记录
5. **产物落地优先于数量**：确保标准能被实际使用，而非停留在文档
6. **限定试点范围**：先在一个业务域验证流程，再扩展到更多系统
7. **定期复盘和更新**：治理标准要随业务变化持续维护