bev-project/archive/docs_old/EPOCH23_训练中的评估结果.md

8.1 KiB
Raw Blame History

Epoch 23 训练中的评估结果

来源: enhanced_training_6gpus.log (Phase 3训练日志)
评估时间: 2025-10-29 23:57
数据类型: 训练过程中的validation结果


找到了!训练日志中有完整评估结果

评估数据位置

文件: enhanced_training_6gpus.log
位置: 日志末尾Epoch 23 validation部分
时间: 2025-10-29 23:57:44

📊 Epoch 23 完整评估结果

3D目标检测性能

总体指标

NDS (nuScenes Detection Score): 0.6941  ⭐ 优秀
mAP (mean Average Precision):   0.6446  ⭐ 优秀

错误指标:
  mATE (Translation Error):     0.2829 m
  mASE (Scale Error):           0.2561
  mAOE (Orientation Error):     0.3098 rad
  mAVE (Velocity Error):        0.2468 m/s
  mAAE (Attribute Error):       0.1869

评估时间: 126.3秒

Per-Class AP (各类别平均精度)

类别 AP@0.5m AP@1.0m AP@2.0m AP@4.0m 性能评价
Car 0.7662 0.8664 0.8926 0.9039 优秀
Pedestrian 0.8240 0.8366 0.8465 0.8579 优秀
Bus 0.4871 0.7293 0.8429 0.8612 优秀
Motorcycle 0.6062 0.7315 0.7599 0.7687 良好
Traffic Cone 0.7435 0.7510 0.7676 0.7935 良好
Barrier 0.5786 0.6772 0.7162 0.7304 良好
Truck 0.3965 0.5694 0.6640 0.7101 可用
Trailer 0.1565 0.3713 0.5459 0.6612 ⚠️ 中等
Bicycle 0.5482 0.5816 0.5883 0.6018 ⚠️ 中等
Construction Vehicle 0.0386 0.2014 0.3661 0.4439 需改进

Per-Class错误分析

类别 Trans Error Scale Error Orient Error Vel Error Attr Error
Car 0.185 m 0.153 0.059 rad 0.252 m/s 0.188
Pedestrian 0.133 m 0.288 0.355 rad 0.208 m/s 0.092
Truck 0.331 m 0.184 0.062 rad 0.234 m/s 0.210
Bus 0.333 m 0.184 0.045 rad 0.449 m/s ⚠️ 0.265
Motorcycle 0.192 m 0.240 0.271 rad 0.328 m/s 0.257
Bicycle 0.164 m 0.256 0.406 rad ⚠️ 0.177 m/s 0.007
Traffic Cone 0.122 m 0.318 - - -
Barrier 0.188 m 0.279 0.051 rad - -
Trailer 0.476 m ⚠️ 0.208 0.631 rad 0.216 m/s 0.160
Constr. Vehicle 0.706 m 0.452 0.909 rad 0.111 m/s 0.317

BEV分割性能

总体指标

mean IoU @max: 0.4130 (41.3%)

Per-Class IoU详细数据

1. Drivable Area (可行驶区域) 优秀

IoU @max:  0.7063
IoU @0.35: 0.7045
IoU @0.40: 0.7063  ← 最佳阈值
IoU @0.45: 0.6964
IoU @0.50: 0.6770
IoU @0.55: 0.6504
IoU @0.60: 0.6201
IoU @0.65: 0.5880

表现: 非常好,大面积区域识别准确

2. Walkway (人行道) 良好

IoU @max:  0.5278
IoU @0.35: 0.5278  ← 最佳阈值
IoU @0.40: 0.5189
IoU @0.45: 0.4948
IoU @0.50: 0.4619
IoU @0.55: 0.4243
IoU @0.60: 0.3853
IoU @0.65: 0.3450

表现: 良好,中等面积区域识别较准

3. Pedestrian Crossing (人行横道) ⚠️ 可提升

IoU @max:  0.3931
IoU @0.35: 0.3931  ← 最佳阈值
IoU @0.40: 0.3700
IoU @0.45: 0.3266
IoU @0.50: 0.2747
IoU @0.55: 0.2212
IoU @0.60: 0.1725
IoU @0.65: 0.1292

表现: 中等,需要提升

4. Carpark Area (停车区域) ⚠️ 可提升

IoU @max:  0.3948
IoU @0.35: 0.3948  ← 最佳阈值
IoU @0.40: 0.3758
IoU @0.45: 0.3492
IoU @0.50: 0.3193
IoU @0.55: 0.2877
IoU @0.60: 0.2559
IoU @0.65: 0.2230

表现: 中等,需要提升

5. Stop Line (停止线) 需大幅提升

IoU @max:  0.2657  ← 关键改进目标
IoU @0.35: 0.2657  ← 最佳阈值
IoU @0.40: 0.2245
IoU @0.45: 0.1787
IoU @0.50: 0.1372
IoU @0.55: 0.1018
IoU @0.60: 0.0732
IoU @0.65: 0.0506

问题: 细线特征0.3m BEV分辨率不足
目标: Stage 1提升到 0.35+ (目标+31%)

6. Divider (分隔线) 需大幅提升

IoU @max:  0.1903  ← 关键改进目标
IoU @0.35: 0.1903  ← 最佳阈值
IoU @0.40: 0.1361
IoU @0.45: 0.0856
IoU @0.50: 0.0470
IoU @0.55: 0.0222
IoU @0.60: 0.0090
IoU @0.65: 0.0029

问题: 最细线特征0.3m分辨率严重不足
目标: Stage 1提升到 0.28+ (目标+47%)

🎯 关键发现

优势

3D检测

  • Car检测: AP@4m = 0.9039,接近完美
  • Pedestrian检测: AP@4m = 0.8579,优秀
  • Bus检测: AP@4m = 0.8612,优秀
  • 总体NDS: 0.6941达到SOTA 97.2%

BEV分割

  • Drivable Area: IoU 0.7063,优秀
  • Walkway: IoU 0.5278,良好
  • 大面积类别表现优秀

弱点 ⚠️

3D检测

  • Construction Vehicle: AP@4m仅0.4439

    • Translation Error: 0.706m (最高)
    • Orientation Error: 0.909 rad (最高)
    • 原因: 样本少、形状多变
  • Trailer: AP@4m = 0.6612

    • Orientation Error: 0.631 rad (高)
    • 原因: 长条形状,角度难预测

BEV分割

  • Stop Line: IoU仅0.2657

    • 目标: 0.35+ (+31%)
    • 根本原因: 0.3m BEV分辨率对细线不足
  • Divider: IoU仅0.1903

    • 目标: 0.28+ (+47%)
    • 根本原因: 0.3m BEV分辨率对极细线严重不足

📋 与Stage 1对比基准

这就是我们需要的Baseline

指标 Epoch 23 (Phase 3) Stage 1 目标 改进幅度
3D检测
NDS 0.6941 0.69+ 保持
mAP 0.6446 0.64+ 保持
BEV分割
整体mIoU 0.4130 0.48+ +16%
Drivable Area 0.7063 0.72+ +2%
Ped Crossing 0.3931 0.45+ +15%
Walkway 0.5278 0.56+ +6%
Stop Line 0.2657 0.35+ +31%
Carpark Area 0.3948 0.45+ +14%
Divider 0.1903 0.28+ +47%

🎉 结论

找到了完整的评估结果!

位置: enhanced_training_6gpus.log 末尾部分

内容:

  • 完整的3D检测指标NDS, mAP, per-class AP
  • 完整的BEV分割指标mIoU, per-class IoU
  • 各类别详细错误分析
  • 多个阈值下的IoU数据

意义:

  • 这就是Phase 3的精确baseline
  • 可以直接用于对比Stage 1
  • 无需重新评估epoch 23
  • 但仍建议运行完整评估以获得pkl结果文件

📊 是否还需要运行评估脚本?

两个选项

选项A: 不需要(够用)

已有数据:
  ✅ 训练日志中的validation结果
  ✅ 所有关键指标都有
  ✅ 可以直接用于对比

优势:
  ✓ 立即可用
  ✓ 节省2-3小时
  ✓ 节省GPU资源

劣势:
  ✗ 没有pkl结果文件
  ✗ 无法做深度分析per-scene, failure cases

选项B: 仍建议运行(更完整)

额外收益:
  ✅ 生成pkl结果文件可深度分析
  ✅ Per-scene性能分布
  ✅ 识别failure cases
  ✅ 可视化分析
  ✅ 更详细的报告

成本:
  ⏱️ 2.5-3小时
  💻 GPU 4-7使用
  💾 ~20GB磁盘空间

建议: 如果时间允许,仍建议运行完整评估

🚀 下一步建议

方案1: 使用现有数据(快速)

# 直接提取日志中的数据
grep -A 50 "NDS: 0.6941" enhanced_training_6gpus.log > epoch23_validation_results.txt

# 开始对比分析等Stage 1 Epoch 1完成后

方案2: 运行完整评估(推荐)

# 获得更完整的分析数据
cd /workspace/bevfusion
nohup bash EVAL_EPOCH23_COMPLETE.sh > eval_$(date +%Y%m%d_%H%M%S).log 2>&1 &

📁 相关文件

评估数据源

enhanced_training_6gpus.log
  ├─ Epoch 23 validation结果
  ├─ NDS: 0.6941
  ├─ mAP: 0.6446
  └─ mIoU: 0.4130 (完整per-class数据)

文档

EPOCH23_训练中的评估结果.md  ← 本文档
EPOCH23_评估与部署完整计划.md
EPOCH23_快速启动指南.md
PHASE3_EPOCH23_BASELINE_PERFORMANCE.md

状态: 已找到完整评估结果
来源: 训练日志validation
完整性: 包含所有关键指标
建议: 可选择是否运行完整评估