8.1 KiB
8.1 KiB
Epoch 23 训练中的评估结果
来源: enhanced_training_6gpus.log (Phase 3训练日志)
评估时间: 2025-10-29 23:57
数据类型: 训练过程中的validation结果
✅ 找到了!训练日志中有完整评估结果
评估数据位置
文件: enhanced_training_6gpus.log
位置: 日志末尾(Epoch 23 validation部分)
时间: 2025-10-29 23:57:44
📊 Epoch 23 完整评估结果
3D目标检测性能
总体指标
NDS (nuScenes Detection Score): 0.6941 ⭐ 优秀
mAP (mean Average Precision): 0.6446 ⭐ 优秀
错误指标:
mATE (Translation Error): 0.2829 m
mASE (Scale Error): 0.2561
mAOE (Orientation Error): 0.3098 rad
mAVE (Velocity Error): 0.2468 m/s
mAAE (Attribute Error): 0.1869
评估时间: 126.3秒
Per-Class AP (各类别平均精度)
| 类别 | AP@0.5m | AP@1.0m | AP@2.0m | AP@4.0m | 性能评价 |
|---|---|---|---|---|---|
| Car | 0.7662 | 0.8664 | 0.8926 | 0.9039 | ⭐⭐⭐ 优秀 |
| Pedestrian | 0.8240 | 0.8366 | 0.8465 | 0.8579 | ⭐⭐⭐ 优秀 |
| Bus | 0.4871 | 0.7293 | 0.8429 | 0.8612 | ⭐⭐⭐ 优秀 |
| Motorcycle | 0.6062 | 0.7315 | 0.7599 | 0.7687 | ⭐⭐ 良好 |
| Traffic Cone | 0.7435 | 0.7510 | 0.7676 | 0.7935 | ⭐⭐ 良好 |
| Barrier | 0.5786 | 0.6772 | 0.7162 | 0.7304 | ⭐⭐ 良好 |
| Truck | 0.3965 | 0.5694 | 0.6640 | 0.7101 | ⭐ 可用 |
| Trailer | 0.1565 | 0.3713 | 0.5459 | 0.6612 | ⚠️ 中等 |
| Bicycle | 0.5482 | 0.5816 | 0.5883 | 0.6018 | ⚠️ 中等 |
| Construction Vehicle | 0.0386 | 0.2014 | 0.3661 | 0.4439 | ❌ 需改进 |
Per-Class错误分析
| 类别 | Trans Error | Scale Error | Orient Error | Vel Error | Attr Error |
|---|---|---|---|---|---|
| Car | 0.185 m ✅ | 0.153 ✅ | 0.059 rad ✅ | 0.252 m/s ✅ | 0.188 |
| Pedestrian | 0.133 m ✅ | 0.288 | 0.355 rad | 0.208 m/s ✅ | 0.092 ✅ |
| Truck | 0.331 m | 0.184 ✅ | 0.062 rad ✅ | 0.234 m/s ✅ | 0.210 |
| Bus | 0.333 m | 0.184 ✅ | 0.045 rad ✅ | 0.449 m/s ⚠️ | 0.265 |
| Motorcycle | 0.192 m ✅ | 0.240 | 0.271 rad | 0.328 m/s | 0.257 |
| Bicycle | 0.164 m ✅ | 0.256 | 0.406 rad ⚠️ | 0.177 m/s ✅ | 0.007 ✅ |
| Traffic Cone | 0.122 m ✅ | 0.318 | - | - | - |
| Barrier | 0.188 m ✅ | 0.279 | 0.051 rad ✅ | - | - |
| Trailer | 0.476 m ⚠️ | 0.208 | 0.631 rad ❌ | 0.216 m/s | 0.160 ✅ |
| Constr. Vehicle | 0.706 m ❌ | 0.452 ❌ | 0.909 rad ❌ | 0.111 m/s ✅ | 0.317 |
BEV分割性能
总体指标
mean IoU @max: 0.4130 (41.3%)
Per-Class IoU详细数据
1. Drivable Area (可行驶区域) ⭐⭐⭐ 优秀
IoU @max: 0.7063
IoU @0.35: 0.7045
IoU @0.40: 0.7063 ← 最佳阈值
IoU @0.45: 0.6964
IoU @0.50: 0.6770
IoU @0.55: 0.6504
IoU @0.60: 0.6201
IoU @0.65: 0.5880
表现: 非常好,大面积区域识别准确
2. Walkway (人行道) ⭐⭐ 良好
IoU @max: 0.5278
IoU @0.35: 0.5278 ← 最佳阈值
IoU @0.40: 0.5189
IoU @0.45: 0.4948
IoU @0.50: 0.4619
IoU @0.55: 0.4243
IoU @0.60: 0.3853
IoU @0.65: 0.3450
表现: 良好,中等面积区域识别较准
3. Pedestrian Crossing (人行横道) ⚠️ 可提升
IoU @max: 0.3931
IoU @0.35: 0.3931 ← 最佳阈值
IoU @0.40: 0.3700
IoU @0.45: 0.3266
IoU @0.50: 0.2747
IoU @0.55: 0.2212
IoU @0.60: 0.1725
IoU @0.65: 0.1292
表现: 中等,需要提升
4. Carpark Area (停车区域) ⚠️ 可提升
IoU @max: 0.3948
IoU @0.35: 0.3948 ← 最佳阈值
IoU @0.40: 0.3758
IoU @0.45: 0.3492
IoU @0.50: 0.3193
IoU @0.55: 0.2877
IoU @0.60: 0.2559
IoU @0.65: 0.2230
表现: 中等,需要提升
5. Stop Line (停止线) ❌ 需大幅提升
IoU @max: 0.2657 ← 关键改进目标
IoU @0.35: 0.2657 ← 最佳阈值
IoU @0.40: 0.2245
IoU @0.45: 0.1787
IoU @0.50: 0.1372
IoU @0.55: 0.1018
IoU @0.60: 0.0732
IoU @0.65: 0.0506
问题: 细线特征,0.3m BEV分辨率不足
目标: Stage 1提升到 0.35+ (目标+31%)
6. Divider (分隔线) ❌ 需大幅提升
IoU @max: 0.1903 ← 关键改进目标
IoU @0.35: 0.1903 ← 最佳阈值
IoU @0.40: 0.1361
IoU @0.45: 0.0856
IoU @0.50: 0.0470
IoU @0.55: 0.0222
IoU @0.60: 0.0090
IoU @0.65: 0.0029
问题: 最细线特征,0.3m分辨率严重不足
目标: Stage 1提升到 0.28+ (目标+47%)
🎯 关键发现
优势 ✅
3D检测
- Car检测: AP@4m = 0.9039,接近完美
- Pedestrian检测: AP@4m = 0.8579,优秀
- Bus检测: AP@4m = 0.8612,优秀
- 总体NDS: 0.6941,达到SOTA 97.2%
BEV分割
- Drivable Area: IoU 0.7063,优秀
- Walkway: IoU 0.5278,良好
- 大面积类别表现优秀
弱点 ⚠️
3D检测
-
Construction Vehicle: AP@4m仅0.4439
- Translation Error: 0.706m (最高)
- Orientation Error: 0.909 rad (最高)
- 原因: 样本少、形状多变
-
Trailer: AP@4m = 0.6612
- Orientation Error: 0.631 rad (高)
- 原因: 长条形状,角度难预测
BEV分割
-
Stop Line: IoU仅0.2657
- 目标: 0.35+ (+31%)
- 根本原因: 0.3m BEV分辨率对细线不足
-
Divider: IoU仅0.1903
- 目标: 0.28+ (+47%)
- 根本原因: 0.3m BEV分辨率对极细线严重不足
📋 与Stage 1对比基准
这就是我们需要的Baseline!
| 指标 | Epoch 23 (Phase 3) | Stage 1 目标 | 改进幅度 |
|---|---|---|---|
| 3D检测 | |||
| NDS | 0.6941 | 0.69+ | 保持 |
| mAP | 0.6446 | 0.64+ | 保持 |
| BEV分割 | |||
| 整体mIoU | 0.4130 | 0.48+ | +16% |
| Drivable Area | 0.7063 | 0.72+ | +2% |
| Ped Crossing | 0.3931 | 0.45+ | +15% |
| Walkway | 0.5278 | 0.56+ | +6% |
| Stop Line ⭐ | 0.2657 | 0.35+ | +31% |
| Carpark Area | 0.3948 | 0.45+ | +14% |
| Divider ⭐ | 0.1903 | 0.28+ | +47% |
🎉 结论
✅ 找到了完整的评估结果!
位置: enhanced_training_6gpus.log 末尾部分
内容:
- ✅ 完整的3D检测指标(NDS, mAP, per-class AP)
- ✅ 完整的BEV分割指标(mIoU, per-class IoU)
- ✅ 各类别详细错误分析
- ✅ 多个阈值下的IoU数据
意义:
- ✅ 这就是Phase 3的精确baseline
- ✅ 可以直接用于对比Stage 1
- ✅ 无需重新评估epoch 23
- ✅ 但仍建议运行完整评估以获得pkl结果文件
📊 是否还需要运行评估脚本?
两个选项
选项A: 不需要(够用)
已有数据:
✅ 训练日志中的validation结果
✅ 所有关键指标都有
✅ 可以直接用于对比
优势:
✓ 立即可用
✓ 节省2-3小时
✓ 节省GPU资源
劣势:
✗ 没有pkl结果文件
✗ 无法做深度分析(per-scene, failure cases)
选项B: 仍建议运行(更完整)
额外收益:
✅ 生成pkl结果文件(可深度分析)
✅ Per-scene性能分布
✅ 识别failure cases
✅ 可视化分析
✅ 更详细的报告
成本:
⏱️ 2.5-3小时
💻 GPU 4-7使用
💾 ~20GB磁盘空间
建议: 如果时间允许,仍建议运行完整评估
🚀 下一步建议
方案1: 使用现有数据(快速)
# 直接提取日志中的数据
grep -A 50 "NDS: 0.6941" enhanced_training_6gpus.log > epoch23_validation_results.txt
# 开始对比分析(等Stage 1 Epoch 1完成后)
方案2: 运行完整评估(推荐)
# 获得更完整的分析数据
cd /workspace/bevfusion
nohup bash EVAL_EPOCH23_COMPLETE.sh > eval_$(date +%Y%m%d_%H%M%S).log 2>&1 &
📁 相关文件
评估数据源
enhanced_training_6gpus.log
├─ Epoch 23 validation结果
├─ NDS: 0.6941
├─ mAP: 0.6446
└─ mIoU: 0.4130 (完整per-class数据)
文档
EPOCH23_训练中的评估结果.md ← 本文档
EPOCH23_评估与部署完整计划.md
EPOCH23_快速启动指南.md
PHASE3_EPOCH23_BASELINE_PERFORMANCE.md
状态: ✅ 已找到完整评估结果
来源: 训练日志validation
完整性: 包含所有关键指标
建议: 可选择是否运行完整评估