bev-project/project/docs/PRETRAINED_MODELS_INFO.md

3.2 KiB
Raw Blame History

BEVFusion 预训练模型说明

目录/workspace/bevfusion/pretrained/
总大小974 MB
文件数量8个


📁 可用的预训练模型

文件名 大小 用途 说明
bevfusion-det.pth 157 MB 3D检测 BEVFusion官方检测模型
bevfusion-seg.pth 165 MB BEV分割 BEVFusion官方分割模型
camera-only-det.pth 170 MB 纯相机检测 只使用相机的检测模型
camera-only-seg.pth 192 MB 纯相机分割 只使用相机的分割模型
lidar-only-det.pth 32 MB 纯LiDAR检测 只使用LiDAR的检测模型
lidar-only-seg.pth 46 MB 纯LiDAR分割 只使用LiDAR的分割模型
swint-nuimages-pretrained.pth 106 MB Backbone预训练 训练使用
swin_tiny_patch4_window7_224.pth 110 MB Backbone预训练 ImageNet预训练

🎯 推理用途

1. 使用epoch_19.pth你的训练模型

# 这是你训练了19个epoch的模型
# 包含检测+分割双任务
Checkpoint: runs/run-326653dc-74184412/epoch_19.pth (515 MB)

2. 使用官方bevfusion-seg.pth官方分割模型

# BEVFusion官方发布的分割预训练模型
# 可以用来对比你的模型性能
Checkpoint: pretrained/bevfusion-seg.pth (165 MB)

3. 使用官方bevfusion-det.pth官方检测模型

# BEVFusion官方发布的检测预训练模型
Checkpoint: pretrained/bevfusion-det.pth (157 MB)

🔍 推理对比方案

方案A评估你的epoch_19.pth

# 评估你训练的模型
torchpack dist-run -np 1 python tools/test.py \
    configs/.../multitask.yaml \
    runs/run-326653dc-74184412/epoch_19.pth \
    --cfg-options model.encoders.camera.backbone.init_cfg.checkpoint=pretrained/swint-nuimages-pretrained.pth \
    --eval bbox segm

预期性能

  • 检测 NDS: ~0.70
  • 分割 mIoU: ~40-45%

方案B评估官方bevfusion-seg.pth

# 评估官方分割模型(作为性能对比基准)
torchpack dist-run -np 1 python tools/test.py \
    configs/.../seg.yaml \
    pretrained/bevfusion-seg.pth \
    --eval segm

官方性能(参考):

  • 分割 mIoU: ~62-65%

方案C对比评估

先评估官方模型获得baseline再评估你的模型对比提升空间


💡 建议

推荐执行顺序

  1. 先评估官方模型(了解官方性能上限)

    # bevfusion-seg.pth
    
  2. 再评估你的epoch_19.pth(了解当前性能)

    # 你训练的模型
    
  3. 等增强版训练完成后评估epoch_23.pth(查看提升效果)

    # 6天后的增强版模型
    

📊 性能对比表(预期)

模型 检测NDS 分割mIoU 说明
官方bevfusion-seg N/A 62-65% 官方baseline
你的epoch_19 ~0.70 40-45% 原始配置
你的epoch_23增强版 ~0.70 55-60% 预期提升

差距分析

  • epoch_19 vs 官方:约-20% mIoU
  • epoch_23 vs 官方:约-5% mIoU目标

创建时间2025-10-21
状态 所有预训练模型可用