bev-project/project/8卡训练配置更新说明.txt

49 lines
1.3 KiB
Plaintext
Raw Normal View History

===========================================
Phase 4A Stage 1 - 8卡训练配置更新
===========================================
更新时间: 2025-11-01 12:20 UTC
更新内容: 从4卡训练升级到8卡训练
【关键改进】
✅ 训练速度: 1.7×加速 (9.5天 vs 18天)
✅ GPU配置: 8×Tesla V100S-32GB
✅ 磁盘优化: evaluation.interval: 1→5
✅ 输出路径: work_dir指向/data分区
【新增文档】
1. Phase4A_Stage1_8GPU配置_20251101.md (11KB)
- 完整的8卡训练环境配置
- 硬件、软件、目录配置详解
- 启动脚本、监控命令
- 常见问题与解决方案
2. 8卡训练快速参考.md (1.2KB)
- 快速启动指南
- 常用监控命令
- 关键配置参数
【更新文档】
1. project/README.md
- 训练进展更新为8卡状态
- 添加8卡配置文档索引
- 更新时间表和监控命令
【配置文件】
- START_FROM_EPOCH1.sh: torchpack -np 4→8
- multitask_BEV2X_phase4a_stage1.yaml:
* work_dir: /data/runs/phase4a_stage1
* evaluation.interval: 1→5
【预计完成时间】
- Epoch 1: 2025-11-02 20:00
- Epoch 10: 2025-11-10 20:00
【查看方式】
cd /workspace/bevfusion/project
cat docs/Phase4A_Stage1_8GPU配置_20251101.md
cat docs/8卡训练快速参考.md
cat README.md
===========================================