bev-project/project/8卡训练配置更新说明.txt

49 lines
1.3 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

===========================================
Phase 4A Stage 1 - 8卡训练配置更新
===========================================
更新时间: 2025-11-01 12:20 UTC
更新内容: 从4卡训练升级到8卡训练
【关键改进】
✅ 训练速度: 1.7×加速 (9.5天 vs 18天)
✅ GPU配置: 8×Tesla V100S-32GB
✅ 磁盘优化: evaluation.interval: 1→5
✅ 输出路径: work_dir指向/data分区
【新增文档】
1. Phase4A_Stage1_8GPU配置_20251101.md (11KB)
- 完整的8卡训练环境配置
- 硬件、软件、目录配置详解
- 启动脚本、监控命令
- 常见问题与解决方案
2. 8卡训练快速参考.md (1.2KB)
- 快速启动指南
- 常用监控命令
- 关键配置参数
【更新文档】
1. project/README.md
- 训练进展更新为8卡状态
- 添加8卡配置文档索引
- 更新时间表和监控命令
【配置文件】
- START_FROM_EPOCH1.sh: torchpack -np 4→8
- multitask_BEV2X_phase4a_stage1.yaml:
* work_dir: /data/runs/phase4a_stage1
* evaluation.interval: 1→5
【预计完成时间】
- Epoch 1: 2025-11-02 20:00
- Epoch 10: 2025-11-10 20:00
【查看方式】
cd /workspace/bevfusion/project
cat docs/Phase4A_Stage1_8GPU配置_20251101.md
cat docs/8卡训练快速参考.md
cat README.md
===========================================