mirror of
https://gitee.com/ascend/ModelLink.git
synced 2024-12-05 05:17:40 +08:00
parent
4a683f8dbe
commit
b6d946d835
@ -148,7 +148,7 @@ Aquila-7B 训练的硬件配置如下:
|
||||
# 进行断点续训时,应先按以上save的场景配置,待完成ckpt保存后,再修改相应参数,按以上load的场景加载已保存的ckpt。
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
7. 启动 Aquila-7B 预训练脚本
|
||||
|
||||
|
@ -157,7 +157,7 @@ Aquila2-7B 训练的硬件配置如下:
|
||||
bash examples/aquila2/pretrain_aquila2_7b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,需要设置多机数据共享,非主节点通过数据共享读取主节点数据。或者,直接将主节点生成的数据复制到非主节点。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
6. 微调
|
||||
|
||||
|
@ -176,7 +176,7 @@ Baichuan-7B 训练的硬件配置如下:
|
||||
```shell
|
||||
bash examples/baichuan/pretrain_baichuan_ptd_7B.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
@ -411,7 +411,7 @@ Baichuan-13B 训练的硬件配置如下:
|
||||
```bash
|
||||
bash examples/baichuan/pretrain_baichuan_ptd_13B.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
|
@ -177,7 +177,7 @@ Baichuan2-7B 训练的硬件配置如下:
|
||||
```shell
|
||||
bash examples/baichuan2/pretrain_baichuan2_ptd_7B.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
@ -406,7 +406,7 @@ Baichuan2-13B 训练的硬件配置如下:
|
||||
```bash
|
||||
bash examples/baichuan2/pretrain_baichuan2_ptd_13B.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
|
@ -149,7 +149,7 @@ Bloom-7B 训练的硬件配置如下:
|
||||
```shell
|
||||
bash examples/bloom/pretrain_bloom_ptd_7B.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
@ -367,7 +367,7 @@ Bloom-176B 训练的硬件配置:
|
||||
```shell
|
||||
bash examples/bloom/pretrain_bloom_176b.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
## 性能
|
||||
|
||||
|
@ -163,7 +163,7 @@ ChatGLM3-6B 训练的硬件配置:
|
||||
bash examples/chatglm3/pretrain_chatglm3_6B_8K.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
|
@ -176,7 +176,7 @@ CodeLlama-34B 训练的硬件配置如下:
|
||||
```bash
|
||||
bash examples/codellama/pretrain_codellama_34b_ptd_16p.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,需要设置多机数据共享,非主节点通过数据共享读取主节点数据。或者,直接将主节点生成的数据复制到非主节点。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
6. 微调
|
||||
|
||||
|
@ -169,7 +169,7 @@ InternLM-7B 训练的硬件配置如下:
|
||||
```shell
|
||||
bash examples/intern/pretrain_internlm_7b_ptd.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
@ -321,7 +321,7 @@ InternLM-65B 训练的硬件配置如下:
|
||||
```shell
|
||||
bash examples/intern/pretrain_internlm_65b_ptd.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
|
@ -242,7 +242,7 @@ LLaMA-7B/13B 训练的硬件配置如下:
|
||||
|
||||
5.3 启动 LLaMA-7B/13B 预训练脚本
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
LLaMA-7B
|
||||
|
||||
@ -676,7 +676,7 @@ LLaMA-33B/65B 训练的硬件配置:
|
||||
|
||||
5.3 启动预训练脚本:
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
启动 llama-33B 预训练脚本 : ./examples/llama/pretrain_llama_33B_ptd_32p.sh
|
||||
|
||||
|
@ -183,7 +183,7 @@ LLAMA2-7B 训练的硬件配置:
|
||||
bash examples/llama2/pretrain_llama2_7b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
6. 微调
|
||||
|
||||
6.1 准备微调数据集
|
||||
@ -530,7 +530,7 @@ LLaMA2-13B 训练的硬件配置:
|
||||
bash examples/llama2/pretrain_llama2_13B_ptd_8p.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
6. 微调
|
||||
|
||||
@ -958,7 +958,7 @@ LLaMA2-34B/70B 训练的硬件配置:
|
||||
bash examples/llama2/pretrain_llama2_70b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
6. 微调
|
||||
|
||||
6.1 准备微调数据集
|
||||
|
@ -179,7 +179,7 @@ LLAMA3-8B 训练的硬件配置:
|
||||
bash examples/llama3/pretrain_llama3_8b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
6. 微调
|
||||
|
||||
6.1 准备微调数据集
|
||||
@ -475,7 +475,7 @@ LLAMA3-70B 训练的硬件配置:
|
||||
bash examples/llama3/pretrain_llama3_70b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
6. 微调
|
||||
|
||||
|
@ -200,7 +200,7 @@
|
||||
bash examples/mixtral/pretrain_mixtral_8x7b_ptd.sh
|
||||
```
|
||||
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
2. 微调
|
||||
|
||||
|
@ -197,7 +197,7 @@ Qwen-7B 训练的硬件配置:
|
||||
```shell
|
||||
bash examples/qwen/pretrain_qwen_7b_ptd.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
### 性能
|
||||
|
||||
@ -437,7 +437,7 @@ Qwen-14B 训练的硬件配置:
|
||||
```shell
|
||||
bash examples/qwen/pretrain_qwen_14b_ptd.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
### 性能
|
||||
|
||||
#### 吞吐
|
||||
@ -666,7 +666,7 @@ Qwen-72B 训练的硬件配置:
|
||||
```shell
|
||||
bash examples/qwen/pretrain_qwen_72b_ptd.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
### 性能
|
||||
|
||||
#### 吞吐
|
||||
|
@ -173,7 +173,7 @@ Yi-34B 训练的硬件配置如下:
|
||||
```bash
|
||||
bash examples/yi/pretrain_yi_34b_ptd_16p.sh
|
||||
```
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练脚启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数,设置此参数之后将会根据分布式参数判断非主节点是否需要load数据,并检查相应缓存和生成数据。
|
||||
|
||||
6. 微调
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user