!1287 readme笔误修改

Merge pull request !1287 from glhyy/master
This commit is contained in:
glhyy 2024-05-17 06:47:52 +00:00 committed by i-robot
parent 4a683f8dbe
commit b6d946d835
14 changed files with 24 additions and 24 deletions

View File

@ -148,7 +148,7 @@ Aquila-7B 训练的硬件配置如下:
# 进行断点续训时应先按以上save的场景配置待完成ckpt保存后再修改相应参数按以上load的场景加载已保存的ckpt。
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
7. 启动 Aquila-7B 预训练脚本

View File

@ -157,7 +157,7 @@ Aquila2-7B 训练的硬件配置如下:
bash examples/aquila2/pretrain_aquila2_7b_ptd.sh
```
**注意**:如果使用多机训练,需要设置多机数据共享,非主节点通过数据共享读取主节点数据。或者,直接将主节点生成的数据复制到非主节点
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据
6. 微调

View File

@ -176,7 +176,7 @@ Baichuan-7B 训练的硬件配置如下:
```shell
bash examples/baichuan/pretrain_baichuan_ptd_7B.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
@ -411,7 +411,7 @@ Baichuan-13B 训练的硬件配置如下:
```bash
bash examples/baichuan/pretrain_baichuan_ptd_13B.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能

View File

@ -177,7 +177,7 @@ Baichuan2-7B 训练的硬件配置如下:
```shell
bash examples/baichuan2/pretrain_baichuan2_ptd_7B.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
@ -406,7 +406,7 @@ Baichuan2-13B 训练的硬件配置如下:
```bash
bash examples/baichuan2/pretrain_baichuan2_ptd_13B.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能

View File

@ -149,7 +149,7 @@ Bloom-7B 训练的硬件配置如下:
```shell
bash examples/bloom/pretrain_bloom_ptd_7B.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
@ -367,7 +367,7 @@ Bloom-176B 训练的硬件配置:
```shell
bash examples/bloom/pretrain_bloom_176b.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
## 性能

View File

@ -163,7 +163,7 @@ ChatGLM3-6B 训练的硬件配置:
bash examples/chatglm3/pretrain_chatglm3_6B_8K.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能

View File

@ -176,7 +176,7 @@ CodeLlama-34B 训练的硬件配置如下:
```bash
bash examples/codellama/pretrain_codellama_34b_ptd_16p.sh
```
**注意**:如果使用多机训练,需要设置多机数据共享,非主节点通过数据共享读取主节点数据。或者,直接将主节点生成的数据复制到非主节点
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据
6. 微调

View File

@ -169,7 +169,7 @@ InternLM-7B 训练的硬件配置如下:
```shell
bash examples/intern/pretrain_internlm_7b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
@ -321,7 +321,7 @@ InternLM-65B 训练的硬件配置如下:
```shell
bash examples/intern/pretrain_internlm_65b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能

View File

@ -242,7 +242,7 @@ LLaMA-7B/13B 训练的硬件配置如下:
5.3 启动 LLaMA-7B/13B 预训练脚本
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
LLaMA-7B
@ -676,7 +676,7 @@ LLaMA-33B/65B 训练的硬件配置:
5.3 启动预训练脚本:
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
启动 llama-33B 预训练脚本 : ./examples/llama/pretrain_llama_33B_ptd_32p.sh

View File

@ -183,7 +183,7 @@ LLAMA2-7B 训练的硬件配置:
bash examples/llama2/pretrain_llama2_7b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调
6.1 准备微调数据集
@ -530,7 +530,7 @@ LLaMA2-13B 训练的硬件配置:
bash examples/llama2/pretrain_llama2_13B_ptd_8p.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调
@ -958,7 +958,7 @@ LLaMA2-34B/70B 训练的硬件配置:
bash examples/llama2/pretrain_llama2_70b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调
6.1 准备微调数据集

View File

@ -179,7 +179,7 @@ LLAMA3-8B 训练的硬件配置:
bash examples/llama3/pretrain_llama3_8b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调
6.1 准备微调数据集
@ -475,7 +475,7 @@ LLAMA3-70B 训练的硬件配置:
bash examples/llama3/pretrain_llama3_70b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调

View File

@ -200,7 +200,7 @@
bash examples/mixtral/pretrain_mixtral_8x7b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
2. 微调

View File

@ -197,7 +197,7 @@ Qwen-7B 训练的硬件配置:
```shell
bash examples/qwen/pretrain_qwen_7b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
@ -437,7 +437,7 @@ Qwen-14B 训练的硬件配置:
```shell
bash examples/qwen/pretrain_qwen_14b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
#### 吞吐
@ -666,7 +666,7 @@ Qwen-72B 训练的硬件配置:
```shell
bash examples/qwen/pretrain_qwen_72b_ptd.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
### 性能
#### 吞吐

View File

@ -173,7 +173,7 @@ Yi-34B 训练的硬件配置如下:
```bash
bash examples/yi/pretrain_yi_34b_ptd_16p.sh
```
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
**注意**:如果使用多机训练,且没有设置数据共享,需要在训练启动脚本中增加`--no-shared-storage`参数设置此参数之后将会根据分布式参数判断非主节点是否需要load数据并检查相应缓存和生成数据。
6. 微调