aquila
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
aquila2
|
!1798 Aquila2权重转换mg-hf切换新框架
|
2024-10-31 06:36:48 +00:00 |
baichuan
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
baichuan2
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
bloom
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
chatglm3
|
!1814 refactor trainer
|
2024-11-06 10:53:02 +00:00 |
codellama
|
!1760 整理主线分支 README
|
2024-10-25 01:33:31 +00:00 |
gemma
|
!1760 整理主线分支 README
|
2024-10-25 01:33:31 +00:00 |
gpt3
|
!1855 订正资料中的重计算参数
|
2024-11-07 02:16:12 +00:00 |
intern
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
llama
|
!1962 修复llama2-7b训练16步左右oom
|
2024-11-28 14:16:08 +00:00 |
llama2
|
!1939 文档更新
|
2024-11-27 06:39:09 +00:00 |
llama3
|
!1814 refactor trainer
|
2024-11-06 10:53:02 +00:00 |
mistral
|
!1760 整理主线分支 README
|
2024-10-25 01:33:31 +00:00 |
qwen
|
!1806 Optim: llama3 qwen系列模型 预训练性能提升
|
2024-11-18 08:29:28 +00:00 |
qwen15
|
!1888 fix: 限制batch_p2p_comm参数关闭条件
|
2024-11-14 03:15:44 +00:00 |
yi
|
!1760 整理主线分支 README
|
2024-10-25 01:33:31 +00:00 |