ModelLink2/examples/legacy
wucong 3f52981fb0 !1962 修复llama2-7b训练16步左右oom
Merge pull request !1962 from wucong/fix_oom
2024-11-28 14:16:08 +00:00
..
aquila !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
aquila2 !1798 Aquila2权重转换mg-hf切换新框架 2024-10-31 06:36:48 +00:00
baichuan !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
baichuan2 !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
bloom !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
chatglm3 !1814 refactor trainer 2024-11-06 10:53:02 +00:00
codellama !1760 整理主线分支 README 2024-10-25 01:33:31 +00:00
gemma !1760 整理主线分支 README 2024-10-25 01:33:31 +00:00
gpt3 !1855 订正资料中的重计算参数 2024-11-07 02:16:12 +00:00
intern !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
llama !1962 修复llama2-7b训练16步左右oom 2024-11-28 14:16:08 +00:00
llama2 !1939 文档更新 2024-11-27 06:39:09 +00:00
llama3 !1814 refactor trainer 2024-11-06 10:53:02 +00:00
mistral !1760 整理主线分支 README 2024-10-25 01:33:31 +00:00
qwen !1806 Optim: llama3 qwen系列模型 预训练性能提升 2024-11-18 08:29:28 +00:00
qwen15 !1888 fix: 限制batch_p2p_comm参数关闭条件 2024-11-14 03:15:44 +00:00
yi !1760 整理主线分支 README 2024-10-25 01:33:31 +00:00