ModelLink2/examples/mcore
徐源徽 9b70bd5cff !1829 llama2-7B mcore MFU优化,更新README性能数据
Merge pull request !1829 from 徐源徽/master
2024-10-31 10:47:55 +00:00
..
baichuan2 !1710 补充公网地址声明 2024-09-23 04:36:27 +00:00
chatglm3 !1761 新增奖励模型训练框架 2024-10-15 01:15:38 +00:00
codellama !1809 新增codellama lora推理 2024-10-23 07:42:57 +00:00
deepseek2 !1511 refactor: support Deepseek Specification 2024-10-21 07:57:37 +00:00
deepseek2_coder !1511 refactor: support Deepseek Specification 2024-10-21 07:57:37 +00:00
deepseek2_lite !1817 整改两处公网地址 2024-10-29 11:05:59 +00:00
gemma !1746 新增gemma2-9b mcore全参微调Loss对齐脚本 2024-10-14 02:17:16 +00:00
gemma2 !1746 新增gemma2-9b mcore全参微调Loss对齐脚本 2024-10-14 02:17:16 +00:00
glm4 !1663 权重转换参数更正 2024-09-13 01:02:14 +00:00
gpt4 !1601 新增gpt4 moe dropless 2024-09-04 01:13:13 +00:00
grok1 !1619 新增glm4模型适配 2024-09-05 13:05:30 +00:00
internlm2 !1651 【internlm2-20b】更新微调脚本,增加评估 2024-09-12 01:16:33 +00:00
internlm25 !1827 新增InternLM2.5系列模型适配ModelLink-mcore 2024-10-31 01:32:22 +00:00
llama2 !1829 llama2-7B mcore MFU优化,更新README性能数据 2024-10-31 10:47:55 +00:00
llama3 !1821 【mcore】llama3模型微调适配 2024-10-29 11:10:42 +00:00
llama31 !1828 llama3.1模型mcore适配 2024-10-30 11:02:56 +00:00
llama32 !1744 新增llama3.2-1b模型适配 2024-10-08 06:40:24 +00:00
minicpm !1813 新增MiniCPM-2B微调 2024-10-26 01:29:16 +00:00
mistral !1710 补充公网地址声明 2024-09-23 04:36:27 +00:00
mixtral !1817 整改两处公网地址 2024-10-29 11:05:59 +00:00
qwen2 !1759 新增Qwen2-7B/Qwen1.5-4B mcore全参微调脚本 2024-10-26 06:55:21 +00:00
qwen2_moe !1707 添加新模型Qwen2-57B-A14B 2024-09-24 14:40:52 +00:00
qwen15 !1759 新增Qwen2-7B/Qwen1.5-4B mcore全参微调脚本 2024-10-26 06:55:21 +00:00
qwen25 !1793 添加Qwen2.5-1.5B模型 2024-10-26 06:38:36 +00:00
yi !1676 Legacy模型Qwen1.5-32B适配mcore 2024-09-14 01:01:27 +00:00