.. |
baichuan2
|
!1710 补充公网地址声明
|
2024-09-23 04:36:27 +00:00 |
chatglm3
|
!1761 新增奖励模型训练框架
|
2024-10-15 01:15:38 +00:00 |
codellama
|
!1809 新增codellama lora推理
|
2024-10-23 07:42:57 +00:00 |
deepseek2
|
!1511 refactor: support Deepseek Specification
|
2024-10-21 07:57:37 +00:00 |
deepseek2_coder
|
!1511 refactor: support Deepseek Specification
|
2024-10-21 07:57:37 +00:00 |
deepseek2_lite
|
!1817 整改两处公网地址
|
2024-10-29 11:05:59 +00:00 |
gemma
|
!1746 新增gemma2-9b mcore全参微调Loss对齐脚本
|
2024-10-14 02:17:16 +00:00 |
gemma2
|
!1746 新增gemma2-9b mcore全参微调Loss对齐脚本
|
2024-10-14 02:17:16 +00:00 |
glm4
|
!1663 权重转换参数更正
|
2024-09-13 01:02:14 +00:00 |
gpt4
|
!1601 新增gpt4 moe dropless
|
2024-09-04 01:13:13 +00:00 |
grok1
|
!1619 新增glm4模型适配
|
2024-09-05 13:05:30 +00:00 |
internlm2
|
!1651 【internlm2-20b】更新微调脚本,增加评估
|
2024-09-12 01:16:33 +00:00 |
internlm25
|
!1827 新增InternLM2.5系列模型适配ModelLink-mcore
|
2024-10-31 01:32:22 +00:00 |
llama2
|
!1829 llama2-7B mcore MFU优化,更新README性能数据
|
2024-10-31 10:47:55 +00:00 |
llama3
|
!1821 【mcore】llama3模型微调适配
|
2024-10-29 11:10:42 +00:00 |
llama31
|
!1828 llama3.1模型mcore适配
|
2024-10-30 11:02:56 +00:00 |
llama32
|
!1744 新增llama3.2-1b模型适配
|
2024-10-08 06:40:24 +00:00 |
minicpm
|
!1813 新增MiniCPM-2B微调
|
2024-10-26 01:29:16 +00:00 |
mistral
|
!1710 补充公网地址声明
|
2024-09-23 04:36:27 +00:00 |
mixtral
|
!1817 整改两处公网地址
|
2024-10-29 11:05:59 +00:00 |
qwen2
|
!1759 新增Qwen2-7B/Qwen1.5-4B mcore全参微调脚本
|
2024-10-26 06:55:21 +00:00 |
qwen2_moe
|
!1707 添加新模型Qwen2-57B-A14B
|
2024-09-24 14:40:52 +00:00 |
qwen15
|
!1759 新增Qwen2-7B/Qwen1.5-4B mcore全参微调脚本
|
2024-10-26 06:55:21 +00:00 |
qwen25
|
!1793 添加Qwen2.5-1.5B模型
|
2024-10-26 06:38:36 +00:00 |
yi
|
!1676 Legacy模型Qwen1.5-32B适配mcore
|
2024-09-14 01:01:27 +00:00 |