ModelLink2/modellink
guoxinjie 62c40eef76 !1240 GPT3-175B 整理上库
Merge pull request !1240 from guoxinjie/gelu
2024-05-27 02:34:20 +00:00
..
core !1280 增加非共享储存情况下非主节点数据缓存检测和生成 2024-05-16 07:40:36 +00:00
data !1010 仓库patch形式修改 2024-03-14 03:12:09 +00:00
model !1240 GPT3-175B 整理上库 2024-05-27 02:34:20 +00:00
patchs !1269 新增Gemma-7B模型适配 2024-05-21 12:59:27 +00:00
tasks !1261 添加codellama-34B适配 2024-05-14 08:19:47 +00:00
tokenizer !1010 仓库patch形式修改 2024-03-14 03:12:09 +00:00
__init__.py !1218 迁移megatron patch 2024-04-23 01:57:03 +00:00
arguments.py !1304 添加确定性计算功能 2024-05-23 08:30:18 +00:00
checkpointing.py !1169 整理 tasks 文件目录,对外提供 evaluation和 inference.py 2024-03-27 07:55:22 +00:00
error_utils.py !1046 解决多机环境下训练,从机无法生成数据问题 2024-03-16 09:47:38 +00:00
initialize.py !1304 添加确定性计算功能 2024-05-23 08:30:18 +00:00
training.py !1223 将peft引入改为懒加载 2024-04-08 11:04:46 +00:00
utils.py !1304 添加确定性计算功能 2024-05-23 08:30:18 +00:00