LLaMA开源大模型源码分析
干货
作者:宋志学,成员
花了一晚上照着transformers仓库的 LLaMA 源码,把张量并行和梯度保存的代码删掉,只留下模型基础结构,梳理了一遍 LLaMA 的模型结构。
今年四月份的时候,我第一次接触深度学习,也是今年第一次接触,在和小伙伴
干货
作者:宋志学,成员
花了一晚上照着transformers仓库的 LLaMA 源码,把张量并行和梯度保存的代码删掉,只留下模型基础结构,梳理了一遍 LLaMA 的模型结构。
今年四月份的时候,我第一次接触深度学习,也是今年第一次接触,在和小伙伴
共有 0 条评论