GPT 的训练流程可粗略分为四个阶段:预训练、监督式微调、奖励建模、强化学习。
这篇内容的ppt来咯~
ppt地址:
https://karpathy.ai/stateofgpt.pdf
来源:https://mp.weixin.qq.com/s/Nk8eohrkMbwiFCMf7xKn8A
本文地址:https://www.163264.com/3840
GPT 的训练流程可粗略分为四个阶段:预训练、监督式微调、奖励建模、强化学习。
这篇内容的ppt来咯~
ppt地址:
https://karpathy.ai/stateofgpt.pdf
来源:https://mp.weixin.qq.com/s/Nk8eohrkMbwiFCMf7xKn8A
本文地址:https://www.163264.com/3840