华人团队提出大模型上下文窗口的自行扩展新方法SelfExtend,无需任何训练和微调,只需修改四行代码即可扩展现有大模型的上下文窗口长度,最高可增加3倍。
论文地址:
https://arxiv.org/abs/2401.01325.pdf
本文地址:https://www.163264.com/6000
华人团队提出大模型上下文窗口的自行扩展新方法SelfExtend,无需任何训练和微调,只需修改四行代码即可扩展现有大模型的上下文窗口长度,最高可增加3倍。
论文地址:
https://arxiv.org/abs/2401.01325.pdf
本文地址:https://www.163264.com/6000