1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。
不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan 3还突破“迭代式强化学习”技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现优异,领先于其他大模型。
链接:https://www.baichuan-ai.com/
百川智能发布了超千亿参数的大语言模型Baichuan 3,该模型在多个权威评测中展现出色的能力。以下是Baichuan 3的主要亮点:
1. 基础能力全面提升:Baichuan 3在多个通用能力评测中超越了GPT-4,尤其在中文任务上表现出色。
2. 医疗能力突出:Baichuan 3在医疗领域的评测中表现优异,超过了GPT-4,成为中文医疗任务表现最佳的大模型。
3. 突破“迭代式强化学习”技术:Baichuan 3通过“迭代式强化学习”技术提升了语义理解和生成能力,在诗词创作等任务上表现优异。
4. 数据质量、训练稳定性和训练效率优化:百川智能采用了多种创新技术手段和方案,提升了Baichuan 3的数据质量、训练稳定性和训练效率。
5. 强化学习训练框架优化:百川智能自研了PPO训练框架,支持超千亿模型的高效训练,训练效率相比业界主流框架提升400%。
总的来说,Baichuan 3在多个领域展现出色的能力,具备强大的通用能力和医疗能力,突破了“迭代式强化学习”技术,优化了数据质量、训练稳定性和训练效率。这将为百川智能的超级应用提供有力支撑。
本文地址:https://www.163264.com/6278