百川智能发布超千亿大模型Baichuan 3，宣称中文评测超越GPT-4

1月29日，百川智能发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan 3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色，证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。

不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan 3还突破“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面表现优异，领先于其他大模型。

链接：https://www.baichuan-ai.com/

百川智能发布了超千亿参数的大语言模型Baichuan 3，该模型在多个权威评测中展现出色的能力。以下是Baichuan 3的主要亮点：

1. 基础能力全面提升：Baichuan 3在多个通用能力评测中超越了GPT-4，尤其在中文任务上表现出色。

2. 医疗能力突出：Baichuan 3在医疗领域的评测中表现优异，超过了GPT-4，成为中文医疗任务表现最佳的大模型。

3. 突破“迭代式强化学习”技术：Baichuan 3通过“迭代式强化学习”技术提升了语义理解和生成能力，在诗词创作等任务上表现优异。

4. 数据质量、训练稳定性和训练效率优化：百川智能采用了多种创新技术手段和方案，提升了Baichuan 3的数据质量、训练稳定性和训练效率。

5. 强化学习训练框架优化：百川智能自研了PPO训练框架，支持超千亿模型的高效训练，训练效率相比业界主流框架提升400%。

总的来说，Baichuan 3在多个领域展现出色的能力，具备强大的通用能力和医疗能力，突破了“迭代式强化学习”技术，优化了数据质量、训练稳定性和训练效率。这将为百川智能的超级应用提供有力支撑。

本文地址：https://www.163264.com/6278

百川智能发布超千亿大模型Baichuan 3，宣称中文评测超越GPT-4

相关推荐