苹果也开始学 Meta，完全开源了 OpenELM 一系列模型，包括270M、450M、1.1B和3B四个规模的模型

苹果公司在人工智能领域迈出了重要的一步，通过开源OpenELM系列模型，展示了其对开放科学和共享资源的承诺。以下是对苹果这一举措的优化文案：

**苹果公司推动AI开放创新，开源OpenELM系列模型**

苹果公司最近宣布了一个重大的人工智能开源项目——OpenELM，这一系列模型包括了从270M到3B不等规模的多个模型。这一举措不仅为AI研究和开发社区带来了前所未有的资源，也体现了苹果在推动技术创新和知识共享方面的领导力。

### **OpenELM系列模型亮点：**

– **全面开源：** 包括模型权重、推理代码以及完整的训练和评估框架。
– **数据集训练：** 提供了在公开数据集上进行模型训练的详细日志和多个保存点。
– **预训练设置：** 允许研究人员和开发者快速开始实验和定制。

### **CoreNet深度学习库：**

– **多样化模型支持：** 适用于从小型到大型的各种标准和创新模型。
– **多任务适用性：** 支持基础模型（如CLIP）、物体分类、检测和语义分割等多种任务。

### **OpenELM技术优势：**

– **参数分配策略：** 采用按层分配参数的方法，优化了Transformer模型的参数配置。
– **性能提升：** 在十亿参数规模下，OpenELM的准确率比OLMo提升了2.36%。
– **训练效率：** 预训练所需的Token数量减少了一半，显著提高了训练效率。

苹果公司的这一开源项目，不仅为AI社区提供了强大的工具，也为研究人员和工程师提供了一个平台，以促进创新和加速AI技术的发展。OpenELM系列模型和CoreNet深度学习库的开源，预示着一个更加开放和协作的AI研究时代的到来。

项目地址：

https://github.com/apple/corenet

模型下载：

https://huggingface.co/apple/OpenELM

论文地址：

https://arxiv.org/pdf/2404.14619.pdf

本文地址：https://www.163264.com/7002