一款开源多模态大型语言模型Mini-Omni，具有实时语音处理能力和边思考边说话的独特能力

2024年9月9日下午3:41 • 开源项目, 模型框架 • 阅读 3126

Mini-Omni是一款开源多模态大型语言模型，具有实时语音处理能力和边思考边说话的独特能力，为用户带来自然交互体验。它支持多种输入模态，包括语音和文本，展现出全面的实力和强大的潜力。Mini-Omni的 Any Model Can Talk 功能使得其他AI模型能够集成其实时语音能力，扩展了AI应用的可能性。

一款开源多模态大型语言模型Mini-Omni，具有实时语音处理能力和边思考边说话的独特能力

项目地址：

https://github.com/gpt-omni/mini-omni

论文地址：

https://arxiv.org/pdf/2408.16725

本文地址：https://www.163264.com/9799