一款开源多模态大型语言模型Mini-Omni,具有实时语音处理能力和边思考边说话的独特能力

Mini-Omni是一款开源多模态大型语言模型,具有实时语音处理能力和边思考边说话的独特能力,为用户带来自然交互体验。它支持多种输入模态,包括语音和文本,展现出全面的实力和强大的潜力。Mini-Omni的 Any Model Can Talk 功能使得其他AI模型能够集成其实时语音能力,扩展了AI应用的可能性。

一款开源多模态大型语言模型Mini-Omni,具有实时语音处理能力和边思考边说话的独特能力

项目地址:

https://github.com/gpt-omni/mini-omni

论文地址:

https://arxiv.org/pdf/2408.16725

一款开源多模态大型语言模型Mini-Omni,具有实时语音处理能力和边思考边说话的独特能力

本文地址:https://www.163264.com/9799

(1)
上一篇 2024年9月9日 下午3:37
下一篇 2024年9月9日 下午3:47