Mini-Omni是一款开源多模态大型语言模型,具有实时语音处理能力和边思考边说话的独特能力,为用户带来自然交互体验。它支持多种输入模态,包括语音和文本,展现出全面的实力和强大的潜力。Mini-Omni的 Any Model Can Talk 功能使得其他AI模型能够集成其实时语音能力,扩展了AI应用的可能性。

项目地址:
https://github.com/gpt-omni/mini-omni
论文地址:
https://arxiv.org/pdf/2408.16725

本文地址:https://www.163264.com/9799