开源音频模型

开源项目

Standard Intelligence Lab推出的Hertz-Dev开源音频模型，实现了超低延迟的实时对话AI

Hertz-Dev 是一个开源音频模型，它具有 8.5 亿参数。该模型在延迟方面表现出色，理论延迟仅有 80 毫秒，实际延迟为 120 毫秒。这种低延迟的特性极大地提升了实时对话的体验，使得人与机器之间的交流更加流畅和自然。例如，在客户支持场景中，用户可以更快地得到回应，提高服务效率；在智能家居环境中，设备的响应速度更快，增强了用户的使用感受。地址： https://si.i…

2024年11月5日