OpenAI 发布AI 模型 GPT-4o,语音对话很丝滑,还免费

OpenAI 发布AI 模型 GPT-4o,语音对话很丝滑,还免费

OpenAI 欣然宣布推出旗下最新顶尖生成式 AI 模型——GPT-4o,“o”代表“omni”,凭借其Omni(全能)之名。该模型将逐步融入OpenAI各项产品中,让用户在未来几周内逐步感受其强大之处。最令人振奋的消息是,GPT-4o将向所有用户免费开放

OpenAI 发布AI 模型 GPT-4o,语音对话很丝滑,还免费

1. **多模态交互能力**:GPT-4o 能够处理文本、音频和图像的任意组合输入,并生成对应的任意组合输出,这使得它在交互上更为自然和灵活。

2. **快速响应**:GPT-4o 特别在音频交互方面表现出色,能够在极短的时间内(短至232毫秒)响应用户的语音输入,平均响应时间接近人类日常对话的反应时间。

3. **改进的视觉和音频理解**:与现有模型相比,GPT-4o 在视觉和音频理解方面有显著提升,特别是在非英语文本上的性能有了大幅提高。

4. **成本效益**:GPT-4o 的 API 速度快,速率限制高出5倍,而成本降低了50%,这使得它在商业应用上更具吸引力。

5. **免费提供**:OpenAI 宣布 GPT-4o 将免费提供给所有用户,尽管免费用户在使用量上有一定限制,但这一决策仍然具有里程碑意义。

6. **增强的语言支持**:GPT-4o 支持包括中文在内的20种语言进行音频等多模态交互,这扩大了其潜在用户群和应用场景。

7. **端到端的新模型**:GPT-4o 通过端到端训练,使得所有输入和输出都由同一神经网络处理,这提高了效率并减少了信息丢失。

8. **情感和语气识别**:GPT-4o 能够识别说话人的语气和情绪,并根据场景或指令生成带有丰富人类情绪特征的音频回复,甚至可以唱歌。

9. **图像处理能力**:GPT-4o 在图像处理方面也有显著提升,能够识别手写体、分析数据,并读懂画面中人物的面部表情。

10. **未来计划**:OpenAI 计划未来实现更自然、实时的语音对话,并通过实时视频与 ChatGPT 进行对话,同时还将推出具有新功能的语音模式。

11. **macOS 版应用**:发布了适用于 macOS 的新版 ChatGPT 桌面应用,简化了工作流程并提供了更直观的交互方式。

12. **新的用户界面**:OpenAI 为 ChatGPT 引入了新的外观和感觉,使得界面更加友好和具有对话性。

本文地址:https://www.163264.com/7170

(1)
上一篇 2024年5月11日 下午11:24
下一篇 2024年5月18日 下午11:44

相关推荐