-
历史性突破!我国牵头立项具身智能领域首个国际标准,人形机器人话语权之争取得领先
据央视新闻报道,我国在国际标准化组织(ISO)成功立项具身智能领域全球首项国际标准《人形机器人数据集》,并推动成立了首个由我国专家担任召集人的工作组。这标志着我国在人形机器人国际标准制定领域实现从”跟跑”到”领跑”的转变。 核心看点 两个历史性零的突破:首次牵头制定人形机器人国际标准,首次担任机器人国际标准工作组召集人 全球最大市…
-
腾讯混元3D世界模型2.0开源发布:AI从对话画图进化到造世界,无缝对接游戏引擎
腾讯今日宣布混元3D世界模型2.0(HY-World 2.0)正式发布并全面开源。这款多模态世界模型标志着AI能力从”对话”、”画图”、”捏物体”正式进化到”造世界”——能够生成包含人、物、景的完整3D世界。 核心看点 多模态输入支持:文字、图片、视频均可作为输入,一键生成风格多样的…
-
Claude Opus 4.7重磅发布:高难度编程任务无需人工监督,视觉与记忆能力全面升级
Anthropic今日正式发布Claude Opus 4.7,距离上一代版本仅间隔两个月。这款主打高端软件开发能力的AI模型,在复杂编码任务处理上实现了质的飞跃。 核心看点 高难度编码 autonomy 提升:用户反馈称,此前需要严密人工把关的最复杂编码工作,现在可以放心交给Opus 4.7独立处理 视觉能力大幅增强:支持更高分辨率图像识别,专业任务中更具审美与创造力,可生成高…
-
DeepL 推出实时语音翻译功能:支持语音通话实时互译,96% 语言学家更青睐
专注于文字内容的语言 AI 企业 DeepL 今日宣布推出专为实时口语交流设计的翻译产品套件 DeepL Voice-to-Voice,正式进军语音翻译领域。 核心看点 推出 Voice-to-Voice 实时语音翻译套件 支持会议实时翻译、跨平台对话、跨语言群组对话 盲测中 96% 语言学家更青睐 DeepL Voice 而非谷歌、微软、Zoom 方案 让每个人都能用自己的母…
-
腾讯混元 3D 世界模型 2.0 开源发布:AI 从”捏物体”进化到”造世界”,直接导出游戏可用资产
腾讯今日宣布,混元 3D 世界模型 2.0(HY-World 2.0)正式发布并开源。这款多模态世界模型让 AI 从”对话”、”画图”、”捏物体”,进化到了“造世界”——生成包含人、物、景的完整”世界”。 核心看点 支持文字、图片、视频等多模态输入生成 3D …
-
Anthropic 发布 Claude Opus 4.7:高难度编码任务无需人工监督,Mac 端 Claude Code 同步升级
Anthropic 今日正式发布其最新旗舰 AI 模型 Claude Opus 4.7。距离上次的 Opus 4.6 仅间隔两个月,Anthropic 保持着稳定的模型迭代节奏。 核心看点 在超高难度编码任务上,所需人工监督大幅减少 视觉能力大幅增强,支持更高分辨率图像识别 新增多会话记忆能力,能记住跨会话的关键信息 Mac 端 Claude Code 新增自动模式和 /ult…
-
DeepL进军实时语音翻译:96%语言学家更青睐,打破口语交流语言壁垒
4月16日,以文字翻译闻名的德国AI公司DeepL正式宣布推出实时语音翻译产品套件DeepL Voice-to-Voice,标志着这家翻译领域的”隐形冠军”正式进军口语交流市场。 核心看点 专为实时口语交流设计,支持语音通话实时翻译 盲测中96%的语言学家更青睐DeepL Voice,胜过谷歌、微软、Zoom原生方案 套件包含会议翻译、跨平台对话、跨语言…
-
腾讯混元3D世界模型2.0开源发布:AI从”捏物体”进化到”造世界”,无缝对接游戏引擎
4月16日,腾讯正式宣布混元3D世界模型2.0(HY-World 2.0)发布并全面开源。这款多模态世界模型标志着AI能力的一次重大跃迁——从”对话”、”画图”、”捏物体”,正式进化到了”造世界”。 核心看点 支持文字、图片、视频多模态输入,一键生成可漫游的完整3D世界 直接输出可编…
-
Anthropic发布Claude Opus 4.7:高阶编程能力再进化,复杂编码任务无需人工紧盯
4月16日,AI巨头Anthropic正式推出Claude Opus 4.7,这是其旗舰大语言模型的又一次重大升级。距离上次更新仅两个月,Anthropic正保持着稳定的两月一更节奏,持续向开发者社区输出更强悍的编程助手。 核心看点 超高难度编码任务所需人工监督大幅减少,可放心托付最复杂的工程挑战 视觉能力大幅增强,支持更高分辨率图像识别,界面设计审美显著提升 多会话记忆能力升…
-
OpenAI Codex 重大更新:从写代码工具变成能操作电脑的 AI 助手
OpenAI 给 Codex 推了一次重大升级,把这个每周被 300 多万开发者使用的编程助手,从写代码的扩展成了能操作整台电脑的工作伙伴。 核心升级:电脑操作能力 Codex 现在能自己看屏幕、自己点鼠标、自己敲键盘,在 Mac 上跑多个 agent 并行干活,而且不会抢占你正在用的其他窗口。这对于那些没开放 API 的软件特别有用——以前 agent 碰到这类应用就歇菜,现…