今日简讯 2024.8.15
OpenAI 公司于 8 月 13 日发布新闻稿,宣布推出 SWE-bench Verified 代码生成评估基准,解决了此前的局限性问题,能够更准确地评估人工智能模型在软件工程任务中的表现。
古尔曼:苹果计划最早于 2026 年推出桌面机器人,定价约 1000 美元。
稚晖君创业第二款产品:智元“远征 A2”机器人官宣 8 月 18 日发布。
Claude推出提示缓存功能,允许用户存储和重复使用特定上下文信息,为商业AI应用带来效率提升。
联想杨元庆:AI 绝不是泡沫,不要千军万马走“大模型”独木桥。
AI 破解 3000 年前甲骨文密码?
华人团队用 AI 做了一件非常有趣且有价值的事 —— 借助扩散模型破译甲骨文(OBS)。所提出的 OBSD 的概述流程。
输入的 OBS ˜X 经过扩散模型生成初始解密结果 X0,然后参考特定风格进行细化,以生成最终输出 XF 。
论文地址:
https://arxiv.org/pdf/2406.00684
UniPortrait:支持多角色一致性和风格参考
阿里巴巴集团研究团队发布了UniPortrait框架,专注于人像图像的个性化处理,它通过两个插件式模块:ID嵌入模块和ID路由模块,实现了高保真度的单ID和多ID人像定制。该模型通过解耦策略提取可编辑的面部特征,并将它们嵌入到扩散模型的上下文空间中。
项目地址:
https://aigcdesigngroup.github.io/UniPortrait-Page/
腾讯混元文生图开源模型上线三款ControlNet插件
一个基于Diffusion transformer的文本到图像生成模型,此模型具有中英文细粒度理解能力。混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。
项目地址:
https://dit.hunyuan.tencent.com/
三张视角图片即可生成逼真3D虚拟人
HeadGAP是一个先进的3D头像创建模型,它能够从少量甚至单张目标人物的图片中创建出逼真且可动画化的3D头像。该模型通过利用大规模多视角动态数据集来学习3D头部先验知识,并通过高斯Splatting基础的自解码网络实现动态建模。
项目地址:
https://headgap.github.io/
OpenAI 与大都会博物馆合作,借助 AI 唤醒“睡美人”
OpenAI 认为人工智能能够丰富我们的生活,使其更具创造性和美好。其与大都会艺术博物馆服装学院在“Sleeping Beauties: Reawakening Fashion”展览中的合作展示了这一潜力。通过合作创建了定制聊天体验,让 20 世纪初纽约社交名媛 Natalie Potter 的世界鲜活起来。
地址:
https://openai.com/index/the-met-museum/
来源:https://mp.weixin.qq.com/s/GkEBqXwhSo8B-F0krUyjOw
本文地址:https://www.163264.com/9303