行业/好文

Meta提出了一种名为AudioSeal的技术，该技术能够在人工智能生成的语音中嵌入隐形水印

Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术，该技术能够在人工智能生成的语音中嵌入隐形水印，用于主动检测AI生成的言论，同时还能够识别生成它的具体模型。人工智能语音合成技术的迅速发展使得虚构的人类语音变得极为逼真。然而，这也引发了对声音克隆、深度伪造和其他形式的音频操纵的担忧。为了有效区分真实录音和音频深度伪造，需要强…

2024年2月4日

行业/好文

OpenAI推出适用于Apple Vision Pro的ChatGPT应用

OpenAI近日发布了一款名为ChatGPT for Vision Pro的应用程序，使用户能够通过文本、图片和语音与Apple Vision Pro进行多模态AI交互。这标志着OpenAI在人机交互领域迈出了重要一步，展示了AI对人类的潜在影响。ChatGPT成为了visionOS的首批应用之一，利用Apple Vision Pro操作系统提供了无缝、沉浸式的数字内容体验。该…

2024年2月4日

应用

SVD视频生成模型的Web平台开始发放测试资格

Stable Video Diffusion是一种AI视频生成技术，可以从静态图像或文本创建动态视频，代表了视频生成技术的新进展。它通过图像预训练、视频预训练、高质量视频微调和多视角3D先验等步骤，提供高质量的视频生成。主要功能包括将图像转化为视频、将文本转化为视频等。Stable Video Diffusion可以革新内容创作，从而自动生成创意广告、电影预告片、教育视频、游戏…

2024年2月4日

行业/好文

谷歌Gemini Pro扩展至中文等46种语言，谷歌Bard、搜索引擎新增文生图功能

从今天开始，您可以在Bard中的大多数国家生成图像，并在Bard支持的任何语言、国家和地区中使用Gemini Pro。我们将Bard的最新功能，包括Bard中的Gemini Pro，引入更多的语言和地方。此外，我们还引入了图像生成功能，以帮助更多的创意变为现实。Gemini Pro现在可以在所有支持的语言和地方使用。去年12月，我们将Gemini Pro引入了英语版的Bard，…

2024年2月2日

行业/好文

谷歌宣布在谷歌地图中引入生成式AI功能，利用大模型分析地图上超过2.5亿个地点的详细信息

你终于找到了一天可以和整个团队一起出去的时间。问题是？每个人都有不同的喜好：一个朋友是素食主义者，另一个不愿意去市区，还有一个有一只从不离身的狗。考虑到这么多因素，你需要帮助找到完美的去处。今天，我们介绍了一种新的方式，通过生成式人工智能来帮助你做到这一点-无论你的需求是多么具体、独特或广泛。只需说出你想要的，我们的大型语言模型（LLMs）将分析地图上超过2.5亿个地点的详细信…

2024年2月2日

行业/好文

AI基础设施创企Astera Labs计划3月IPO

据外媒The Information今日报道，知情人士称，英特尔支持的美国云计算与AI基础设施创企Astera Labs一直在与潜在的投资者会面，计划在3月由摩根士丹利和摩根大通牵头进行IPO（首次公开募股），最早可能在本月公开招股书。据透露，Astera Labs今年预计产生2.5亿至3亿美元收入。该公司从2023年实现盈利，截至10月有200多名员工。2022年，Aster…

2024年2月2日

行业/好文

研究证明可以让AI模型从一个婴儿的角度去学习

今日，来自纽约大学的团队在《科学》（Science）杂志发表论文，展示如何让AI模型从一个婴儿的角度去学习。研究团队在头戴摄像头视频上训练了一个神经网络CVCL，该网络捕获了来自澳大利亚的婴儿Sam从6个月到25个月大所看见的片段，他每周佩戴摄像机2小时，约占其清醒时间的1%左右。研究团队根据Sam的视频建立了SAYCam-S数据集，从中选取了61个小时的录像，包括60万张视频…

2024年2月2日

行业/好文

库克：苹果将在今年晚些时候推出生成式AI功能

苹果公司首席执行官蒂姆·库克在季度财报电话会议上透露，该公司正在开发生成式人工智能（AI）软件功能，预计将在今年晚些时候推出。这与彭博社的马克·古尔曼最近的报道相吻合，他表示iOS 18可能是操作系统历史上“最大”的更新。库克的暗示似乎确认了今年秋季将有一次重大发布。苹果很少提前透露其即将推出的动作，因此可以认为该公司有雄心勃勃的计划，将AI整合到其软件平台（iO…

2024年2月2日

行业/好文

a16z：为什么说 2023 年是 AI 视频的突破年？以及 2024 年的展望

2023年是AI视频的突破年。一开始，没有公开的文本到视频模型存在。但仅仅12个月后，已经有数十种视频生成产品在使用中，全球数百万用户通过文本或图像提示创建短视频片段。这些产品还相对有限，大多数生成的视频只有3到4秒，质量参差不齐，角色一致性等问题尚未解决。然而，过去一年视频生成领域取得的进展表明，我们正处于一个巨大转型的早期阶段，类似于图像生成领域的发展。文本到视频模型的改进…

2024年2月1日

行业/好文

谷歌 TPU v5p AI 芯片击败英伟达H100 速度是其的3.4到4.8倍

谷歌最近推出了其最新旗舰张量处理单元（TPU）v5p，这是一款专门设计的AI加速器，用于AI训练和推理，标志着Google在对抗市场领导者Nvidia的GPU方面迈出了重要一步。 TPU v5p已被部署以支持Google的“AI超级计算机”架构，这是一种专门为运行AI应用而构建的超级计算架构，与通常运行科学工作负载的超级计算机不同。核心规格对比：– TPU v5p…

2024年1月29日