行业/好文

  • Vercel将9个AI集成到了一起,用户可以在一个界面上尝试多种模型,生成文本、图像、音频等内容

    Vercel将9个人工智能整合在一起,并创建了一个新的模型播放器,用户可以在一个界面上尝试多种模型,生成文本、图像、音频等内容。 Vercel为人工智能应用提供了丰富的产品基础设施,包括聊天机器人来增强客户服务流程,带有语义搜索的推荐系统,检索增强生成(RAG)和生成图像服务等。 为了使这一切更加简单,Vercel还提供了一套工具(AI SDK),帮助开发者在他们的网站上快速使…

    2024年2月10日
  • Google DeepMind抛弃传统的搜索方法,使用Transformer模型,训练了一个AI模型来下象棋

    该模型能够达到国际象棋大师级别的水平。甚至表现超过了AlphaZero。 这说明Transformer模型,不仅能处理语言任务,还能够在复杂的决策和策略游戏中学习和模拟高级人类智能。 该方法同时显著减少了计算需求。 研究背景: 在国际象棋AI的发展历史中,传统的方法通常依赖于搜索算法(比如alpha-beta剪枝)来预测和评估可能的移动,从而选择最佳的一步。——即考虑棋盘上所有…

    2024年2月10日
  • YC 公布了他们今年投资的 100 家 AI 初创公司,大部分都是2-4人小公司

    它们在不同领域应用了生成式人工智能技术。这些公司的产品和服务涵盖了各个行业,包括内容创作、视频制作、教育、金融、医疗、游戏等。它们利用人工智能技术帮助用户提高工作效率、创造更好的用户体验,并解决各种实际问题。这些初创公司的目标是通过创新的人工智能解决方案推动行业的发展。 原文地址: https://www.ycombinator.com/companies/industry/g…

    2024年2月5日
  • 好文分享:《大淘宝设计部2023年度AI设计实践报告》

    这篇内容总结了大淘宝设计团队在过去一年中对AI技术的实践心得。他们发现AI工具带来了降本增效,提高了创意效果和设计方案的达成。AI工具改变了设计工作流程,提升了设计师的角色和能力。通过AI的应用,设计团队在品牌设计、营销设计、互动玩法等多个领域取得了显著的效果。未来,设计师需要不断学习和适应新工具,优化工作流程,以应对不断变化的需求。 原文地址: https://mp.weix…

    2024年2月5日
  • 谷歌计划对其产品Bard进行一系列重大改变,包括更名为Gemini

    谷歌计划对其产品巴德进行一系列重大改变,包括更名为Gemini。消息源自安卓应用程序开发人员Dylan Roussel泄露的变更日志。 文档中明确表示:“巴德现在是Gemini”,表明巴德将更名为谷歌去年推出的新模型Gemini,该模型旨在与OpenAI的GPT-4进行竞争。 据透露,谷歌将首次推出Gemini语音聊天,并引入新的“Ultra1.0”模型,其中包括名为“Gemi…

    2024年2月4日
  • Meta提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印

    Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。 人工智能语音合成技术的迅速发展使得虚构的人类语音变得极为逼真。然而,这也引发了对声音克隆、深度伪造和其他形式的音频操纵的担忧。为了有效区分真实录音和音频深度伪造,需要强…

    2024年2月4日
  • OpenAI推出适用于Apple Vision Pro的ChatGPT应用

    OpenAI近日发布了一款名为ChatGPT for Vision Pro的应用程序,使用户能够通过文本、图片和语音与Apple Vision Pro进行多模态AI交互。这标志着OpenAI在人机交互领域迈出了重要一步,展示了AI对人类的潜在影响。ChatGPT成为了visionOS的首批应用之一,利用Apple Vision Pro操作系统提供了无缝、沉浸式的数字内容体验。该…

    2024年2月4日
  • SVD视频生成模型的Web平台开始发放测试资格

    Stable Video Diffusion是一种AI视频生成技术,可以从静态图像或文本创建动态视频,代表了视频生成技术的新进展。它通过图像预训练、视频预训练、高质量视频微调和多视角3D先验等步骤,提供高质量的视频生成。主要功能包括将图像转化为视频、将文本转化为视频等。Stable Video Diffusion可以革新内容创作,从而自动生成创意广告、电影预告片、教育视频、游戏…

    2024年2月4日
  • 谷歌Gemini Pro扩展至中文等46种语言,谷歌Bard、搜索引擎新增文生图功能

    从今天开始,您可以在Bard中的大多数国家生成图像,并在Bard支持的任何语言、国家和地区中使用Gemini Pro。我们将Bard的最新功能,包括Bard中的Gemini Pro,引入更多的语言和地方。此外,我们还引入了图像生成功能,以帮助更多的创意变为现实。Gemini Pro现在可以在所有支持的语言和地方使用。去年12月,我们将Gemini Pro引入了英语版的Bard,…

    2024年2月2日
  • 谷歌宣布在谷歌地图中引入生成式AI功能,利用大模型分析地图上超过2.5亿个地点的详细信息

    你终于找到了一天可以和整个团队一起出去的时间。问题是?每个人都有不同的喜好:一个朋友是素食主义者,另一个不愿意去市区,还有一个有一只从不离身的狗。考虑到这么多因素,你需要帮助找到完美的去处。今天,我们介绍了一种新的方式,通过生成式人工智能来帮助你做到这一点-无论你的需求是多么具体、独特或广泛。只需说出你想要的,我们的大型语言模型(LLMs)将分析地图上超过2.5亿个地点的详细信…

    2024年2月2日