-
Stable Diffusion 3 的 API 版本正式发布
Stable AI宣布了Stable Diffusion 3和Stable Diffusion 3 Turbo在Stability AI开发者平台API上的可用性。 1. **模型…
-
AI换装MagicClothing:实现可控的换装效果
MagicClothing这个AI换装的演示效果确实很强大。它基于潜在扩散模型(LDM)开发的新型网络架构,专门处理服装驱动的图像合成任务。通过服装特征提取器和自注意力融合技术,能…
-
斯坦福大学近日发布《2024年AI指数报告》(AI Index Report 2024)
2024年AI指数报告是迄今为止最全面的一份报告,涵盖了AI技术进展、公众对技术的看法以及其对社会的影响等重要趋势。报告显示,AI在某些任务上已经超越了人类,但在一些更复杂的任务上…
-
MiniMax发布万亿MoE模型abab 6.5,包含abab 6.5和abab 6.5s两个模型
国内 AI 初创企业 MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s两个模型。万亿MoE模型abab 6.5支持200k tokens的上…
-
文本生成声音效果的AI工具:Optimizer AI
1、声音效果生成:用户可以利用这个平台生成适用于多种应用场景的声音效果,比如游戏中的射击声、跳跃声,动画中的雨声环境,以及视频中的地铁到站声音等。 – 变声:能够基于一…
-
可识别图像中文字并转换为可编辑文本的工具:2txt
2txt是一个基于AI的图像转文字工具,使用Claude Haiku和Vercel AI SDK创建。它可以快速准确地识别图片中的文字,并转换成可编辑的文本格式。通过这个工具,用户…
-
什么是𝗥𝗔𝗚 ?一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库
什么是𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗔𝘂𝗴𝗺𝗲𝗻𝘁𝗲𝗱 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 ( 𝗥𝗔𝗚 ) 𝗦𝘆𝘀𝘁𝗲𝗺𝘀 ? 以下是一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库。 第一…
-
AI Agent 应该更有趣还是更有用?
原文: https://01.me/2024/03/ai-agents-entertaining-or-useful/ 这篇文章探讨了AI Agent的发展方向,主要围绕“有趣”与…
-
360 开源了 360 智脑 7B(70 亿参数模型)支持 50 万字长文本输入
360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以中文、英文、代码为主,开放 …
-
马斯克的xAI再次推出首个多模态模型 Grok-1.5 Vision 可将流程图转成 Python 代码
1. **游戏概述**:– 这是一个猜数字游戏,其中计算机生成一个1到10之间的随机数,用户需要猜测这个数字。 2. **代码实现**:– 文章提供了一个P…