多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

今日简讯 2024.7.1

– 反垄断机构将发威:微软与 OpenAI / 谷歌与三星之间的 AI 交易受到欧盟关注。

– 腾讯搜狗输入法今日迎来 AI 功能上新,升级搭载 AI 帮写、AI 对话、快捷问答、AI 宠物、AI 自拍表情等多种玩法。

– WhatsApp最新测试版引入了选择Meta AI Llama模型的功能,用户可以根据需求自定义AI交互体验。

– 苹果可能在今年秋季宣布与谷歌 Gemini 的交易。

– BBC 的一篇报道:一个由 60 多位编辑和作家组成的团队,负责为科技公司撰写和编辑文章,逐渐被 ChatGPT 所取代,团队只剩下 1 个人和 1 个 ChatGPT。

– 据《科创板日报》今日报道,在今年世界人工智能大会(WAIC 2024)期间,特斯拉将展示其 Cybertruck(赛博越野旅行车)、Optimus 人形机器人、FSD(完全自动驾驶能力)最新成果等。

– 马斯克在自己的X(推特)平台上发文宣布,其人工智能初创公司xAI的大语言模型Grok-2将于8月推出。

– 微软 Copilot for Microsoft 365 下月将迎新功能,设计、写作全面赋能(每月费用为 30 美元)。

Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

全球首款支持 GPT-4o 的智能眼镜 Solos AirGo Vision 发布:内置相机、模块化镜腿

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

地址:

https://solosglasses.com/

知乎发布全新 AI 产品“知乎直答”,支持提问、搜索等功能

体验地址:

https://zhida.zhihu.com/

Runway Gen 3可以生成电影片头3D巨幅字幕效果了

Gen3即将对所有人开放使用。模型精细控制运动,审美强大,想象力丰富,符合物理规律,生成速度快。

体验地址:

https://runwayml.com/

Luma AI推出了新功能

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

视频延长魔法:首尾帧生成视频能力,向后延长5秒,让每一帧充满无限可能 ; 创新视频功能“Extend”:智能分析视频内容,保持原有风格和对象一致性的基础上延长视频长度 ; Dream Machine模型发布:支持文本和图片输入,生成高质量视频,模拟现实物理特性,免费开放体验。

地址:

https://lumalabs.ai/dream-machine/creations

一款名为gptpdf的开源项目在github爆火

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

使用了类似 GPT-4o 的 VLLM 模型解析 PDF 文件并转换为 Markdown 格式。该项目代码简洁高效,只有293行,却能完美解析排版、数学公式、表格、图片、图表等各种内容。费用每页平均成本为0.013美元。

地址:

https://github.com/CosmosShadow/gptpdf

AI音频魔法师Resona V2A 可自动为视频配音效

它像一位神奇的魔术师,让视频自动开口,唱出属于自己的旋律。

体验地址:

https://www.resonaai.com/

中山大学和字节智创数字人团队联合推出的MMTryon虚拟试穿框架

多款 AI 视频工具更新新功能;一款名为gptpdf的开源项目火了

一键生成模特试穿效果,质量高且操作简便 ; 打破传统算法束缚,获得新SOTA,支持组合换装 ;利用服装编码器和多模态多参考注意机制,换装更精确灵活。

地址:

https://arxiv.org/pdf/2405.00448

来源:https://mp.weixin.qq.com/s/yK_IWbU0Sb0bqNNTrII_kg

本文地址:https://www.163264.com/8501

(0)
上一篇 2024年7月2日 下午9:44
下一篇 2024年7月3日 上午12:10

相关推荐