当前位置:AIGC资讯 > AIGC > 正文

AI日报:Runway Gen 3可生成3D巨幅字幕效果;Google Vids 上线测试;百度网盘推宝宝AI长相预测;Luma AI推首尾帧视频生成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、炸裂!Runway Gen 3可以生成电影片头3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha视频生成模型在保真度、一致性和动作表现方面有重大改进,不仅生成稳定光影,还展现强大想象力。内测博主展示了3D巨幅字幕效果,Gen3即将对所有人开放使用。模型精细控制运动,审美强大,想象力丰富,符合物理规律,生成速度快。

2、百度网盘一刻相册App推出宝宝AI长相预测功能

百度网盘一刻相册App推出了AI长相预测功能,用户上传照片即可预测宝宝未来样子,训练数据贴合中国宝宝特征,操作简单快速。未来将开发更多实用AI功能,征集用户意见。

3、谷歌推出AI视频编辑应用Google Vids 上线测试

谷歌最新推出的AI视频编辑应用Google Vids在测试中展现出强大的功能和用户友好的特点,为用户提供了高效、便捷的视频编辑工具。该应用集成Gemini大模型,帮助用户轻松创建视频内容,降低了视频制作门槛,未来有望成为视频创作者的得力助手。

4、Luma AI新功能:首尾帧生成视频与向后延长5秒

Luma AI推出了新功能,让视频创作充满无限可能,虽然偶尔会有硬切换画面,但这正是剪辑的魅力所在,让每一秒充满惊喜和创意。未来的视频生成将基于这种延长操作完成,实现智能个性化的视频创作。

5、全新Solos AirGo Vision智能眼镜发布

Solos公司在香港智能眼镜峰会上发布了全新的Solos AirGo Vision智能眼镜,集成了ChatGPT-4o的可穿戴AI大脑,让用户的双眼瞬间升级为超能力。这款智能眼镜不仅支持实时问答和视觉提示,还具备多语言翻译功能,模块化设计,售价为249美元。

6、商汤如影AI视频生成平台推出央视记者王冰冰AI数字人

商汤科技的AI数字人“AI冰冰”在《2024中国・AI 盛典》中首次亮相,展现了出色的多语言能力和逼真的视觉效果。数字人技术在传媒行业具有巨大潜力,能够拉近人物IP与受众之间的距离。

7、知乎宣布推出独立AI搜索平台「知乎直答」

知乎最近推出了全新AI产品「知乎直答」,旨在提升问答效率和质量,缩短用户与优质回答之间的距离,增强社区创作者内容的流通。这一举措预示着问答社区将进入更智能和个性化的新时代。

8、WhatsApp最新Android测试版2.24.14.7推出选择Meta AI Llama模型功能

WhatsApp最新测试版引入了选择Meta AI Llama模型的功能,用户可以根据需求自定义AI交互体验,体验更快速简单的回应或处理更复杂的查询。该功能展示了WhatsApp在AI领域持续创新的决心。

9、苹果可能在今年秋季宣布与谷歌 Gemini 的交易

苹果计划在今年秋季推出与谷歌 Gemini 的整合交易以及测试版的 Apple Intelligence,将人工智能作为直接盈利途径。第三方AI服务可能成为苹果的过渡选择,同时苹果将逐步推出自己的生成式AI系统。

10、GPTPdf:使用类似GPT-4o的多模态LLM分析PDF文件

近日,一款名为gptpdf的开源项目在github赞火,使用了类似 GPT-4o 的 VLLM 模型解析 PDF 文件并转换为 Markdown 格式。该项目代码简洁高效,只有293行,却能完美解析排版、数学公式、表格、图片、图表等各种内容。费用每页平均成本为0.013美元。

11、AI音频魔法师Resona V2A 可自动为视频配音效

在AI技术大行其道的时代,Resona V2A技术横空出世,像一位神奇的魔术师,让视频自动开口,唱出属于自己的旋律。这不仅是技术突破,更是创意者的福音。Resona V2A一键生成音频,快速高效,创意者得力助手。高性价比,成本降低99%,提供高质量音频解决方案。

12、AI换装黑科技 MMTryon虚拟试穿框架可按需搭配一键叠穿

中山大学和字节智创数字人团队联合推出的MMTryon虚拟试穿框架颠覆了传统换装方式,实现一键生成模特试穿效果,质量高且操作简便。其服装编码器和多模态多参考注意机制让换装更精确灵活,打破了传统算法束缚,获得新SOTA。MMTryon不仅可试穿单件服装,还支持组合换装,无需分割,通过文本指令即可实现高质量虚拟换装。

更新时间 2024-07-01