当前位置:AIGC资讯 > AIGC > 正文

AI日报:viva发布类Sora视频生成模型;Open AI 宫斗第二季详解;索尼禁止未授权使用其音乐“炼丹”:Coze上线Web SDK

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、viva发布类Sora视频生成模型 支持4K分辨率

viva近期推出基于Sora架构的视频生成模型,免费使用,对普通人快速制作视频内容有重大利好影响。模型支持文本生成视频、图片生成视频,4K分辨率放大,提示词自动优化。在视频生成方面表现出色,竖屏视频质量优秀,与谷歌Veo模型接近。民主化视频内容创作工具,普通人也能创作高质量视频。

2、Coze上线Web SDK 可快速将机器人嵌入网页

Coze是字节跳动旗下的AI聊天机器人开发平台,推出Web SDK,为用户提供便捷的机器人嵌入网页功能,拓宽了聊天机器人的应用场景。Coze平台提供丰富的功能和优势,包括无限拓展的能力集、丰富的数据源、持久化的记忆能力、灵活的工作流设计等,为用户提供了更大的创作空间。

3、索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型

索尼音乐集团警告700多家公司禁止未经许可使用音乐数据训练AI大模型,强调尊重歌曲作者和唱片艺术家的知识产权。该举措体现了对知识产权的重视和对AI模型在音乐数据使用上的监管控制。

4、谷歌推3D生成模型CAT3D 1分钟完成3D场景创建

CAT3D是谷歌推出的3D生成模型,在3D重建领域取得显著进展。它能快速生成3D场景,支持多视图输入,实现高质量的3D捕获和实时渲染,具有结构优势,对3D重建管道至关重要。CAT3D的出现将改变虚拟现实、游戏开发、建筑设计等多个行业,为用户带来更真实和互动的体验。

5、谷歌发布Gemini 1.5技术报告 详细介绍Gemini 1.5 Pro模型架构改进情况

谷歌发布的Gemini 1.5技术报告详细介绍了Gemini 1.5 Pro和Gemini 1.5 Flash两个模型的性能特点和架构,展示了其在多模态大型模型领域的最新进展,为未来AI技术发展提供了新的方向。

6、Open AI 宫斗第二季时间线及各方观点梳理

本文报道了Open AI近期的内部矛盾和人员变动引起的业界广泛关注。围绕AI模型的安全性和发展速度展开的争议,反映了AI发展过程中的两大主题:安全与效率。在保障安全的前提下推动AI技术的发展,是整个行业都需要思考的问题。

7、ElevenLabs推Audio Native 可将网页内容自动转为博客

ElevenLabs推出的新服务Audio Native是一个嵌入式音频播放器,能够自动生成网页内容的高质量人声旁白,帮助将内容自动转为播客形式。用户无需等待即可收听实时生成的语音旁白,提高听众参与度。同时支持多平台集成和灵活的内容管理,让用户定制播放器外观并跟踪听众参与情况。

8、免费AI插图库PictoGraphic超4万张图片可使用

PictoGraphic是一个提供免费AI生成插图库的平台,拥有超过40000张图像和SVG文件。它为设计师提供直观易用的界面,让他们快速找到或创建符合需求的插图。用户可以自定义生成插图,调整颜色,无需信用卡信息即可开始下载和生成插图的服务。

9、好莱坞经纪公司CAA为明星提供管理AI形象方案避免遭滥用

好莱坞顶级经纪公司CAA与AI技术公司Veritone合作,推出数字资产管理解决方案,旨在保护明星的AI形象免受滥用。他们建立了虚拟媒体存储系统“theCAAvault”,帮助明星存储姓名、形象、声音等数字资产,确保合法使用和保护权益。

10、华盛顿邮报新增AI音频功能

华盛顿邮报最近推出了AI生成的音频功能,为政治和政策类新闻简报增添了新的阅读体验。这一举措不仅吸引了大量用户,还开辟了新的广告宣传渠道。

11、Snapchat 计划每年在人工智能上投资 15 亿美元

Snapchat 的开发者 Snap 表示将增加在人工智能和机器学习上的投资,调整广告业务和用户反馈,加大对机器学习、AI 和增强现实功能的投入。Snap 与亚马逊和谷歌合作进行云计算合作,计划每季度为每个日活用户投入84美分用于基础设施,年度投资约为15亿美元。

更新时间 2024-05-20