AI日报：viva发布类Sora视频生成模型；Open AI 宫斗第二季详解；索尼禁止未授权使用其音乐“炼丹”：Coze上线Web SDK

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、viva发布类Sora视频生成模型支持4K分辨率

viva近期推出基于Sora架构的视频生成模型，免费使用，对普通人快速制作视频内容有重大利好影响。模型支持文本生成视频、图片生成视频，4K分辨率放大，提示词自动优化。在视频生成方面表现出色，竖屏视频质量优秀，与谷歌Veo模型接近。民主化视频内容创作工具，普通人也能创作高质量视频。

2、Coze上线Web SDK 可快速将机器人嵌入网页

Coze是字节跳动旗下的AI聊天机器人开发平台，推出Web SDK，为用户提供便捷的机器人嵌入网页功能，拓宽了聊天机器人的应用场景。Coze平台提供丰富的功能和优势，包括无限拓展的能力集、丰富的数据源、持久化的记忆能力、灵活的工作流设计等，为用户提供了更大的创作空间。

3、索尼向700多家公司发出警告，禁止使用其音乐数据训练AI模型

索尼音乐集团警告700多家公司禁止未经许可使用音乐数据训练AI大模型，强调尊重歌曲作者和唱片艺术家的知识产权。该举措体现了对知识产权的重视和对AI模型在音乐数据使用上的监管控制。

4、谷歌推3D生成模型CAT3D 1分钟完成3D场景创建

CAT3D是谷歌推出的3D生成模型，在3D重建领域取得显著进展。它能快速生成3D场景，支持多视图输入，实现高质量的3D捕获和实时渲染，具有结构优势，对3D重建管道至关重要。CAT3D的出现将改变虚拟现实、游戏开发、建筑设计等多个行业，为用户带来更真实和互动的体验。

5、谷歌发布Gemini 1.5技术报告详细介绍Gemini 1.5 Pro模型架构改进情况

谷歌发布的Gemini 1.5技术报告详细介绍了Gemini 1.5 Pro和Gemini 1.5 Flash两个模型的性能特点和架构，展示了其在多模态大型模型领域的最新进展，为未来AI技术发展提供了新的方向。

6、Open AI 宫斗第二季时间线及各方观点梳理

本文报道了Open AI近期的内部矛盾和人员变动引起的业界广泛关注。围绕AI模型的安全性和发展速度展开的争议，反映了AI发展过程中的两大主题:安全与效率。在保障安全的前提下推动AI技术的发展，是整个行业都需要思考的问题。

7、ElevenLabs推Audio Native 可将网页内容自动转为博客

ElevenLabs推出的新服务Audio Native是一个嵌入式音频播放器，能够自动生成网页内容的高质量人声旁白，帮助将内容自动转为播客形式。用户无需等待即可收听实时生成的语音旁白，提高听众参与度。同时支持多平台集成和灵活的内容管理，让用户定制播放器外观并跟踪听众参与情况。

8、免费AI插图库PictoGraphic超4万张图片可使用

PictoGraphic是一个提供免费AI生成插图库的平台，拥有超过40000张图像和SVG文件。它为设计师提供直观易用的界面，让他们快速找到或创建符合需求的插图。用户可以自定义生成插图，调整颜色，无需信用卡信息即可开始下载和生成插图的服务。

9、好莱坞经纪公司CAA为明星提供管理AI形象方案避免遭滥用

好莱坞顶级经纪公司CAA与AI技术公司Veritone合作，推出数字资产管理解决方案，旨在保护明星的AI形象免受滥用。他们建立了虚拟媒体存储系统“theCAAvault”，帮助明星存储姓名、形象、声音等数字资产，确保合法使用和保护权益。

10、华盛顿邮报新增AI音频功能

华盛顿邮报最近推出了AI生成的音频功能，为政治和政策类新闻简报增添了新的阅读体验。这一举措不仅吸引了大量用户，还开辟了新的广告宣传渠道。

11、Snapchat 计划每年在人工智能上投资 15 亿美元

Snapchat 的开发者 Snap 表示将增加在人工智能和机器学习上的投资，调整广告业务和用户反馈，加大对机器学习、AI 和增强现实功能的投入。Snap 与亚马逊和谷歌合作进行云计算合作，计划每季度为每个日活用户投入84美分用于基础设施，年度投资约为15亿美元。