当前位置:AIGC资讯 > AIGC > 正文

AI日报:​更稳更高清!可灵AI发布1.5版本;字节推音乐生成神器;阿里通义万相视频生成模型正式上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、可灵AI发布1.5版本 视频更稳更高清 人飞了脸都没崩

可灵AI最新发布的1.5版本带来了令人印象深刻的新功能和改进,显著提升了视频生成的数量和质量,拓宽了AI在创意媒体领域的应用边界。画质大幅提升,支持10秒1080p高清视频,文本响应度提升,审美提升,人物一致性加强,物体一致性改善。

2、字节推音乐生成神器 Seed-Music 支持多样化输入和精确控制

最近,字节跳动推出了音乐创作新工具 Seed-Music,让用户通过多种方式生成音乐,如文字描述、音频参考、乐谱甚至语音提示。这一神奇模型结合自回归语言模型和扩散模型,生成高质量音乐作品,同时提供精确控制。用户可配乐歌词、改编旋律,甚至上传语音片段转化为歌声,功能强大且高效。

3、阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4

通义千问团队宣布开源Qwen2.5系列模型,包括通用语言模型Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,预训练在18T tokens数据集上,提升知识获取、编程和数学能力。支持长文本处理,生成最多8K tokens内容,保持对29种以上语言的支持。提供多种规模版本,采用Apache2.0许可证。Qwen2-VL-72B模型性能媲美GPT-4,在指令执行、长文本生成、数据理解和结构化输出方面有显著改进。

4、阿里通义万相视频生成模型“AI生视频”功能正式上线

阿里巴巴旗下通义推出的通义万相AI生视频模型正式上线,具有强大的画面视觉动态生成能力,支持多种艺术风格和影视级质感的视频内容生成。该模型优化了中式元素表现,支持多语言输入和可变分辨率生成,应用场景广泛,提供免费服务并具有音频生成功能,简化视频制作流程。

5、腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音

近日,约翰霍普金斯大学与腾讯 AI 实验室联合推出的 EzAudio 模型标志着音频技术的重大进步。该模型通过创新的架构和技术生成高质量音频样本,具备广泛的应用潜力。随着技术的发展,伦理和责任使用问题逐渐突显,EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。

6、巨人网络发布自研角色大模型GiantGPT、语音大模型BaiLing-TTS

巨人网络在2024年云栖大会开幕式上展示了其在“游戏+AI”领域的最新成果,包括GiantGPT和BaiLing-TTS等大模型应用,以及AI数字人和AI绘画平台巨人摹境等新技术。公司展示了高度优化的游戏业务大模型和支持多种方言的语音大模型,同时发布了全新品牌标识,开启了AI绘画平台内测申请。巨人网络还展示了高精度实时交互数字人技术,表达了持续深耕“游戏+AI”领域的决心。

7、ChatGPT 高级语音模式或将于9月24日全面上线

ChatGPT的高级语音模式即将于9月24日全面发布,为用户带来前所未有的交互体验。该功能生成逼真音频响应,提升人机交互自然度和沉浸感。更新信息可靠性得到佐证,部分移动用户或将在9月24日体验升级后的语音模式。macOS版ChatGPT应用界面有变化,语音模式界面更丰富,新增便捷按钮。部分用户可与ChatGPT共享更多上下文信息,实现更连贯和个性化对话体验。

8、YouTube引入DeepMind Veo模型 为创作者想象插上翅膀

YouTube正式宣布将Google DeepMind的Veo模型整合到其短视频平台YouTube Shorts中,开启了短视频创作的全新AI驱动时代。这一举措不仅为创作者提供了前所未有的创意工具,还彻底改变了用户与平台的互动方式。

9、2024AI智能体应用洞察半年报:AI类APP月活超6600万

2024年AI智能体应用半年报显示,AI类应用月活跃用户数超过6600万,展示了AI技术在应用层面的快速发展和普及。报告指出AI应用已形成八大玩法门类,商业化路径已开启。智能体服务解决用户需求,微信生态重要渠道,智能体商业模式探索中。智能体在教育学习场景成熟,头部智能体使用热度较高。AI智能体应用成为移动互联网重要分支,为用户带来丰富便捷体验,为行业发展提供新动力和方向。预计未来AI智能体应用将发挥更重要作用。

10、LinkedIn 悄然使用用户数据训练 AI,需双重选择退出

最近,LinkedIn被曝出在未事先通知用户的情况下开始将用户数据用于训练生成式人工智能模型。用户需在账户设置中关闭相关选项才能选择退出,但仅影响未来数据使用。LinkedIn还提到其他机器学习工具需填写额外表单才能完全退出数据使用。

11、2300万美元融资!Fal.ai让50万开发者疯狂,每天生成5000万媒体内容

Fal.ai是一家专注于AI生成音频、视频和图像的云平台,最近成功融资2300万美元。该平台吸引了知名投资者和众多开发者、企业客户,展现出巨大潜力和市场需求。未来,Fal.ai将加强内容审核和模型优化工作,以更好地应对生成技术带来的挑战。

12、办公软件的超级英雄?金山WPS AI会员人数破百万,鸿蒙版全面开跑

金山办公的WPS AI会员和大会员的年度付费用户数量突破100万,展示了人工智能在办公领域的潜力和用户认可度。与华为合作推出WPS鸿蒙版本,跨平台表现出色,提升用户办公体验。AI会员服务布局精心,推出AI助手和Linux12个人版,不断提高用户工作效率和拓展平台覆盖范围。

13、开发者福音!Anthropic将推出Claude AI桌面应用

Anthropic即将推出全新的Claude AI桌面应用,为开发者带来更便捷的AI助手体验。这将极大提高开发效率和创新可能。

14、阿里CEO称AI最大想象力不在于手机:通义千问API调用价格下降97%

吴泳铭在2024云栖大会开幕式上分享了对人工智能发展的见解,强调AI技术的快速迭代和生成式AI的潜力。

15、Runway进军好莱坞!与狮门影业达成合作

Runway与著名电影制作公司Lionsgate达成合作,开发定制AI视频模型,引发影视行业震动。这次合作将为影视制作领域带来新突破,提升制作效率和创意发挥空间。

总结

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。


新鲜AI产品点击了解:https://top.aibase.com/


1、可灵AI发布1.5版本 视频更稳更高清 人飞了脸都没崩


可灵AI最新发布的1.5版本带来了令人印象深刻的新功能和改进,显著提升了视频生成的数量和质量,拓宽了AI在创意媒体领域的应用边界。画质大幅提升,支持10秒1080p高清视频,文本响应度提升,审美提升,人物一致性加强,物体一致性改善。



2、字节推音乐生成神器 Seed-Music 支持多样化输入和精确控制


最近,字节跳动推出了音乐创作新工具 Seed-Music,让用户通过多种方式生成音乐,如文字描述、音频参考、乐谱甚至语音提示。这一神奇模型结合自回归语言模型和扩散模型,生成高质量音乐作品,同时提供精确控制。用户可配乐歌词、改编旋律,甚至上传语音片段转化为歌声,功能强大且高效。



3、阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4


通义千问团队宣布开源Qwen2.5系列模型,包括通用语言模型Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,预训练在18T tokens数据集上,提升知识获取、编程和数学能力。支持长文本处理,生成最多8K tokens内容,保持对29种以上语言的支持。提供多种规模版本,采用Apache2.0许可证。Qwen2-VL-72B模型性能媲美GPT-4,在指令执行、长文本生成、数据理解和结构化输出方面有显著改进。



4、阿里通义万相视频生成模型“AI生视频”功能正式上线


阿里巴巴旗下通义推出的通义万相AI生视频模型正式上线,具有强大的画面视觉动态生成能力,支持多种艺术风格和影视级质感的视频内容生成。该模型优化了中式元素表现,支持多语言输入和可变分辨率生成,应用场景广泛,提供免费服务并具有音频生成功能,简化视频制作流程。



5、腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音


近日,约翰霍普金斯大学与腾讯 AI 实验室联合推出的 EzAudio 模型标志着音频技术的重大进步。该模型通过创新的架构和技术生成高质量音频样本,具备广泛的应用潜力。随着技术的发展,伦理和责任使用问题逐渐突显,EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。



6、巨人网络发布自研角色大模型GiantGPT、语音大模型BaiLing-TTS


巨人网络在2024年云栖大会开幕式上展示了其在“游戏+AI”领域的最新成果,包括GiantGPT和BaiLing-TTS等大模型应用,以及AI数字人和AI绘画平台巨人摹境等新技术。公司展示了高度优化的游戏业务大模型和支持多种方言的语音大模型,同时发布了全新品牌标识,开启了AI绘画平台内测申请。巨人网络还展示了高精度实时交互数字人技术,表达了持续深耕“游戏+AI”领域的决心。


7、ChatGPT 高级语音模式或将于9月24日全面上线


ChatGPT的高级语音模式即将于9月24日全面发布,为用户带来前所未有的交互体验。该功能生成逼真音频响应,提升人机交互自然度和沉浸感。更新信息可靠性得到佐证,部分移动用户或将在9月24日体验升级后的语音模式。macOS版ChatGPT应用界面有变化,语音模式界面更丰富,新增便捷按钮。部分用户可与ChatGPT共享更多上下文信息,实现更连贯和个性化对话体验。


8、YouTube引入DeepMind Veo模型 为创作者想象插上翅膀


YouTube正式宣布将Google DeepMind的Veo模型整合到其短视频平台YouTube Shorts中,开启了短视频创作的全新AI驱动时代。这一举措不仅为创作者提供了前所未有的创意工具,还彻底改变了用户与平台的互动方式。



9、2024AI智能体应用洞察半年报:AI类APP月活超6600万


2024年AI智能体应用半年报显示,AI类应用月活跃用户数超过6600万,展示了AI技术在应用层面的快速发展和普及。报告指出AI应用已形成八大玩法门类,商业化路径已开启。智能体服务解决用户需求,微信生态重要渠道,智能体商业模式探索中。智能体在教育学习场景成熟,头部智能体使用热度较高。AI智能体应用成为移动互联网重要分支,为用户带来丰富便捷体验,为行业发展提供新动力和方向。预计未来AI智能体应用将发挥更重要作用。



10、LinkedIn 悄然使用用户数据训练 AI,需双重选择退出


最近,LinkedIn被曝出在未事先通知用户的情况下开始将用户数据用于训练生成式人工智能模型。用户需在账户设置中关闭相关选项才能选择退出,但仅影响未来数据使用。LinkedIn还提到其他机器学习工具需填写额外表单才能完全退出数据使用。


11、2300万美元融资!Fal.ai让50万开发者疯狂,每天生成5000万媒体内容


Fal.ai是一家专注于AI生成音频、视频和图像的云平台,最近成功融资2300万美元。该平台吸引了知名投资者和众多开发者、企业客户,展现出巨大潜力和市场需求。未来,Fal.ai将加强内容审核和模型优化工作,以更好地应对生成技术带来的挑战。



12、办公软件的超级英雄?金山WPS AI会员人数破百万,鸿蒙版全面开跑


金山办公的WPS AI会员和大会员的年度付费用户数量突破100万,展示了人工智能在办公领域的潜力和用户认可度。与华为合作推出WPS鸿蒙版本,跨平台表现出色,提升用户办公体验。AI会员服务布局精心,推出AI助手和Linux12个人版,不断提高用户工作效率和拓展平台覆盖范围。


13、开发者福音!Anthropic将推出Claude AI桌面应用


Anthropic即将推出全新的Claude AI桌面应用,为开发者带来更便捷的AI助手体验。这将极大提高开发效率和创新可能。


14、阿里CEO称AI最大想象力不在于手机:通义千问API调用价格下降97%


吴泳铭在2024云栖大会开幕式上分享了对人工智能发展的见解,强调AI技术的快速迭代和生成式AI的潜力。


15、Runway进军好莱坞!与狮门影业达成合作


Runway与著名电影制作公司Lionsgate达成合作,开发定制AI视频模型,引发影视行业震动。这次合作将为影视制作领域带来新突破,提升制作效率和创意发挥空间。


更新时间 2024-09-19