当前位置:AIGC资讯 > AIGC > 正文

AI日报:Bing推生成式AI搜索功能 ;Open-Sora Plan v1.2发布;Mistral Large2突然开源;腾讯智影推智能画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Bing推生成式AI搜索功能

Bing最近推出了新的搜索体验,将人工智能生成的答案放在搜索结果页面的显眼位置,改变了传统搜索结果的排列方式。这一举措旨在提供更全面的解答,结合了大型和小型语言模型,以更有效地满足用户需求。然而,这一变革也引发了一些用户担忧。

2、震撼来袭!Open-Sora Plan v1.2发布,清晰度、推理速度起飞

Open-Sora Plan v1.2版本引入新的3D全注意力架构,提升了对物理世界的理解能力。更新带来了全新的3D全注意力架构,文本生成视频能力升级,清晰度和一致性提升,空间与时间完美融合,推理速度大幅提升。Open-Sora团队开源代码、数据、模型,致力让每个人成为视频创作的上帝。

3、神仙打架!Mistral Large2突然开源:1230亿个参数、媲美Llama3.1

Mistral AI推出旗舰模型Mistral Large2,拥有1230亿个参数,超大的128k上下文窗口,性能与成本表现卓越。用户可通过La Plateforme访问新模型,在云服务平台上广泛应用。

4、腾讯智影PC端推出“智能画布”功能

腾讯智影PC端最近推出了一项新功能——“智能画布”,为用户提供了多种实用的图片编辑功能,结合AI绘画技术,让作图变得更加轻松。这项功能特别适合需要对AI绘画图片进行再创作、抠图、消除、扩图等编辑操作的用户。用户现在可以登录智影首页,体验这些新功能。

5、金山办公WPS AI上线“AI 伴写”功能

金山办公最近推出了WPS AI中的AI伴写功能,旨在提升用户写作效率和质量。用户可通过WPS Office界面启用该功能,享受智能建议和续写服务,轻松表达灵感。AI伴写还提供多样化的内容生成和中华诗词引用支持,增强写作连贯性。WPS AI2.0升级进一步推动了人工智能在办公领域的应用。

6、Stable Video4D横空出世,一键让你的视频变身全景大片!

Stable Video4D是一款颠覆性的视频处理工具,由Stability AI推出,能让普通视频变身为八面玲珑的全景大片。其快速生成多视角视频,保持画面一致性,将影响游戏开发、视频编辑和VR制作领域。未来或将改变观影方式,带来全新的互动式体验。

7、AI音乐生成工具Udio更新 V1.5模型音质提升显著

昨晚,AI音乐生成工具Udio带来了一系列令人瞩目的更新,其中V1.5模型的音质得到显著提升,为音乐创作者提供更清晰丰富的听觉体验。新功能包括关键音调控制、多语言支持等,拓宽了用户群体。产品功能增强包括专属创作页面、下载音乐片段等,提供更个性化和高效的创作环境。

8、媲美GPT-4o!复旦推语音模型SpeechGPT2能听懂你的喜怒哀乐

SpeechGPT2是复旦大学研究团队提出的一种创新的大型语言模型,具有跨模态的语音理解和生成能力。虽然展现出强大的任务执行能力,但仍存在噪声鲁棒性和音质稳定性方面的挑战。团队计划未来开源技术报告、代码和模型权重,以推动技术的进一步发展和完善。

9、Reddit开启 “付费墙”,屏蔽搜索引擎和AI机器人随意抓取内容

Reddit最近采取了引人注目的举动,开始限制各大搜索引擎和AI机器人获取其内容,需付费才能获取。这一举措导致除Google外的搜索引擎无法轻易访问最新的Reddit内容,引发了广泛关注和讨论。

10、Nvidia AI推ChatQA2长文本理解和RAG能力媲美GPT-4

在人工智能的快速发展中,长文本上下文理解和检索增强生成(RAG)的能力变得至关重要。Nvidia AI 的最新研究——ChatQA2模型,正是为了应对这一挑战而生。ChatQA2通过扩展上下文窗口和实施三阶段指令调整过程,取得了与GPT-4-Turbo相媲美的长文本理解和RAG性能。

11、百川智能完成50亿元A轮融资,估值达200亿元

百川智能近期完成A轮融资,融资总额达50亿元人民币,估值攀升至200亿元。这标志着大模型初创公司取得了重要的资本支持,展现出行业发展的活力和潜力。

12、英伟达推出 Minitron 小型语言模型

英伟达最新推出的Minitron小型语言模型在人工智能领域引起轰动。这一系列模型训练速度提高了40倍,通过修剪和知识蒸馏技术,大幅降低了训练成本,并已开源在Huggingface上,推动AI技术普及。

13、OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

Meta最近发布了新一代开源模型系列Llama3.1,其中包括一个405B参数的版本,其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。OpenBuddy利用Llama3.1-8B-Instruct模型,通过在少量中文数据上进行训练,发布了OpenBuddy-Llama3.1-8B-v22.1-131K,具备中文问答和跨语言翻译能力。

14、颠覆认知!AI自训练9次崩溃 牛津剑桥发现AI潜藏致命弱点

这篇文章揭示了通过再训练AI图像生成模型使用自己生成的图像可能导致模型崩溃的现象。研究人员发现,即使只包含少量自生成图像在再训练数据中,模型也会产生高度扭曲的图像,难以完全恢复。这一发现提醒我们AI系统对数据“污染”非常敏感,需要谨慎处理。

总结

**《AI日报》精华概要**:
欢迎阅读本期《AI日报》,本期为您囊括了最新的AI趋势、产品创新和应用发展。以下为本期主要内容摘要:
1. **Bing推出AI搜索新功能**:使用人工智能生成的答案显著优化搜索结果体验,为用户提供更全面的解答。
2. **Open-Sora Plan v1.2发布**:新版本升级提高了对物理世界的理解能力,视频生成能力和推理速度显著提升。
3. **Mistral Large2模型开源**:拥有1230亿个参数的旗舰模型引人注目,性能卓越,成本效益高。
4. **腾讯智影PC端上线“智能画布”**:结合AI绘画技术的创新功能,为用户提供方便快捷的图片编辑体验。
5. **金山办公WPS AI推出“AI伴写”**:智能建议和续写功能提升用户写作效率,支持多类型内容创作和引用。
6. **Stable Video4D革新视频处理**:让普通视频变身全景大片,预计影响游戏开发、视频编辑等领域。
7. **AI音乐工具Udio V1.5提升音质**:新版模型音质突出,增添关键音调控制和多语言支持,拓宽创作空间。
8. **复旦大学推出SpeechGPT2**:大型语音模型能够识别喜怒哀乐等复杂情绪,展现强大的跨模态能力。
9. **Reddit引入“付费墙”**:限制搜索引擎和AI机器人免费获取内容,保护信息价值并引发行业讨论。
10. **Nvidia AI的ChatQA2取得突破**:长文本理解和RAG能力达到业界领先,具有应用场景潜力。
11. **百川智能完成50亿元融资**:展现市场对于大模型初创公司的认可和支持,推动行业发展。
12. **英伟达发布Minitron系列**:小型语言模型训练速度提升,成本降低,推动AI技术普及。
13. **OpenBuddy开源Llama3.1中文版**:结合Llama3.1模型技术,中文问答和翻译能力显著增强。
14. **AI自训练潜在弱点曝光**:研究揭示自训练过程中使用自己生成的图像可能导致模型崩溃的风险,提示数据使用需谨慎。
以上为本期《AI日报》的主要内容概要,希望对您有所帮助!更多AI资讯,敬请关注《AI日报》。

更新时间 2024-07-25