AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、百度文心智能体平台免费开放文心4.0版本

百度文心智能体平台最新推出的文心大模型4.0版本免费开放给公众使用，极大地扩展了平台的功能和应用范围。该版本在理解力、生成力、逻辑推理和记忆能力等方面取得显著进步，综合能力与GPT-4相媲美。百度创始人李彦宏在世界人工智能大会上强调智能体作为AI应用的前景，认为搜索是智能体分发的关键渠道。文心智能体平台的零代码开发模式降低了普通用户开发智能体的难度，为开发者提供了易于开发、易于分发、易于盈利的优势。

2、Meta 发布 AI 重磅炸弹：多标记预测模型现已开放研究

Meta 迈出了重要一步，发布了采用多标记预测方法的预训练模型，可能改变大型语言模型的开发和部署方式。这种新技术有望提高人工智能效率，加速人机协作编码的趋势，对语言理解和上下文产生更细致的影响。

3、商汤科技发布“日日新5o”：对标GPT-4o 实现实时流式多模态交互

商汤科技在2024年世界人工智能大会上发布了国内首个所见即所得模型“日日新5o”，实现了实时的流式多模态交互，与GPT-4o相当。该模型整合声音、文本、图像和视频等跨模态信息，能够进行实时的理解和响应。

4、上海AI lab开源超强多模态LLM InternLM-XComposer-2.5

昨天，上海AI实验室开源了一款名为InternLM-XComposer-2.5的多模态大型语言模型，展现出在超高分辨率图像理解、细粒度视频理解和多轮图像对话等方面的超凡能力。该模型对网页制作和图文混排文章进行了特别优化，填补了国内多模态LLM领域的空白，为创作者提供了更大的创作空间。

5、斯坦福大学出品！OccFusion：可完整渲染出被遮挡的人体

OccFusion是斯坦福大学提出的新方法，旨在实现遮挡人体的高保真度渲染。该方法经过三个阶段的处理，利用高效的3D高斯分片和2D扩散模型监督实现，在评估中表现出色，达到了遮挡人体渲染的最新水平。

6、苹果开放4M模型演示轻松拆解图片所有信息

苹果公司在Hugging Face上放出了一颗重磅炸弹，开放了去年的论文4M模型的演示。这一模型能够处理和生成多种模态内容，包括文本、图像和3D场景。通过上传一张照片，用户可以轻松获得照片的所有信息，如主要轮廓、色调和尺寸等。苹果展示了强大的AI实力，并希望围绕4M构建生态系统，但也面临数据实践和AI伦理挑战。

7、中国生成式AI专利数量超过全球总和

中国在生成式AI领域取得了巨大成就，专利数量超过美国6倍，展现出强大的创新实力和领先地位。腾讯、平安保险集团和百度等中国公司在GenAI专利数量上表现突出。中国的顶级学术机构和技术生态为生成式AI的发展提供了有力支持，获得学术界和媒体的认可。

8、魔法般的LivePortrait：将照片变为生动视频，精准操控眼睛和嘴唇动作！

LivePortrait是一项黑科技，让静态照片动起来，突破传统动画制作难题，高效精确。它能生成逼真的动画，控制眼睛和嘴唇动作，提升用户创意空间。让照片活起来，讲述自己的故事。

9、WAIC 开幕日精彩集锦丨AI 界大佬们都分享了哪些观点？

7月4日在上海举办的2024年世界人工智能大会暨人工智能全球治理高级别会议上，AI行业专家们就AI的发展方向和应用落地展开深入讨论。会议反映出AI行业正向实际应用转变，关注如何让AI技术产生实际价值。同时，AI安全与伦理问题、产业变革与机遇也成为讨论焦点。

10、科幻小说照进现实？Clone Robotics：一个制造类似西部世界仿生机器人的公司

Clone Robotics是一家制造仿生机器人的公司，通过仿生设计和生物力学原理推动技术发展，产品具有高度仿真、耐用性和经济性。他们的核心产品包括Clone Hand和Clone Torso，能执行各种复杂操作任务，提供广泛的应用场景。公司代表了人类与机器人和谐共存的未来生活方式。

11、好莱坞视觉特效提供商获得2亿美元投资

DNEG集团成功获得来自阿布扎比投资者的2亿美元战略投资，将加速AI创作者工具的开发，估值超过20亿美元。这一投资有望降低电影制作成本，推动中东地区内容生产生态系统的发展。

智能体人工智能多模态 clone gpt-4 gpt 机器人生成式生成式ai 创作者 2024 ai产品斯坦福大学开发者 bot 多模态llm 大型语言模型 llm 语言模型百度文心