当前位置:AIGC资讯 > AIGC > 正文

AI日报:对标GPT-4o!开源大模型Moshi登场;Google Pixel 9新增多个AI功能;ElevenLabs发布消音神器VOICE ISOLATOR

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、对标GPT-4o!开源大模型Moshi震撼登场

Moshi是一款多模态大模型,具备听、说能力,未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试,展现了开源精神。用户体验方面,响应速度快,语言支持有待提高,使用便捷。Moshi的拟人化语气让对话更自然流畅,未来的迭代优化将提升回答准确度。对教育行业将产生深远影响,为学生提供循环讲解。期待更多类似产品出现,支持更多地方语言,让AI技术贴近人们生活。

2、Google Pixel 9新功能曝光:AI加持,类似微软Recall的智能体验即将到来!

谷歌Pixel 9系列即将推出一系列令人惊艳的AI新功能,包括Add Me、Studio和Pixel Screenshots。这些功能将提升用户拍照体验、激发创意表达并注重隐私保护,展现了谷歌对AI技术的深刻理解和创新应用。期待Pixel 9系列为数字生活带来更多可能性。

3、AI搜索Perplexity AI发布 Pro Search:提升问题解决与代码执行能力

Perplexity近日宣布对其Pro Search服务进行重大升级,新版Pro Search不仅能处理更复杂的查询,还具备多步推理能力,为用户提供更深入、全面的研究支持。这一升级展示了AI在信息检索和问题解决领域的巨大潜力,为未来的智能研究工具设立了新的标准。

4、Cloudflare 推出一键阻止AI机器人网络爬虫的新方法

Cloudflare最近推出了一种新方法,可以阻止AI机器人抓取网站内容并未经允许使用数据训练机器学习模型。这项举措旨在保护内容创作者在互联网上的安全。

5、ElevenLabs发布消音神器VOICE ISOLATOR

ElevenLabs推出的VOICE ISOLATOR是一款让音频爱好者们兴奋不已的新产品,能够消除背景噪音、提取清晰对话,让音频制作更专业化。该工具简单易用,提供多项功能如Extract vocals、音效生成等,极大地提升了音频制作效率和创意空间。ElevenLabs持续创新,为用户带来全新的音频制作可能性。

6、商汤科技发布可控人物视频生成算法模型Vimi

商汤科技推出了具有里程碑意义的Vimi可控人物视频生成大模型,展现了AI技术对复杂场景的高度适应性和商汤在视频生成技术上的深厚积累。Vimi具有卓越的可控性,超越传统技术,精准操控人物表情和肢体动作,同时处理细节精细,支持沉浸式视觉体验,稳定生成高质量视频。

7、AI跳舞也疯狂?MimicMotion发布新技术 可根据任何动作引导生成任意长度的视频

MimicMotion推出的新技术“High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance”引起了业界轰动。该技术利用置信度感知姿势引导生成高质量人体运动视频,提升视频质量,手部精炼机制增强细节,灵活生成任意长度视频,应用广泛前景广阔,将在视频制作和动作捕捉领域扮演关键角色。

8、ChatGPT Mac客户端存在明文存储对话的安全问题

OpenAI最近推出的ChatGPT Mac客户端存在安全漏洞,对话以明文形式存储在计算机上,可能被恶意行为者访问。公司已发布更新加密对话记录以提高安全性。

9、谷歌新举措:将为使用AI生成的政治广告披露信息

谷歌正在采取新举措简化广告商披露政治广告是否包含人工智能生成内容的流程。广告商选择 “修改或合成内容” 复选框后,谷歌将自动生成披露信息,提高广告透明度和可信度。

10、固执还是恪守?任天堂反对在游戏中使用生成式AI

任天堂总裁古川俊太郎对游戏中使用生成式人工智能发表了立场,担心侵犯知识产权,强调保持独特性。他认为任天堂拥有足够的创造力和经验,不需要依赖生成式人工智能工具。生成式AI制作的内容缺乏个性化,与任天堂注重原创性和创造力不符。未来,任天堂将谨慎对待生成式人工智能的使用,依靠团队内部的创造力和经验。

更新时间 2024-07-04