-
腾讯混元大模型升级:新增“文生图”,代码能力大幅提升
10月26日,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。 作为实用级的通用大模型,腾讯混元大模型的应用...
-
数字人+AI换脸简单实现虚拟制片
概述 本文将从零开始介绍如何创造并驱动数字人,最后通过AI换脸实现虚拟制片。效果如下: 数字人驱动 换脸憨豆先生 数字人简介 数字人(Digital Human / Meta Human),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。数字人...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频
VideoCrafter是一款全新的开源视频创建和编辑套件,采用了扩散模型,能够从文本描述生成照片和视频逼真的输出。 尽管尚未正式发布,但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter,即使没有视频编辑或动画经验的人也可以轻...
-
AI视野:星火大模型V3.0发布;B站测试推出“AI视频总结”功能;高通发布骁龙8Gen3;苹果计划每年砸10亿美元搞AI
????大模型动态 科大讯飞星火认知大模型V3.0正式发布 在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能 近日...
-
HiLM-D:自动驾驶多模态大语言模型玩出花了
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人的一些思考 不得不说,最近大模型在学术界火起来了,基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外,大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...
-
研究显示:AI可提升维基百科可靠性
维基百科一直备受争议,有人视之为无价之宝,有人则对其可靠性提出质疑。近期,一项研究表明,通过人工智能(AI),可以提高维基百科的可靠性。 这项研究由一家伦敦的AI公司进行,他们开发了一个名为SIDE的系统,旨在通过检查维基百科的信息来源,识别其准确性,并提...
-
从基础到实践,回顾 Elasticsearch 向量检索发展史
1.引言 向量检索已经成为现代搜索和推荐系统的核心组件。 通过将复杂的对象(例如文本、图像或声音)转换为数值向量,并在多维空间中进行相似性搜索,它能够实现高效的查询匹配和推荐。 Elasticsearch 作为一款流行的开源搜索引擎,其在向量检索方面...
-
全新视觉提示方法SoM 让GPT-4V看的更准、分的更细
研究人员推出了一种新的视觉提示方法 Set-of-Mark(SoM),它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。GPT-4V 是一种基于 GPT-4的多模态模型,可以同时处理文本和图像,并生成多种类型的输出。 然而...
-
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
最近一段时间,我们见证了大型语言模型(LLM)的显著进步。特别是,生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来,大型多模态模型 (LMM 引起了研究界越来越多的兴趣,许多工作致力于构建多模态...
-
AI视频爆发!一天10万条,冲进抖音快手小红书
在暖色灯光中,一个复古行李箱缓缓打开,露出灰白色的运动鞋,光影在鞋面上划过,镜头拉近,麂皮质地的纹理清晰可见。画面一转,鞋子旋转起来,灯光由暗转亮,明暗交接在鞋跟处形成一个慢镜头的色彩对比,一边明亮、一边典雅。 这个20s的商品展示视频,角度丰富、色彩讲究...
-
最新AI配音技术刷屏!声音克隆+口型同步,这下真的是“全世界都在说中国话”了
没开玩笑,现在的AI技术,能让全世界都说中国话。 继“AI孙燕姿”后,最近,有一条视频再次刷新了大众对于AI配音技术的认知。 10月19日,B站UP主“johnhuu”发布了一条题为“这才是没有译制片腔调的翻译”的视频。 视频一开头,霉霉正在用地道的普通话...