-
ChatGPT与DALL·E 3之间的行业「黑话」被人发现了
上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。 DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 p...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
解读OpenAI最强文生图模型—DALL·E 3
Midjourney、Stable Difusion在商业变现和场景化落地方面获得了巨大成功,这让OpenAI看到了全新的商机,也是推出DALL·E3的重要原因之一。 上周,OpenAI宣布在ChatGPT Plus和企业版用户中,全面开放文生图模型DAL...
-
有史以来最智能的AI手机!三星Galaxy S24将超越谷歌和苹果
快科技10月24日消息,在前不久的新品发布会上,谷歌着重宣传了搭载其自研Tensor G3处理器的Pixel 8系列的AI功能。 但是据sammobile最新的报道,三星将在其下一款旗舰手机Galaxy S24上加大人工智能投入力度。 该网站表示,三星计划...
-
Nightshade:艺术家全新反击工具,可用损坏训练数据“毒害”AI模型
自 ChatGPT 几乎一年前登场以来,生成式人工智能(AI)进入了高速发展的时代,但反对声音也逐渐增强。许多艺术家、娱乐人士、表演者甚至唱片公司已经对AI公司提起了诉讼,其中一些诉讼涉及 ChatGPT 制造商 OpenAI,原因是这些新工具背后的“秘密...
-
OpenAI增强ChatGPT“绘画”能力
OpenAI宣布在ChatGPT中引入一项新功能,可以根据用户对话创建独特的图像。该功能可供ChatGPT的Plus和Enterprise用户使用,便于基于用户描述进行视觉渲染,并支持直接在聊天中进行迭代细化。底层技术由OpenAI的高级图像模型DALL...
-
MiniGPT-5:一种基于生成vokens 的交错视觉和语言生成模型
MiniGPT-5是一种交错视觉和语言生成模型,通过整合大型语言模型和稳定扩散技术,实现了文本和图像的协调输出。该模型采用两阶段训练策略,首先进行无图像描述的多模态数据生成,然后利用无分类器的引导系统进一步提升生成 vokens 的效果。MiniGPT-5...
-
2023年人工智能的六大预测
根据当前的人工智能热潮及前景,以下是专家们对2023年人工智能的六项预测。 多种因素的结合,如小尺寸的强大计算、边缘计算、IT和运营技术(OT 的集成、5G,甚至COVID-19大流行,推动了人工智能在各行业的应用。Market View Resear...
-
AI技术漏洞!OpenAI的DALL-E 3易受越狱攻击 生成儿童吸烟照片
OpenAI的DALL-E3是一种强大的图像生成AI技术,但最新的事件表明,它并非没有漏洞。一位名为Peter Gostev的LinkedIn用户发现了一种越狱技巧,成功生成了一组令人震惊的图像,显示儿童正在吸烟。这一事件引发了对AI系统安全性和道德的担忧...
-
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
最近一段时间,我们见证了大型语言模型(LLM)的显著进步。特别是,生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来,大型多模态模型 (LMM 引起了研究界越来越多的兴趣,许多工作致力于构建多模态...