研究者第16页 - AIGC资讯

Google Assistant 即将集成 Bard AI：用户可选择经典或 AI 增强版本

Google 正在为其移动设备上的 Assistant 集成新的 AI 功能，即将推出名为「Classic Assistant」的版本。这一消息得到了 Android 深度研究者 AssembleDeBug 在 X 平台（通过 Android Poli...

大数据 2023-11-24 人工智能

435阅读

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

内容来源：@xiaohuggg Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核心功能的基础上进行了优化和简化，体积缩小了50%。速度提高了6倍。并...

AIGC 2023-11-24 人工智能

673阅读

历数5年89篇研究，这篇综述告诉我们深度学习中的代码数据增强怎么样了

当今深度学习以及大模型的飞速发展，带来了对创新技术的不断追求。在这一进程中，代码数据增强技术显现出其不可忽视的价值。最近，由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...

大数据 2023-11-23 人工智能

488阅读

提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

【新智元导读】最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这个结果表明，统一L...

AIGC 2023-11-23 人工智能

488阅读

OpenAI新模型曝重大飞跃：AGI雏形或威胁人类，也成Altman被解雇导火索！

Sam Alman被解雇，又曝出最新内幕！据路透社报道，就在他被解雇的前四天，OpenAI内部的研究员曾向董事会发了一封警告信，称发现了一个可能威胁人类的强大人工智能。知情人士表示，这封此前从未报道过的信，也是董事会最终罢免Altman的导火索之一。...

大数据 2023-11-23 人工智能

444阅读

Stable Diffusion-安装（整合版）

一、概述本文使用秋叶大佬发布的【绘世整合包】作为软件，它是目前市面上最易于使用的整合包之一，无需对网络和Python有太多的前置知识，已经为AI绘画的普及做出了巨大贡献。绘世启动器整合包于2023年4月16日发布，集成了过去几个月中AI绘画集中引爆的核心...

生成式AI 2023-11-23 人工智能

522阅读

AIGC繁花，绽放在精耕的算力土壤之上

2023年的春天，称得上一句AI之春。大模型成为技术力量新的爆发点，生成式AI（AIGC）应用风起云涌。产业界争先恐后训大模型之际，广大用户最大的困惑是——发布了，但就是玩不到啊！ OpenAI有地域限制且不去说它，各种国产大模型也很...

AIGC 2023-11-22 人工智能

498阅读

新的生图模型DeepFloyd IF来了，可以拳打Stable Diffusion，脚踢Dall-E？

简介： Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型（cascaded pixel diffusion model），复现了...

大数据 2023-11-22 人工智能

753阅读

KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争

近期，KAUST研究团队推出的CAMEL框架引起了广泛关注。该框架以角色扮演为基础，使AI Agents在复杂任务中能够协作和竞争，产生惊人的群体智能效果。NeurIPS2023录用的这一项目探索了大型语言模型（LLMs）领域的新方向。项目地址:htt...

生成式AI 2023-11-22 人工智能

537阅读

PyTorch团队重写「分割一切」模型，比原始实现快八倍

从年初到现在，生成式 AI 发展迅猛。但很多时候，我们又不得不面临一个难题：如何加快生成式 AI 的训练、推理等，尤其是在使用 PyTorch 的情况下。本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...

人工智能 2023-11-22 人工智能

488阅读

起底OpenAI“地震”中的焦点人物Ilya，他对AI到底有何看法？

OpenAI CEO山姆·奥特曼（Sam Altman）上周五被解雇，不再领导公司。投资者对这种安排多有不满，尝试让奥特曼回归，但失败了。OpenAI最大的投资者微软发布消息称，已经聘请奥特曼领导微软新成立的AI研发部门。为什么会出现人事动荡？我们不...

生成式AI 2023-11-22 人工智能

428阅读

一场AI界的权力游戏，揭开了AI行业未来的哪几个巨变

刚刚过去的周末里爆发的戏剧性事件大概会成为回顾2023年不能抹去的重要时刻——明星科技公司OpenAI董事会“突袭”解雇自家CEO Sam Altman。不过这场突袭过去不到48小时，Altman就在个人X上发了一张自拍表示自己回到了公司，相关消息称他与...

AIGC 2023-11-21 人工智能

449阅读

研究表明：GPT-4在图形推理任务上表现不佳，准确率仅33%

最近的研究表明，GPT-4在图形推理任务上表现不佳，仅有33%的准确率，引发了对大型语言模型图形处理能力的关注。通过使用ConceptARC数据集，研究者对451名人类受试者进行了图形推理任务测试，结果显示人类在这方面表现卓越，平均准确率达到91%。...

人工智能 2023-11-21 人工智能

496阅读

英伟达 nvidia 官方code llama在线使用

新一代编程语言模型Code Llama面世：重新定义编程的未来随着人工智能和机器学习技术的迅速发展，我们现在迎来了一款革命性的大型编程语言模型——Code Llama。该模型是基于Llama 2研发的，为开放模型中的佼佼者，其性能达到了行业领先水平。...

大数据 2023-11-21 人工智能

567阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

549阅读

AI「cosplay」关键在人设！复旦、人大等发布大五人格+MBTI测试：特质还原率达82.8%，拒绝OOC

想和喜欢的动漫小说角色聊天？想要一个虚拟伴侣？想要自己的数字智能体？随着大语言模型（Large Language Models, LLM）的发展，这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...

大数据 2023-11-20 人工智能

552阅读

GPT-4不会图形推理？“放水”后准确率依然只有33%

GPT-4的图形推理能力，竟然连人类的一半都不到？美国圣塔菲研究所的一项研究显示，GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕，只能做对25%的题目。 △虚线表示16项任务的平均表现这项实验结果发表后，迅速在...

生成式AI 2023-11-20 人工智能

429阅读

AI视野：奥特曼重回OpenAI；魔搭社区推出开源版GPTS；谷歌Bard遭遇提示注入攻击；Meta重组并解散AI监管团队

???AI新鲜事反转!奥特曼重回OpenAI 据报道，OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 OpenAI 旧金山总部与公司高管会面。微软和其他投资人正在努力恢复Sam Altman的职位。 Emmett...

大数据 2023-11-20 人工智能

524阅读

GPT-4V在自动驾驶上应用前景如何？面向真实场景的全面测评来了

GPT-4V 的发布让许多计算机视觉（CV）应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近，一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...

人工智能 2023-11-20 人工智能

454阅读

复旦、人大等发布大五人格+MBTI测试角色扮演AI特质还原率达82.8%

近期，由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性，特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...

AIGC 2023-11-20 人工智能

469阅读

中国科学院：已于分组加密算法的差分密码分析方面取得进展

IT之家 11 月 20 日消息，据中国科学院软件研究所官方公众号报道，近日，中国科学院软件研究所可信智能系统研究团队在分组加密算法的差分密码分析方面取得一定进展。据悉，该工作团队设计了一个面向分组加密算法的领域编程语言 EasyBC，在此基础上提出...

生成式AI 2023-11-20 人工智能

515阅读

大模型「幻觉」，看这一篇就够了

大模型“幻觉”，终于有系统综述了！一口气49页，详细阐述了幻觉定义、分类、导致幻觉的原因，还有检测幻觉、减轻幻觉的方法。这篇最新综述来自哈工大和华为，一po出就在网上火得不行：具体来说，文中用一套新的范畴框架来定义模型幻觉，并将其分为事实性幻觉、...

AIGC 2023-11-18 人工智能

601阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

533阅读

Meta生成式AI连放大招：视频生成超越Gen-2，动图表情包随心定制

提到视频生成，很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚，Meta 宣布，他们的视频生成效果超过了这两家，而且编辑起来还更加灵活。这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出，Meta 的技术既支...

大数据 2023-11-18 人工智能

480阅读

一招分辨刷榜作弊大模型，博士小哥开源AI数学“照妖镜”

如今很多大模型都声称擅长数学，谁有真才实学？谁是靠背测试题“作弊”的？有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。很多模型一下子就“现原形”了。先看绿色部分，这些大模型在经典数学测试集GSM8k和全新卷子上取得的成绩差不多，...

生成式AI 2023-11-16 人工智能

503阅读

实时文生图速度提升5-10倍，清华LCM/LCM-LoRA爆火，浏览超百万

文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中，我们发现它们通常运行缓慢，导致我们要等一段时间才能拿到生成结果。但最近，一种名叫「LCM」的模型改变了这种情况，它甚至能做到实时的连续生图。图源：https://twitter.com/...

AIGC 2023-11-15 人工智能

543阅读

微软用GPT-4V解读视频，看懂电影还能讲给盲人听，1小时不是问题

世界各地的人们每天都会创造大量视频，包括用户直播的内容、短视频、电影、体育比赛、广告等等。视频是一种多功能媒介，可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法，就能帮助人们设计出具备强大能力的认知机器 —— 它不...

生成式AI 2023-11-15 人工智能

637阅读

S-LoRA：一个GPU运行数千大模型成为可能

一般来说，大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是，当针对众多任务（如个性化助手）对 base 模型进行微调时，训练和服务成本会变得非常高昂。低秩适配（LowRank Adaptation，LoRA）是一种参数效率高的微调方法，通常用...

人工智能 2023-11-15 人工智能

475阅读

LLM幻觉问题全梳理！哈工大团队50页综述重磅发布

幻觉，老朋友了。自打LLM进入我们的视野，幻觉问题就一直是一道坎，困扰着无数开发人员。当然，有关大语言模型幻觉的问题已经有了无数研究。最近，来自哈工大和华为的团队发表了一篇50页的大综述，对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。这...

AIGC 2023-11-15 人工智能

469阅读

基于LLaMA却改张量名，李开复公司大模型引争议，官方回应来了

前段时间，开源大模型领域迎来了一个新的模型 —— 上下文窗口大小突破 200k，能一次处理 40 万汉字的「Yi」。这个大模型由创新工场董事长兼 CE0 李开复创立的大模型公司「零一万物」构建，包括了 Yi-6B 和 Yi-34B 两个版本。根据 H...

生成式AI 2023-11-14 人工智能

445阅读

医学研究者发出紧急警告:AI生成大量健康虚假信息

医学研究者们发出紧急警告，指出生成式人工智能（Generative AI）有可能轻松制造大量健康领域的虚假信息，对社区的健康和福祉构成威胁。这一警告来自于对生成式 AI技术进行测试的Flinders大学医学研究团队，他们使用这一前沿技术来检验虚假健康信息...

生成式AI 2023-11-14 人工智能

569阅读

NeRF与自动驾驶的前世今生，近10篇论文汇总！

神经辐射场（Neural Radiance Fields）自2020年被提出以来，相关论文数量呈指数增长，不但成为了三维重建的重要分支方向，也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起，主要因为它跳过了传统CV重建pipeline的...

生成式AI 2023-11-14 人工智能

575阅读

研究: AI生成的白人面孔现在“比真人还真”

根据《心理科学》杂志的一份报告，人工智能（AI）生成的白人面孔的图像如今已经达到了“超真实”的水平，甚至比真实人物的照片更加逼真。然而，该研究指出，由于算法训练数据的偏见，AI在呈现其他族裔的面孔时却表现出明显的白人特征。图源备注：图片由AI生成，图片...

AIGC 2023-11-14 人工智能

494阅读

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

ICLR 2024审稿结果公布了！ ICLR是机器学习领域重要的学术会议之一，每年举办一次。2024年是第十二届，将在奥地利维也纳5月7日-11日召开。根据OpenReview官方放出的结果显示，今年共有7135篇投稿论文。此外，另有国内开发者魏国...

大数据 2023-11-13 人工智能

649阅读

UNC斯坦福等曝光GPT-4V意外漏洞，被人类哄骗数出8个葫芦娃！LeCun和Jim Fan震惊了

GPT-4V诞生后，惊艳的多模态能力让网友惊呼连连，连OpenAI总裁Greg Brockman都不断在X上安利。不过，最近大家发现，只要打乱布局，GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」，再次难倒…… UCSC教授Xin...

大数据 2023-11-13 人工智能

437阅读

AI图像生成模型LCMs: 四个步骤就能快速生成高质量图像的新方法

在最新的AI模型和研究领域，一种名为Latent Consistency Models（LCMs）的新技术正迅速推动文本到图像人工智能的发展。与传统的Latent Diffusion Models(LDMs 相比，LCMs在生成详细且富有创意的图像方面同样...

AIGC 2023-11-13 人工智能

469阅读

谷歌DeepMind给AGI划等级，猜猜ChatGPT在哪个位置

我们到底该如何定义 AGI（通用人工智能）？如果你要求 100 位 AI 专家进行解答，你可能会得到 100 个相关但不同的定义。现阶段，AGI 是 AI 研究中一个重要且存在争议的概念，有研究者认为 AGI 已经出现在最新一代大语言模型（LLM）中；...

大数据 2023-11-13 人工智能

442阅读

斯坦福提出对比偏好学习：无需强化学习即可从人类反馈中学习

在模型与人类意图对齐方面，根据人类反馈的强化学习（RLHF）已经成为一大流行范式。通常来说，RLHF 算法的工作过程分为两个阶段：一、使用人类偏好学习一个奖励函数；二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励...

生成式AI 2023-11-13 人工智能

531阅读

GPT-4比你更会问问题：让大模型自主复述，打破与人类对话的壁垒

在最新的人工智能领域动态中，人工生成的提示（prompt）质量对大语言模型（LLM）的响应精度有着决定性影响。OpenAI 提出的建议指出，精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而，普通用户是否能够确保他们的问题对于 LLM 来说足够...

人工智能 2023-11-13 人工智能

418阅读

通用异常检测新曙光：华科大等揭秘GPT-4V的全方位异常检测表现

异常检测任务旨在识别明显偏离正常数据分布的异常值，在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而，对于实际的应用而言，异常检测也需要理解数据的高层语义，从而深入...

生成式AI 2023-11-13 人工智能

535阅读

Meta的LLama模型非官方下载方法

简介 Llama模型是一个用于自然语言处理的大型语言模型，它由Meta AI开发，拥有65亿个参数。该模型的目的是帮助研究者在AI的子领域中推进他们的工作。Llama模型结构巨大，最小的模型LLaMA 7B也经过了超过1万亿个代币的训练。Llama模型...

大数据 2023-11-12 人工智能

579阅读

【人工智能】ChatGTP从入门到精通

当谈论自然语言处理和文本生成技术时，Chat GPT 是一个备受瞩目的话题。作为一种基于深度学习的语言模型，Chat GPT 在近几年里已经展现出了惊人的能力，可以生成几乎无法区分与人类写作的文本，并在自然语言处理领域的各种任务中都表现出色。Chat GP...

生成式AI 2023-11-12 人工智能

892阅读

让AI模型成为GTA五星玩家，基于视觉的可编程智能体Octopus来了

电子游戏已经成为如今现实世界的模拟舞台，展现出无限可能。以游戏《侠盗猎车手》（GTA）为例，在 GTA 的世界里，玩家可以以第一人称视角，在洛圣都(游戏虚拟城市当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们是否也能有一...

AIGC 2023-11-10 人工智能

520阅读

李飞飞团队新作：脑控机器人做家务，让脑机接口具备少样本学习能力

未来也许只需动动念头，就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。 NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、...

AIGC 2023-11-10 人工智能

534阅读

建立自己的ChatGPT：LLama私有化部署及测试

大语言模型（LLM）现在非常流行，可惜ChatGPT等都不开源。大家没法搭建一个自己的环境来感受以下。幸好Meta开源了LLama，这是LLama的介绍： https://ai.facebook.com/blog/large-language-model...

大数据 2023-11-10 人工智能

563阅读

ChatGPT开源平替(2)llama

最近，FacebookResearch 开源了他们最新的大语言模型 LLaMA，训练使用多达14,000 tokens 语料，包含不同大小参数量的模型 7B、13B 、30B、 65B，研究者可以根据自身算力配置进行选择。 ...

大数据 2023-11-09 人工智能

546阅读

AI监管争议再起，华尔街对它的热情却丝毫未减

美国政府近期发布一项新的AI法规，也让世界再次把目光放到AI的安全疑虑问题上。对于开发大模型的公司来说，这项法规要求它们向政府提供更多信息，而这可能会减慢新产品和更新的发布速度。这项法规中的许多规定涉及尚未上市的大型基础模型和AI系统的未来发展，这就...

AIGC 2023-11-09 人工智能

454阅读

大模型勇闯洛圣都，加封「GTA五星好市民」！南洋理工、清华等发布视觉可编程智能体Octopus：打游戏、做家务全能干

随着游戏制作技术的不断发展，电子游戏已然成为现实世界的模拟舞台。以游戏《侠盗猎车手》（GTA）为例，在GTA的世界里，玩家可以以第一人称视角，在洛圣都（游戏虚拟城市）当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们...

人工智能 2023-11-09 人工智能

618阅读

来聊聊近期火爆的几个大模型和自动驾驶概念

本文经自动驾驶之心公众号授权转载，转载请联系出处。近期大模型各种应用依然火爆，10月初前后出现了一系列颇有噱头的文章，试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题，写这篇文章，一方面是发现其实包括我在内，在过去其实都混淆了一些很相关...

生成式AI 2023-11-09 人工智能

478阅读

用过GPT-4 Turbo以后，我们再也回不去了

昨天，很多人彻夜未眠 —— 全球科技圈都把目光聚焦在了美国旧金山。短短 45 分钟时间里，OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型，和基于它的一系列应用，一切似乎就像当初 ChatGPT 一样令人震撼。 OpenAI 在本周...

AIGC 2023-11-09 人工智能

520阅读