研究者第14页 - AIGC资讯

盘古智能体（Pangu-Agent）的五个创新点

随着大规模语言模型（Large Language Model，LLM）的发展和应用，人工智能领域出现了一种新的研究方向，即基于LLM的自主智能体（LLM-based Autonomous Agent）。这种智能体利用LLM的强大的表示能力和生成能力，可以...

AIGC 2023-12-29 人工智能

1414阅读

这次重生，AI要夺回网文界的一切

重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托，难道我还能写的比 J・K・Rowling 更好不成？不过，...

生成式AI 2023-12-29 人工智能

845阅读

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模...

人工智能 2023-12-29 人工智能

1084阅读

Midjourney V6 引爆社交媒体，AI图像与照片的差别消失；LangChain的2023AI发展状况总结

? AI新闻 ? Midjourney V6 引爆社交媒体，AI图像与照片的差别消失摘要：Midjourney V6 第二次社区评价震惊网友，神图细节逼真，光影效果逆天，皮肤质感细腻，已超越昨日版本。V6即将上线，预计在圣诞节前发布。其出图质量让...

AIGC 2023-12-28 人工智能

935阅读

大模型被偷家！CNN搞多模态不弱于Transfromer（腾讯&港中文）

本文经自动驾驶之心公众号授权转载，转载请联系出处。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无需改变模型结构，简单预处理即可接近甚至超越SO...

生成式AI 2023-12-28 人工智能

898阅读

快手开源KwaiAgents系统性能超越GPT-3.5

近日，快手联合哈尔滨工业大学成功开源了「KwaiAgents」系统，实现了7B/13B模型的超越效果。这一成果的背后，是通过Meta-Agent Tuning（MAT）方法提升大模型的通用能力。整个项目包含了系统、模型、以及评测三个方面的内容，并通过Git...

生成式AI 2023-12-28 人工智能

876阅读

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选...

人工智能 2023-12-27 人工智能

998阅读

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

909阅读

【IT资讯速递】小易智联发布法律领域ChatGPT；新华社研究院发布国产大模型报告，讯飞星火、百度文心一言分列 TOP 2；ChatGPT每日烧钱约70万美元 OpenAI或已在破产边缘

2023年8月14日星期一癸卯年六月廿八第000003号本文收录于IT资讯速递专栏,本专栏主要用于发布各种IT资讯，为大家可以省时省力的就能阅读和了解到行业的一些新资讯 IT资讯速递小易智联发布法律领域ChatGPT—...

AIGC 2023-12-27 人工智能

1136阅读

华为诺亚的盘古Agent来了，让智能体学会结构化推理

自 AI 诞生以来，开发能够解决和适应复杂工作的多任务智能体（Agent）一直是个重要的目标。 AI 智能体对于许多应用至关重要，研究者通常用强化学习方法通过环境交互来培养智能体的决策技能。基于模型和无模型的深度强化学习方法都已取得了广为人们所知的成就，...

AIGC 2023-12-26 人工智能

973阅读

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务...

人工智能 2023-12-26 人工智能

846阅读

挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

在大模型领域，Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显，比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷，研究者们开发出了很多...

生成式AI 2023-12-25 人工智能

1152阅读

一篇综述，看穿基础模型+机器人的发展路径

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU 的 Yonatan Bisk 和 Google DeepMind...

大数据 2023-12-25 人工智能

900阅读

大模型被偷家！腾讯港中文新研究修正认知：CNN搞多模态不弱于Transfromer

在Transformer占据多模态工具半壁江山的时代，大核CNN又“杀了回来”，成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无...

生成式AI 2023-12-25 人工智能

911阅读

14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍

就今天的人工智能发展水平来说，文生图、图生视频、图像/视频风格迁移都已经不算什么难事。生成式 AI 天赋异禀，能够毫不费力地创建或修改内容。尤其是图像编辑，在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下，经历了重大发展。这股浪潮催生了大量图...

生成式AI 2023-12-24 人工智能

782阅读

测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

测试时领域适应（Test-Time Adaptation）的目的是使源域模型适应推理阶段的测试数据，在适应未知的图像损坏领域取得了出色的效果。然而，当前许多方法都缺乏对真实世界场景中测试数据流的考虑，例如：测试数据流应当是时变分布（而非传统领域适应中...

AIGC 2023-12-24 人工智能

889阅读

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

之前要两天才能训练好的数字人，现在只用半小时就能完成了！到了推理阶段，更是只要16毫秒，就能得到动作流畅、细节到位的场景视频。而且无需复杂的采样和建模，只要随便拍一段50-100帧的视频就足够了，换算成时间不过几秒钟。这正是由苹果联合德国马普所推出...

大数据 2023-12-23 人工智能

840阅读

LLaMA系列模型

1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月，Meta（原Facebook）推出了LLaMA大模型，使用了1.4...

生成式AI 2023-12-22 人工智能

961阅读

浙大“北极熊毛衣”登Science，保温效率达羽绒服5倍

最近，一波又一波寒潮接踵而至，羽绒服成了人们过冬的必备物品。而浙大研制了一种新型材料，不仅保暖而且比羽绒服更轻薄耐用，论文已经登上了Science。它模仿了北极熊毛的结构，仅用五分之一的厚度，就能达到和羽绒一样的保暖效果。图片这款“北极熊毛材料”...

人工智能 2023-12-22 人工智能

801阅读

只需一张图片、一句动作指令，Animate124轻松生成3D视频

近一年来，DreamFusion 引领了一个新潮流，即 3D 静态物体与场景的生成，这在生成技术领域引发了广泛关注。回顾过去一年，我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步，逐渐融入单视角图像，进而发展到整合...

人工智能 2023-12-22 人工智能

901阅读

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号...

人工智能 2023-12-21 人工智能

1143阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

975阅读

基于GPT-4！Coscientist成功完成复杂化学实验布洛芬配方轻松拿捏

近期，基于GPT-4的AI系统Coscientist成功在Nature杂志上发表了一篇论文，展示了其在科学研究领域的引人注目的表现。这一新兴的大模型化学家能够自主完成复杂的实验任务，甚至包括2010年诺贝尔化学奖获得者因其研究而获奖的钯催化交叉偶联反应。这...

大数据 2023-12-21 人工智能

920阅读

开创全新通用3D大模型，VAST将3D生成带入「秒级」时代

生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统3D 建模涉及游戏、影视、建筑等多个行业，普遍依赖专业人员手动操作，生产周期短则几天，多则以月为单位，单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...

生成式AI 2023-12-21 人工智能

1011阅读

Stable Diffusion4

这个也发到第4回了~~ 输入一句话，就能把图片修改好, 自用的好工具真是挺有用的 , AI 正在向图片生成领域发起挑战，各大科技公司、高校等开始纷纷涉足。最近一段时间，关心 AI 圈的人可能都有这样一种感受：扩散模型被越来越多的人提及，基于扩散模型的各种...

人工智能 2023-12-20 人工智能

905阅读

Gemini Pro还不如GPT-3.5，CMU深入对比研究：保证公平透明可重复

谷歌Gemini实力到底如何？卡耐基梅隆大学来了场专业客观第三方比较。为保证公平，所有模型使用相同的提示和生成参数，并且提供可重复的代码和完全透明的结果。不会像谷歌官方发布会那样，用CoT@32对比5-shot了。一句话结果：Gemini Pr...

AIGC 2023-12-20 人工智能

886阅读

【EMNLP 2023】面向垂直领域的知识预训练语言模型

近日，阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性，发现在垂直领域的图谱结构具有全局稀疏，局部...

生成式AI 2023-12-20 人工智能

881阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

872阅读

前OpenAI首席科学家Ilya: 只要能够预测下一个token，人类就能达到AGI

近日，Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」，似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...

生成式AI 2023-12-20 人工智能

812阅读

CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版

可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...

人工智能 2023-12-20 人工智能

1011阅读

逆天！真实可控、可拓展，自动驾驶仿真平台LightSim上新

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

大数据 2023-12-20 人工智能

886阅读

人工智能有能力彻底改变科学研究

人工智能(AI 是一门涉及计算机科学、数学、心理学、语言学等多个学科的交叉学科，它旨在创造能够模拟或超越人类智能的系统和应用。AI的发展经历了几个阶段，从早期的符号主义、联结主义，到近年来的统计学习、深度学习等，不断地突破了理论和技术的限制，实现了许多令...

人工智能 2023-12-19 人工智能

953阅读

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究写在最前面一些想法大型模型输出格式不受控制的解决方法大模型介绍（很有意思）GPT 模型家族的发展 Chatgpt 优点缺点 GPT4 其他模型补充：self-instruct合成数据 Cod...

人工智能 2023-12-19 人工智能

889阅读

越来越像人类的AI，提前过起「圣诞节」

ChatGPT，居然会偷懒? 在许多文学作品的描述中，AI都是不知疲倦、不用休息，可以007工作的超级工具，而强大的人工智能甚至可以像人类一样自主思考、拥有情感。虽然目前的AI模型，还远不及科幻电影中的强人工智能，但是表现也远超以前的“人工智障”。有意思...

生成式AI 2023-12-19 人工智能

793阅读

程序员撑过ChatGPT一周年！不仅没被取代，还把AI用得贼6：10分钟开发一个应用

不知不觉间，距离掀起全球新一轮 AI 革命的 ChatGPT 出道，已经过去一周年了。在这场颠覆性的 AI 革命中，许多企业和程序员们逐渐形成了一个共识:“不会用 AI 就将被淘汰”。为了避免“被淘汰”，这一年来众多企业和程序员全力拥抱 AI、开发各种...

人工智能 2023-12-19 人工智能

843阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始，多次去...

生成式AI 2023-12-18 人工智能

951阅读

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

里程碑式论文word2vec获得NeurIPS时间检验奖，可谓实至名归。但一作Tomas Mikolov在Facebook上发表的长篇获奖感言，却充满了失望和不满。图片论文最初被ICLR拒稿都算小事了，他还暗讽了OpenAI首席科学家Ilya Su...

大数据 2023-12-18 人工智能

887阅读

GPT-4V都搞不明白的未来推理有解法了！来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的GPT-4V（如下图所示），也无法很好地解决这一问题。 △ GPT-4V的错误案例现在，华科大和上科大团队提出了一个赋予...

生成式AI 2023-12-18 人工智能

878阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工...

人工智能 2023-12-17 人工智能

915阅读

LLaMA-META发布单卡就能跑的大模型

2023年2月25日，Meta使用2048张A100 GPU，花费21天训练的Transformer大模型LLaMA开源了。 1.4T tokenstakes approximately 21 days 以下是觉得论文中重要的一些要点 1）...

大数据 2023-12-17 人工智能

887阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

870阅读

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

Hugging Face 技术负责人 Philipp Schmid 表示：“代码自动补全工具，如 GitHub Copilot，已被超过一百万开发者使用，帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...

AIGC 2023-12-17 人工智能

1016阅读

哀悼！55岁商汤科技创始人汤晓鸥突然离世，他撑起中国计算机视觉研究半壁江山

沉痛悼念！ 2023年12月15日23时45分，商汤科技创始人汤晓鸥教授因病救治无效不幸离世，终年55岁。天妒英才，继孙剑博士2年前意外辞世后，中国AI界再失一位领军人物。计算机视觉的开拓者毫不夸张地说，汤晓鸥教授是中国计算机视觉的开拓者和探路...

大数据 2023-12-17 人工智能

881阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1818阅读

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，Google DeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联...

人工智能 2023-12-16 人工智能

840阅读

论文笔记：The Impact of AI on Developer Productivity:Evidence from GitHub Copilot

0 abstract 本文介绍了一项对GitHub Copilot（一种人工智能编程助手）的控制实验结果。研究人员招募了软件开发人员，要求他们尽可能快地用JavaScript实现一个HTTP服务器。实验组可以访问人工智能编程助手，比对照组完成任务的...

生成式AI 2023-12-16 人工智能

1042阅读

真实、可控、可拓展，自动驾驶光照仿真平台LightSim上新了

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

AIGC 2023-12-15 人工智能

1061阅读

OpenAI新研究：让小模型来监督大模型能显著提高泛化性能

人工智能的超级对齐问题在未来AI系统超越人类智能的情境下变得尤为复杂。研究小模型是否能够有效监督大模型成为关键问题。当前的对齐方法主要依赖于人类监督，但超级AI的复杂和创造性行为使得人类难以可靠监督。为了解决这个核心挑战，研究提出一个创新的思路:能否用一...

生成式AI 2023-12-15 人工智能

874阅读

专家表示：AI在学校作弊问题上的担忧目前尚无根据

近期关于学生利用人工智能（AI）进行学术作弊的担忧似乎有些过于夸张。斯坦福教育学者进行了匿名调查和随访焦点小组讨论，针对高中生的使用情况，发现自ChatGPT一年多前问世以来，作弊率虽然一直相对较高，但并未呈现明显增长的趋势。图源备注：图片由AI生成，...

生成式AI 2023-12-15 人工智能

859阅读

QTNet：最新时序融合新方案！点云、图像、多模态检测器全适用（NeurIPS 2023）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 个人理解时序融合能够有效提升自动驾驶3D目标检测的感知能力，然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章《Qu...

大数据 2023-12-15 人工智能

1133阅读