性能提升第4页 - AIGC资讯

编程能力超GPT-4，羊驼代码版“超大杯”来了，小扎还亲自剧透Llama3

羊驼家族的“最强开源代码模型”，迎来了它的“超大杯”—— 就在今天凌晨，Meta宣布推出Code Llama的70B版本。图片在HumanEval测试中，Code Llama-70B的表现在开源代码模型中位列第一，甚至超越了GPT-4。此次发布的超...

生成式AI 2024-01-30 人工智能

837阅读

大模型也能切片，微软SliceGPT让LLAMA-2计算效率大增

大型语言模型（LLM）通常拥有数十亿的参数，用了数万亿 token 的数据进行训练，这样的模型训练、部署成本都非常高。因此，人们经常用各种模型压缩技术来减少它们的计算需求。一般来讲，这些模型压缩技术可以分为四类：蒸馏、张量分解（包括低秩因式分解）、剪枝...

AIGC 2024-01-30 人工智能

793阅读

Baichuan 3体验入口百川智能超千亿参数大语言AI模型在线使用地址

Baichuan 3是一款卓越的语言模型，拥有超过千亿的参数规模。在多个权威通用能力评测中，Baichuan3 展现出色，特别在中文任务上超越了GPT-4。它在自然语言处理、代码生成、医疗任务等领域表现出色，采用了多项创新技术手段提升模型能力，包括动态数据...

AIGC 2024-01-30 人工智能

899阅读

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

随着 LLaMA、Mistral 等大语言模型的成功，各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂，且新旧模型之间可能存在能力的冗余。近日，中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM，用...

生成式AI 2024-01-29 人工智能

819阅读

GPT-4准确率最高飙升64%！斯坦福OpenAI重磅研究：全新Meta-Prompting方法让LLM当老板

当你让大模型写一首「莎士比亚十四行诗」，并以严格的韵律「ABAB CDCD EFEF GG」执行。同时，诗中还要包含提供的3个词。对于这么高难度的创作题，LLM在收到指令后，并不一定能够按要求做出这首诗。正所谓，人各有所长，LLM也是如此，仅凭单...

大数据 2024-01-29 人工智能

916阅读

十分钟读懂Stable Diffusion运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊...

生成式AI 2024-01-29 人工智能

969阅读

Llama 2: Open Foundation and Fine-Tuned Chat Models

文章目录 TL;DR Introduction 背景本文方案实现方式预训练预训练数据训练细节训练硬件支持预训练碳足迹微调 SFT SFT 训练细节 RLHF 人类偏好数据收集奖励模型迭代式微调（RLHF）拒...

AIGC 2024-01-29 人工智能

1106阅读

强化学习和世界模型中的因果推断

一、世界模型 “世界模型”源于认知科学，在认知科学里面有一个等价的词汇 mental models，也就是心智模型。那么什么是心智模型？在认知科学里有一个假设，认为人在大脑内部会有一个对于真实外在世界的表征，它对于认知这个世界，特别是推理和决策有很关...

人工智能 2024-01-26 人工智能

1066阅读

DeepSeek 发布全新开源大模型，数学推理能力超越 LLaMA-2

自从 LLaMA 被提出以来，开源大型语言模型（LLM）的快速发展就引起了广泛研究关注，随后的一些研究就主要集中于训练固定大小和高质量的模型，但这往往忽略了对 LLM 缩放规律的深入探索。开源 LLM 的缩放研究可以促使 LLM 提高性能和拓展应用领域...

大数据 2024-01-24 人工智能

1693阅读

迈向端到端自动驾驶，地平线正式开源Sparse4D算法

1月22日，地平线将纯视觉自动驾驶算法——Sparse4D系列算法开源，推动行业更多开发者共同参与到端到端自动驾驶、稀疏感知等前沿技术方向的探索中。目前，Sparse4D算法已在GitHub平台上线，开发者可关注地平线GitHub官方账号“Horizon...

人工智能 2024-01-23 人工智能

898阅读

纯LiDAR 3D检测路在何方？时序递归TimePillars：直接干到200m！

基于LiDAR点云点3D Object Detection一哥是一个很经典的问题，学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境，所以室外点云的Object Detection的性能都还不是太好。而激光雷达点云本质上比...

人工智能 2024-01-23 人工智能

925阅读

“AI学会欺骗，人类完蛋了”？看完Anthropic的论文，我发现根本不是这回事啊

AGI若到来，人类是否会受到威胁，是一个大众热衷讨论同时研究者们也很关注的问题，从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文，提出关于“Sleeper Agen...

人工智能 2024-01-22 人工智能

823阅读

Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

Llama 2-70B一夜之间打败GPT-4，让整个AI社区为之震惊！甚至，在AlpacaEval 2.0排行榜中，微调后的模型胜率完全碾压Claude 2、Gemini Pro等模型。 Meta和NYU研究团队究竟提出了什么秘制配方，才能让Llam...

生成式AI 2024-01-22 人工智能

873阅读

智能车的「ChatGPT时刻」，还有多远？

要说今年“科技春晚”CES上最吸引眼球的是什么，智能车当属其一。毕竟大模型一上车，智能座舱都卷成酱婶了：让车上的数字助手帮忙记录约饭日程，Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示规划路线这种事儿也变得充满巧思，数字助手会根据你的习...

生成式AI 2024-01-19 人工智能

815阅读

智能车的「ChatGPT时刻」，还有多远？| 模力时代

要说今年“科技春晚”CES上最吸引眼球的是什么，智能车当属其一。毕竟大模型一上车，智能座舱都卷成酱婶了: 让车上的数字助手帮忙记录约饭日程，Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示规划路线这种事儿也变得充满巧思，数字助手会根据你的习...

人工智能 2024-01-19 人工智能

874阅读

苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM 类似。这一观察结果与之前...

人工智能 2024-01-18 人工智能

848阅读

马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

Sam Altman在各种场合都提到，大语言模型的多模态能力，是未来AI技术能够造福人类的最亟待突破的领域。那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平？当前多模态模型取得的进步很大程度上归功于大语言模型（LLM）的推理能力。但在视...

AIGC 2024-01-18 人工智能

1009阅读

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

在对话型人工智能（AI）研究中，存在趋势即朝着开发参数更多的模型方向发展，如 ChatGPT 等为代表的模型。尽管这些庞大的模型能够生成越来越好的对话响应，但它们同时也需要大量的计算资源和内存。本文研究探讨的问题是：一组小模型是否能够协同达到与单一大模型...

AIGC 2024-01-18 人工智能

847阅读

机器人领域首个开源视觉-语言操作大模型，RoboFlamingo框架激发开源VLMs更大潜能

近年来，大模型的研究正在加速推进，它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求，这自然引申出一个问题：能不能充分利用大模型能力，将其迁移到机器人领域，直接...

大数据 2024-01-17 人工智能

914阅读

基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率...

人工智能 2024-01-17 人工智能

2567阅读

性能大涨20%！中科大「状态序列频域预测」方法：表征学习样本效率max

强化学习算法（Reinforcement Learning, RL）的训练过程往往需要大量与环境交互的样本数据作为支撑。然而，现实世界中收集大量的交互样本通常成本高昂或者难以保证样本采集过程的安全性，例如无人机空战训练和自动驾驶训练。为了提升强化学习算...

生成式AI 2024-01-15 人工智能

950阅读

【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

人工智能 2024-01-15 人工智能

1910阅读

TimePillars：提升200米以上小目标的检测能力

本文经自动驾驶之心公众号授权转载，转载请联系出处。基于LiDAR点云点3D Object Detection一直是一个很经典的问题，学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境，所以室外点云的Object Det...

大数据 2024-01-15 人工智能

1072阅读

AI视野：ComfyUI Lora训练节点来了；“ChatGPT之父”结婚；Topazlabs推视频高清放大工具Topaz Video AI4；阿里云推出第八代企业级实例g8i

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 ComfyUI...

人工智能 2024-01-13 人工智能

845阅读

简单易懂Stable Diffusion运行原理都直接喂到你嘴里了还不快点接着

**Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 保姆级教程资料包（文末可获取）一背景介绍 AI 绘画作为 AIGC（人工智能创作内容）的一个应用方向，它绝对是 2022 年以...

AIGC 2024-01-09 人工智能

1313阅读

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，Sw...

生成式AI 2024-01-08 人工智能

866阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1127阅读

模型A：幸亏有你，我才不得0分，模型B：俺也一样

琳琅满目的乐高积木，通过一块又一块的叠加，可以创造出各种栩栩如生的人物、景观等，不同的乐高作品相互组合，又能为爱好者带来新的创意。我们把思路打开一点，在大模型（LLM）爆发的当下，我们能不能像拼积木一样，把不同的模型搭建起来，而不会影响原来模型的功能，...

人工智能 2024-01-06 人工智能

771阅读

一句话精准视频片段定位！清华新方法拿下SOTA｜已开源

只需一句话描述，就能在一大段视频中定位到对应片段！比如描述“一个人一边下楼梯一边喝水”，通过视频画面和脚步声的匹配，新方法一下子就能揪出对应起止时间戳：就连“大笑”这种语义难理解型的，也能准确定位：方法名为自适应双分支促进网络（ADPN），由清...

AIGC 2024-01-06 人工智能

877阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

963阅读

Gemini偷师文心一言？这一局，百度给中国大模型找回了面子！

大数据产业创新服务媒体 ——聚焦数据 · 改变商业在模型表现方面，百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等，都在说超过ChatGPT-3.5，马上要追上GPT-4，甚至在某些领域的表现超越了GPT-4。...

生成式AI 2023-12-28 人工智能

927阅读

WAVE SUMMIT迎来第十届，文心一言将有最新披露！

10句话2分钟，挑战成功说服宿管阿姨开门，这个人群中的“显眼包”是一个接入文心大模型4.0游戏里的NPC，妥妥 “工具人”实锤～尝试用AI一键自动识别好坏咖啡豆，看一眼便知好坏，真正“颜值即正义”，让咖啡星人狂喜～ ...

大数据 2023-12-27 人工智能

853阅读

不止大模型，亚马逊云科技布局AIGC底座能力

“大模型只是客户需求的其中一个部分，但远远不是所有，客户还需要更广泛的基础能力。亚马逊云科技推出自研芯片、生成式AI服务Bedrock以及大模型Titan，都在致力于推动AIGC技术的普惠化，够降AIGC的技术门槛和资金门槛，让更多的人更容易的...

AIGC 2023-12-27 人工智能

877阅读

WAVE SUMMIT+ 2023倒计时2天，传文心一言将曝最新进展！

传文心一言将曝最新进展！亮点一：趋势引领，“扛把子”文心一言将曝新进展亮点二：干货十足，硬核低门槛开发秘籍大放送亮点三：蓄势待发，大模型赋能产业正当时亮点四：群星闪耀，AI产业生态星河万里亮点五：应用繁荣，创意市集与AI原生Works...

AIGC 2023-12-27 人工智能

946阅读

什么？NeRF还能提升BEV泛化性能！首个BEV跨域开源代码并首次完成Sim2Real！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人总结鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测，这导致了这些算法过...

AIGC 2023-12-27 人工智能

1051阅读

中兴服务器支持百度“文心一言”，助力AI产业发展

前段时间，中兴和百度正式对外宣布中兴服务器将会支持百度“文心一言”，为其提供更加强劲的算力支撑，从而加速“文心一言”的完事升级与更新迭代，助力AI产业化应用和生态的繁荣发展。 “文心一言”是百度基于文心大模型技术推出的生成式AI产品，直至...

AIGC 2023-12-27 人工智能

762阅读

阿里云赵大川：弹性计算推理解决方案拯救 AIGC 算力危机

云布道师本篇文章围绕弹性计算推理解决方案 DeepGPU 实例如何支持 Stable Diffusion 文生图推理、Stable Diffusion 推理演示示例等相关话题展开。赵大川阿里云弹性计算高级技术专家 GPU 云服务器推理解决方案...

大数据 2023-12-26 人工智能

900阅读

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务...

人工智能 2023-12-26 人工智能

837阅读

进行Stable Diffusion的ai训练怎么选择显卡？

Stable Diffusion主要用于从文本生成图像，是人工智能技术在内容创作行业中不断发展的应用。要在本地计算机上运行Stable Diffusion，您需要一个强大的 GPU 来满足其繁重的要求。强大的 GPU 可以让您更快地生成图像，而具有大量 V...

大数据 2023-12-25 人工智能

1062阅读

测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

测试时领域适应（Test-Time Adaptation）的目的是使源域模型适应推理阶段的测试数据，在适应未知的图像损坏领域取得了出色的效果。然而，当前许多方法都缺乏对真实世界场景中测试数据流的考虑，例如：测试数据流应当是时变分布（而非传统领域适应中...

AIGC 2023-12-24 人工智能

875阅读

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

像Pika一样的神级创业故事又要再次上演了？两位哈佛退学的年轻人，想要制造一款专用于大语言模型加速的AI加速器芯片，将于2024年第三季度交付，推理性能达H100的10倍。在今年6月份，两位创始人Gavin Uberti和Chris Zhu创立了E...

大数据 2023-12-19 人工智能

806阅读

LLaMA-META发布单卡就能跑的大模型

2023年2月25日，Meta使用2048张A100 GPU，花费21天训练的Transformer大模型LLaMA开源了。 1.4T tokenstakes approximately 21 days 以下是觉得论文中重要的一些要点 1）...

大数据 2023-12-17 人工智能

877阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

860阅读

AIGC 场景下存储与数据管理的挑战与应对

10月28日，"寻宝 AI 时代——OSC 源创会苏州站暨 Techo TVP 技术沙龙"在苏州圆满落幕。腾讯云存储专家解决方案架构师屠伟新带来《AIGC 场景下存储与数据管理的挑战与应对》主题分享。下面我们一起来学习回顾一下AIGC场景下的存储解决方案。...

大数据 2023-12-16 人工智能

915阅读

前端食堂技术周刊第 89 期：ES 2023、MDN Playground、TS 5.2 Beta、逆向分析 GitHub Copilot

美味值：????? 口味：糯米糍荔枝食堂技术周刊仓库地址：https://github.com/Geekhyt/weekly 大家好，我是童欧巴。欢迎来到前端食堂技术周刊，我们先来看下上周的技术资讯。技术资讯 Ecma Internati...

AIGC 2023-12-13 人工智能

895阅读

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

大模型现在真的是越来越卷了！ 11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了，赶在年底之前仓促发布了超大模型Gemini，卷起了多模态，甚至不惜「视频造假」。就在今天，微软正式发布了曾在11...

生成式AI 2023-12-13 人工智能

855阅读

夸张！EMNLP投稿近5000篇，奖项出炉：北大、腾讯摘最佳长论文

EMNLP 是自然语言处理领域的顶级会议之一，EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念，EMNLP 2023 的投稿论文数量也达到近 5000 篇，甚至略高于 AC...

生成式AI 2023-12-11 人工智能

922阅读

戴尔技术推动AI与生成式AI策略，存储技术加速前行

戴尔技术近日宣布，通过引入新的企业数据存储技术，与Nvidia DGX SuperPod AI基础设施进行验证，助力客户实现更快的AI和生成式AI性能。戴尔 Technologies基础设施解决方案集团总裁Arthur Lewis表示:“存储性能对于成功的...

大数据 2023-12-11 人工智能

865阅读

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

文章目录一、背景二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...

AIGC 2023-12-09 人工智能

2080阅读

AI 在智能制造：推动创新与效率的提升

随着AI科技的不断创新发展，人工智能（AI）在许多领域都取得了显著的进步，其中之一就是智能制造。智能制造是指通过集成信息技术和制造技术，以提高生产效率、降低成本、提高产品质量的一种新型制造方式。AI在智能制造中的应用，正在不断推动着智能制造的发展，为制造...

AIGC 2023-12-08 人工智能

821阅读