预训练第19页 - AIGC资讯

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈，例如对话式AI系统往往无法记忆你前一天对话的内容，利用大模型构建智能体会产生前后不一致的行为与记忆。为了让大模型能够记忆并处理更长的上下文，来自清华大学、麻省理工学院和人民大学的研...

生成式AI 2024-03-11 人工智能

819阅读

DALL·E 2 文生图模型实践指南

前言：本篇博客记录使用dalle2模型进行推断时借鉴的相关资料和DEBUG流程。相关博客：超详细！DALL · E 文生图模型实践指南目录 1. 环境搭建和预训练模型准备环境搭建预训练模型下载 2. 代码 3. B...

人工智能 2024-03-11 人工智能

842阅读

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。然而，在处理涉及重...

AIGC 2024-03-11 人工智能

745阅读

理解世界，最新综述开启自动驾驶新时代~

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在快速发展的自动驾驶领域，准确预测未来事件并评估其影响的能力对安全性和效率至关重要，对决策过程至关重要。世界模型已经成为一种变革性的方法，使自动驾驶系统能够合成和解释大...

生成式AI 2024-03-11 人工智能

829阅读

关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答

文章目录关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答先总结一下 Q：LLM模型预训练前与提示词关系，LLM模型预训练后与提示词关系 Q：预训练用的数据集与提示词有什么异同 Q：为什么我看到的数据集结构和提示词结...

人工智能 2024-03-11 人工智能

884阅读

stable diffusion 原理是什么？

“ 这篇文章主要介绍了Stable Diffusion，这是一种用于AI绘画的算法，它是由CompVis和Runway团队在2021年12月提出的“潜在扩散模型”（LDM/Latent Diffusion Model）的变体，基于201...

大数据 2024-03-11 人工智能

955阅读

【AIGC调研系列】inflection-2.5与其他模型相比的优势和劣势

Inflection -2.5作为一款升级的内部模型，其与其他模型相比的优势主要体现在以下几个方面：性能提升：Inflection -2.5被认为是世界上最好的语言模型之一，其性能可与GPT-4、Gemini等世界领先的大型语言模型相媲美[1]。这...

生成式AI 2024-03-11 人工智能

785阅读

我们一起聊聊大模型的模型融合方法

模型融合大家以前用的很多，特别是在判别模型里，属于永远都能稳定提升的那一类方法。但是生成语言模型，因为解码的过程存在，并不像判别模型那样直观。另外，由于大模型的参数量增大，在参数规模更大的场景，简单的集成学习可以考量的方法相比低参数的机器学习更受限制，...

人工智能 2024-03-11 人工智能

879阅读

关于AI智能生成（AIGC），整理一下你该知道这些

什么是AIGC 生成式人工智能（Artificial Intelligence Generated Content）定义百度百科生成式人工智能AIGC（Artificial Intelligence Generated Content）...

大数据 2024-03-10 人工智能

943阅读

AIGC启示录：深度解析AIGC技术的现代性与系统性的奇幻旅程

✨✨ 欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨ ?? 欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。? 希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。?...

大数据 2024-03-10 人工智能

693阅读

“羊驼“入侵CV，美团&浙大沈春华团队将LLaMA向CV扩展，构建全新基础模型VisionLLaMA

本文首发:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述大型语言模型构建在基于Transf...

AIGC 2024-03-10 人工智能

709阅读

近屿智能完成A轮融资，打造行业领先的AIGC工程师与产品经理成长蓝图

2024年1月，上海近屿智能科技有限公司（简称近屿智能）成功完成了A轮融资，智望资本担任了领投角色，而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。自创立伊始，近屿智能始...

大数据 2024-03-09 人工智能

965阅读

印度宣布向 AI 领域投资 1037 亿卢比，强化对大语言模型的开发

3 月 8 日消息，印度政府宣布已批准国家级“ IndiaAI 使命”项目，旨在实现“让 AI 在印度扎根”和“让 AI 为印度服务”两大目标，预算达 1037.192 亿卢比（当前约 90.13 亿元人民币）。据介绍，该项目将由数字印度公司（DI...

人工智能 2024-03-08 人工智能

839阅读

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

上个月，Meta FAIR 田渊栋参与的一项研究广受好评，他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...

AIGC 2024-03-08 人工智能

750阅读

Stable Diffusion 3技术报告出炉：揭露Sora同款架构细节

很快啊，“文生图新王”Stable Diffusion 3的技术报告，这就来了。全文一共28页，诚意满满。 “老规矩”，宣传海报（⬇️）直接用模型生成，再秀一把文字渲染能力：所以，SD3这比DALL·E 3和Midjourney v6都要强的文字...

大数据 2024-03-08 人工智能

802阅读

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。沿袭 ViT 的研究思路，我们能否借助创新性的 LLaMA 架构，真正实现语言和图像的架构统一？在这一命题上，最近的一项研究 Visi...

生成式AI 2024-03-07 人工智能

689阅读

研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习

加利福尼亚大学圣地亚哥分校（UCSD）和南加利福尼亚大学(USC 的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架，旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务，特别是对...

AIGC 2024-03-07 人工智能

784阅读

【AIGC】Gemma和ChatGLM3-6B使用体验

近期，谷歌发布了全新的开源模型Gemma，同时智谱AI和清华大学KEG实验室合作推出了ChatGLM3-6B。这两个模型都是先进的对话预训练模型，本文将对它们进行对比，并分享使用体验。先上效果 ChatGLM3-6B: ChatG...

人工智能 2024-03-07 人工智能

1053阅读

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

作者：汪诚愚（熊兮）、高一鸿（子洪）、黄俊（临在） Qwen1.5（通义千问1.5）是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版，该模型推出了多个规模，从0.5B到72B，满足不同的计算需求。此外，该系列模型还包括了Base...

大数据 2024-03-07 人工智能

744阅读

一文看尽297篇文献！中科院领衔发表首篇「基于扩散模型的图像编辑」综述

本文全面研究图像编辑前沿方法，并根据技术路线精炼地划分为3个大类、14个子类，通过表格列明每个方法的类型、条件、可执行任务等信息。此外，本文提出了一个全新benchmark以及LMM Score指标来对代表性方法进行实验评估，为研究者提供了便捷的学习参...

AIGC 2024-03-07 人工智能

677阅读

中科院等万字详解：最前沿图像扩散模型综述

针对图像编辑中的扩散模型，中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。全文长达26页，共1.5万余词，涵盖297篇文献，全面研究了图像编辑的各种前沿方法。同时，作者还提出了全新的benchmark，为研究者提供了便捷的学习参考工具。...

生成式AI 2024-03-07 人工智能

668阅读

近屿智能完成A轮融资，独家打造的AIGC工程师与产品经理学习路径图成行业焦点

2024年1月，上海近屿智能科技有限公司（以下简称近屿智能）宣布成功完成A轮融资，由智望资本领投，金沙江创投追加投资。这一重大融资事件不仅象征着近屿智能在AIGC领域的领先地位得到了市场的广泛认可，更凸显了投资人对近屿智能技术实力与未来发展潜力的坚定信心。...

大数据 2024-03-07 人工智能

707阅读

AIGC 实战：如何使用 Ollama 开发自定义的大模型（LLM）

虽然 Ollama 提供了运行和交互式使用大型语言模型（LLM）的功能，但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而，Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明：预训练模型选择： Oll...

AIGC 2024-03-06 人工智能

2216阅读

谷歌掀桌子！开源Gemma：可商用，性能超过Llama 2！

2月22日，谷歌在官网宣布，开源大语言模型Gemma。 Gemma与谷歌最新发布的Gemini 使用了同一架构，有20亿、70亿两种参数，每种参数都有预训练和指令调优两个版本。根据谷歌公布的测试显示，在MMLU、BBH、GSM8K等主流测试平台中，其...

大数据 2024-03-06 人工智能

661阅读

央视财经推出两会AI主播，蚂蚁灵境数字人平台技术支持

还记得杭州亚运会开幕式点燃主火炬环节，让世界惊艳的“数字火炬手”吗?如今，用“同款”技术打造的AI主播在央视财经亮相了! （央视财经客户端上线两会AI主播）今年两会，央视财经新媒体以总台央视主持人郭若天、孟湛东为原型“复刻”了AI主播——小天、小东。两...

生成式AI 2024-03-05 人工智能

904阅读

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键

Sora 的发布让整个 AI 领域为之狂欢，但 LeCun 是个例外。面对 OpenAI 源源不断放出的 Sora 生成视频，LeCun 热衷于寻找其中的失误：归根结底，LeCun 针对的不是 Sora，而是 OpenAI 从 ChatGPT 到...

人工智能 2024-03-05 人工智能

737阅读

DUSt3R官网体验入口 3D重建工具AI应用免费使用下载地址

DUSt3R是一种新颖的密集和无约束立体3D重建方法，适用于任意图像集合。它不需要事先了解相机校准或视点姿态信息，通过将成对重建问题视为点图的回归，放宽了传统投影相机模型的严格约束。DUSt3R提供了一种统一的单目和双目重建方法，并在多图像情况下提出了一种...

生成式AI 2024-03-05 人工智能

826阅读

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘要等任务。每个人想要的大模型，是真·智能的那种...... 这不，谷歌团队就做出来了一个强大的「读屏」AI。研究人员...

生成式AI 2024-03-05 人工智能

738阅读

解剖Sora：37页论文逆向工程推测技术细节，微软参与，华人团队出品

Sora刚发布不久，就被逆向工程“解剖”了？！来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述，足足有37页。他们基于Sora公开技术报告和逆向工程，对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析...

AIGC 2024-03-05 人工智能

706阅读

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

没人怀疑，OpenAI开年推出的史诗巨作Sora，将改变视频相关领域的内容生态。但Google DeepMind、UC伯克利和MIT的研究人员更进一步，在他们眼里，「大视频模型」也许能够像世界模型一样，真正的做到理解我们身处的这个世界。论文地址：h...

生成式AI 2024-03-05 人工智能

751阅读

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

这一次，谷歌 DeepMind 在基础模型方面又有了新动作。我们知道，循环神经网络（RNN）在深度学习和自然语言处理研究的早期发挥了核心作用，并在许多应用中取得了实功，包括谷歌第一个端到端机器翻译系统。不过近年来，深度学习和 NLP 都以 Transf...

生成式AI 2024-03-05 人工智能

781阅读

两张图2秒钟3D重建！这款AI工具火爆GitHub，网友：忘掉Sora

只需2张图片，无需测量任何额外数据—— 当当，一个完整的3D小熊就有了：这个名为DUSt3R的新工具，火得一塌糊涂，才上线没多久就登上GitHub热榜第二。有网友实测，拍两张照片，真的就重建出了他家的厨房，整个过程耗时不到2秒钟！（除了3D图，...

人工智能 2024-03-04 人工智能

755阅读

Beeble AI与纽约大学合作发布创新的人像重照明技术SwitchLight

近日，Beeble AI与纽约大学联手发布了一项新的研究成果，一种创新的人像重照明技术。这项技术能够在非常低的成本下，将人物与虚拟环境的光照完美融合，效果令人印象深刻。论文地址：https://arxiv.org/pdf/2402.18848.pdf...

大数据 2024-03-04 人工智能

725阅读

华为云盘古大模型通过金融大模型标准符合性验证

据华为官方消息，2023年12月，在中国信通院组织的可信AI大模型标准符合性验证中，华为云盘古大模型成功完成了金融大模型的验证，并获得了优秀级（4+级）评分。这一成绩不仅突显了华为云盘古大模型在金融领域的卓越性能，还使其成为首批通过金融大模型及行业大模型标...

AIGC 2024-03-04 人工智能

725阅读

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

最近，OpenAI 的视频生成模型 Sora 爆火，生成式 AI 模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的，生物体通过不同的渠道感知和交换信息，包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...

AIGC 2024-03-04 人工智能

667阅读

从AI推理性能优化角度看LLaMA的模型结构和源码

本篇文章讲讲LLaMA的结构，已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析，本文主要从优化的角度、实现kernel的角度解析一下LLaMA，读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”，文章...

AIGC 2024-03-04 人工智能

940阅读

只需少量计算和内存资源即可运行的小型 Llama 大模型

背景介绍在当今这个数据爆炸的时代，语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而，这对许多人来说并不现实。与此同时，我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战，特别是在边缘设备上。今...

生成式AI 2024-03-04 人工智能

703阅读

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

自从大模型火爆出圈以后，人们对压缩大模型的愿望从未消减。这是因为，虽然大模型在很多方面表现出优秀的能力，但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」通过把大模型的参数转化为低位宽的表示，进而节省空间占用。目...

大数据 2024-03-04 人工智能

760阅读

清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

近期，清华大学和哈尔滨工业大学联合发布了一篇论文，成功将大模型压缩到1bit，仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去，2bit 以下的量化一直是研究人员难以逾越的障碍，而这次的1bit 量化尝试，引起了国内外学术界的广泛关注。...

大数据 2024-03-04 人工智能

666阅读

如何基于 Arthur Bench 进行 LLM 评估？

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估...

人工智能 2024-03-04 人工智能

786阅读

ControlNet作者又出新作：百万数据训练，AI图像生成迎来图层设计

尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础，但令人惊讶的是，分层内容生成或透明图像（是指图像的某些部分是透明的，允许背景或者其他图层的图像通过这些透明部分显示出来）生成领域获得的关注极少。这与市场的实际需求形成了鲜明对比。大多数视觉内容编辑...

生成式AI 2024-03-04 人工智能

699阅读

模型偏好只与大小有关？上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中，偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中，偏好数据通常被用作对齐（alignment）时的训练优化目标，如基于人类或 AI 反馈的强化学习（RLHF/RLAIF）或者直接偏好优化（DPO），而在模型评估中，由于任务...

大数据 2024-03-04 人工智能

699阅读

AIGC 为何能火爆全网，赋能智能时代？

Hi，大家好，我是半亩花海。2023年，人工智能新浪潮涌起，AIGC 火爆全网，不断赋能各大行业。从短视频平台上火爆的“AI 绘画”，到智能聊天软件 ChatGPT，都引起了大家的广泛关注。那么 AIGC 到底是什么？为什么如此引人关注？AIGC 能产生什...

人工智能 2024-03-04 人工智能

811阅读

大模型的未来：如何推动AIGC技术的进一步发展

1.背景介绍人工智能(AI 和大数据技术的发展已经进入了一个新的高潮，尤其是自然语言处理(NLP 和计算机视觉(CV 等领域的突破性进展。随着大模型(such as GPT-3, DALL-E, and CLIP 的出现，人工智能生成(AIGC...

AIGC 2024-03-03 人工智能

802阅读

前沿资讯！文心一言和ChatGPT最全对比！

文心一言和ChatGPT都是基于深度学习技术的自然语言处理模型，有各自的优势和使用场景，无法简单地比较 ChatGPT 和文心一言哪一个功能更强大，它们各自具有优势和局限性，需要根据具体需求进行选择，以下一些具体对比：为方便观看，...

人工智能 2024-03-03 人工智能

814阅读

Stable diffusion webui部署及简单使用

文章目录前言一、Stable Diffusion WebUI部署 1.Stable diffusion 2.Linux 上的自动安装步骤如下： 1.安装依赖项： 2.切换到想要安装 WebUI 的目录并执行以下命令： 3.运行 webu...

人工智能 2024-03-02 人工智能

1012阅读

ControlNet作者新作：AI绘画能分图层了，项目未开源就斩获660 Star

“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt，用Stable Diffusion可以直接生成单个或多个透明图层（PNG）! 例如来一句: 可以看到，AI不仅生成了符合prompt的完整图像...

生成式AI 2024-03-02 人工智能

777阅读

十分钟读完 Meta提出Llama 2模型的经典论文：Llama 2: Open Foundation and Fine-Tuned Chat Models

超越GPT-3：Meta AI发布新一代开源人工智能对话大模型Llama 2 引言：介绍 Llama 2 的发布背景和其在对话用例中的优化。随着人工智能技术的飞速发展，大型语言模型（LLMs）已经成为了人类智能助手的代表，它们在需要专业知识的复杂推理...

人工智能 2024-03-02 人工智能

942阅读

VPR 2024 满分论文！Meta提出EfficientSAM：快速分割一切！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024！作者在某社交媒体上分享了该结果，如下图所示： LeCun 图灵奖得主也强烈推荐了该工作！在最近的一项研究中，Meta...

生成式AI 2024-03-02 人工智能

750阅读