注意力机制第6页

全网最全AI绘画Stable Diffusion关键技术解析

背景很多人觉得AI绘画不稳定，对于以后是否替代插画师，摄影工作者，设计师，表示存疑，作为AI从业者本文从AI绘画关键技术分析，明白以前生产者肯定会被淘汰，现在没有到达黄金期。技术一定会让更多人失业，而我们拥抱变化，增强自身。 AI绘画中Stab...

生成式AI 2024-01-20 人工智能

998阅读

AIGC原理：扩散模型diffusion综述一：面向视觉计算的扩散模型研究进展

论文地址：State of the Art on Diffusion Models for Visual Computing ? 贴一幅SGM（Score-based Generative Model）的原因是宋飏博士将他2019年提出的SMLD模型和20...

AIGC 2024-01-20 人工智能

1945阅读

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、生成文字，输入文字、生成图像等。 GPT-3是生成型的预训练变换模型，是...

大数据 2024-01-20 人工智能

916阅读

视觉Mamba来了：速度提升2.8倍，内存能省87%

号称「全面包围 Transformer」的 Mamba，推出不到两个月就有了高性能的视觉版。本周四，来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba（Vim）。论文地址：https://arxiv.or...

AIGC 2024-01-19 人工智能

837阅读

ICLR'24无图新思路！LaneSegNet：基于车道分段感知的地图学习

写在前面&笔者的个人理解地图作为自动驾驶系统下游应用的关键信息，通常以车道或中心线表示。然而，现有的地图学习文献主要集中在检测基于几何的车道或感知中心线的拓扑关系。这两种方法都忽略了车道线与中心线的内在关系，即车道线绑定中心线。虽然在一个模型中...

人工智能 2024-01-19 人工智能

1151阅读

WidthFormer：实时自动驾驶！助力基于Transformer的BEV方案量产

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&行业理解基于BEV的transformer方案今年量产的主要方案，transformer结构和CNN相比，特征提取能力更强，但需要较多的算力，这也是为什么许多车上都是1~2颗orin...

人工智能 2024-01-19 人工智能

1211阅读

常见大模型对比[ChatGPT（智能聊天机器人）、Newbing(必应)、Bard（巴德）、讯飞星火认知大模型（SparkDesk）、ChatGLM-6B]

目录 1 引言 2 选取常见的大模型作为对比项 2.1什么是大模型 2.2 常见大模型 3 相关的大模型介绍和功能 3.1 ChatGPT 3.1.1 ChatGPT的介绍 3.1.2 ChatGPT的原理 3.1.3 ChatGPT的特...

人工智能 2024-01-19 人工智能

1334阅读

免费商用 Meta 发布开源大语言模型 Llama 2

Meta 和微软深度合作，正式推出下一代开源大语言模型 Llama 2，并宣布免费提供给研究和商业使用。 Llama 2 论文地址：Llama 2: Open Foundation and Fine-Tuned Chat Models 据介...

大数据 2024-01-19 人工智能

1059阅读

AIGC学习笔记（1）——AI大模型提示词工程师

文章目录 AI大模型提示词工程师 1 Prompt工程之原理 1.1 AIGC的发展和产业前景前言 AIGC时代的到来发展趋势和应用展望 1.2 大模型的类型和特点大模型的对比上手特点 1.3 大模型技术原理和发展成语...

生成式AI 2024-01-18 人工智能

1779阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1481阅读

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

大语言模型序列长度的限制，极大地制约了其在人工智能领域的应用，比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...

人工智能 2024-01-18 人工智能

957阅读

DiffIR: Efficient Diffusion Model for Image Restoration 利用扩散模型进行图像重建

一、主要贡献 •我们提出了DiffIR，一种强大、简单、高效的基于扩散模型的的图像修复方法。与图像生成不同的是，输入图像的大部分像素都是给定的。因此，我们利用DM强大的映射能力来估计一个紧凑的IPR（IR Prior Representation，图像修...

人工智能 2024-01-18 人工智能

1022阅读

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1235阅读

【AIGC】Controlnet:基于扩散模型的文生图的可控性

前言 controlnet可以让stable diffusion的生图变得可控。文章连接：https://arxiv.org/pdf/2302.05543.pdf 摘要冻结了stable diffusion的预训练模型并重用它的预训练...

AIGC 2024-01-17 人工智能

1316阅读

【AIGC】IP-Adapter：文本兼容图像提示适配器，用于文本到图像扩散模型

前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示，让其生成参考该图像画风，可以免去Lora的训练，达到参考画风人物的生成效果。摘要通过文本提示词生成的图像，往往需要设置复杂的提示...

生成式AI 2024-01-17 人工智能

1584阅读

【生成模型】Stable Diffusion原理+代码

文章目录前言一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE：三、Diffusion扩散模型 1.前向过程 2.逆向过程四、多模态 cross attention 五...

生成式AI 2024-01-16 人工智能

1586阅读

互联网新时代要来了（二）什么是AIGC？

什么是AIGC？最近，又火了一个词“**AIGC”**2022年被称为是AIGC元年。那么我们敬请期待，AIGC为我们迎接人工智能的下一个时代。 TIPS:内容来自百度百科、知乎、腾讯、《AIGC白皮书》等网页什么是AIGC？ 1...

生成式AI 2024-01-16 人工智能

929阅读

元象开源大模型XVERSE-Long-256K 支持输入25万汉字

元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。该模型填补了开源生态空白，与元象之前的大模型组成了高性能全家桶。XVERSE-Long-256K 在评测中表现出色，超越了其他...

大数据 2024-01-16 人工智能

1045阅读

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

923阅读

AI：你总要高清视频，它来了

Magnific 图像超分 & 增强工具还正在火热体验中，它强大的图像升频与再创能力收获一致好评。现在，视频领域也有了自己的 Magnific。拍摄的街道视频一片模糊，仿佛高度近视没戴眼镜一样：与之相比，下面的视频清晰度高了很多：视频画...

生成式AI 2024-01-15 人工智能

811阅读

RoboFusion：通过SAM实现稳健的多模态3D检测

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2401.03907.pdf 多模态3D检测器致力于探索安全可靠的自动驾驶感知系统。然而，尽管在干净的基准数据集上实现了最先进的（SOTA）性能，...

大数据 2024-01-15 人工智能

947阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1183阅读

如何高效部署大模型？CMU最新万字综述纵览LLM推理MLSys优化技术

在人工智能（AI）的快速发展背景下，大语言模型（LLMs）凭借其在语言相关任务上的杰出表现，已成为 AI 领域的重要推动力。然而，随着这些模型在各种应用中的普及，它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强...

人工智能 2024-01-15 人工智能

1075阅读

即插即用，完美兼容：SD社区的图生视频插件I2V-Adapter来了

图像到视频生成（I2V）任务旨在将静态图像转化为动态视频，这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息，同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...

生成式AI 2024-01-15 人工智能

881阅读

【计算机视觉 | 目标检测】术语理解9：AIGC的理解，对比学习，解码器，Mask解码器，耦合蒸馏，半耦合，图像编码器和组合解码器的耦合优化

文章目录一、AIGC的理解二、对比学习三、解码器四、Mask解码器五、耦合蒸馏六、半耦合七、图像编码器和组合解码器的耦合优化一、AIGC的理解 AIGC指的是使用人工智能技术自动生成的各类数字内容,包括文本、图像、...

AIGC 2024-01-14 人工智能

905阅读

大模型相关技术综述

多模态大模型&大模型训练语料持续迭代已经开始整理多模态-视觉部分：主要分为一下几块多模态信息压缩模型（clip、vit、swiT）生成模型（vae、gan、flow、ddpm、sde... 其它多模态大模型（语音...

AIGC 2024-01-14 人工智能

1140阅读

打破信息差！一款让人惊艳的大模型3D可视化工具！

近日，一位来自新西兰的小哥Brendan Bycroft在技术圈掀起了一股热潮。他创作的一项名为大模型3D可视化的项目，不仅登上了Hacker News的榜首，而且其震撼的效果更是让人瞠目结舌。通过这个项目，你将在短短几秒钟内完全理解LLM（Large...

人工智能 2024-01-14 人工智能

939阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

991阅读

简单易懂Stable Diffusion运行原理都直接喂到你嘴里了还不快点接着

**Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 保姆级教程资料包（文末可获取）一背景介绍 AI 绘画作为 AIGC（人工智能创作内容）的一个应用方向，它绝对是 2022 年以...

AIGC 2024-01-09 人工智能

1316阅读

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，Sw...

生成式AI 2024-01-08 人工智能

866阅读

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍! 而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型（LargeLM）就能摇身一变，成为LongLM。近日，来自得克萨斯农...

人工智能 2024-01-08 人工智能

808阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

1036阅读

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下，实现多轮对话共400万个token，22.2倍推理速度提升。该项...

大数据 2024-01-08 人工智能

945阅读

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共400万个token的流式输入，22.2倍的推理速度提升...

人工智能 2024-01-08 人工智能

1134阅读

AI解读视频张口就来？这种「幻觉」难题Vista-LLaMA给解决了

近年来，大型语言模型如 GPT、GLM 和 LLaMA 等在自然语言处理领域取得了显著进展，基于深度学习技术能够理解和生成复杂的文本内容。然而，将这些能力扩展到视频内容理解领域则是一个全新的挑战 —— 视频不仅包含丰富多变的视觉信息，还涉及时间序列的动态...

AIGC 2024-01-08 人工智能

972阅读

告别逐一标注，一个提示实现批量图片分割，高效又准确

Segment Anything Model (SAM 的提出在图像分割领域引起了巨大的关注，其卓越的泛化性能引发了广泛的兴趣。然而，尽管如此，SAM 仍然面临一个无法回避的问题：为了使 SAM 能够准确地分割出目标物体的位置，每张图片都需要手动提供一...

生成式AI 2024-01-08 人工智能

883阅读

AI人工智能大模型讲师叶梓《基于人工智能的内容生成（AIGC）理论与实践》培训提纲

【课程简介】本课程介绍了chatGPT相关模型的具体案例实践，通过实操更好的掌握chatGPT的概念与应用场景，可以作为chatGPT领域学习者的入门到进阶级课程。【课程时长】 1天（6小时/天）【课程对象】理工科本...

生成式AI 2024-01-08 人工智能

844阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

859阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1129阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

964阅读

谷歌家务机器人单挑斯坦福炒虾机器人！端茶倒水逗猫，连甩三连弹开打

火爆全网的斯坦福炒虾机器人，一天之内人气暴涨。毕竟这样能炒菜能洗碗的全能机器人，谁不想带一个回家，把自己从家务中解放出来呢！据说，这个项目是斯坦福华人团队花了三个月的时间做出来的。今天，团队直接放出了更多细节。这个机器人的技能多种多样，令人眼...

人工智能 2024-01-05 人工智能

859阅读

图解tinyBERT模型——BERT模型压缩精华

译者 | 朱先忠审校 | 重楼简介近年来，大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一，可以高精度地解决各种自然语言处理（NLP）任务。继BERT模型之后，一组其他的模型也先后出现并各自展示出优秀的性能。不难看到一个明显趋势...

AIGC 2024-01-05 人工智能

1053阅读

微软官方 Copilot AI 编程训练营第一天精华总结

阿七参加的微软官方组织的 Copilot AI 编程训练营开始了，这是第一天。 GitHub Copilot 官方统计，使用 GitHub Copilot 的开发者基本上能极大的提升编码效率、减少重复性代码编码时间且能更加专注于主线任务。不管这个...

AIGC 2024-01-03 人工智能

909阅读

Hyena成下一代Transformer？StripedHyena-7B开源：最高128k输入，训练速度提升50%

最近几年发布的AI模型，如语言、视觉、音频、生物等各种领域的大模型都离不开Transformer架构，但其核心模块「注意力机制」的计算复杂度与「输入序列长度」呈二次方增长趋势，这一特性严重限制了Transformer在长序列下的应用，例如无法一次性处理一...

人工智能 2024-01-02 人工智能

1101阅读

微软推出AI助手Copilot的正式版本；ChatGPT：七位研究人员分享他们的观点

? AI新闻 ? 微软推出AI助手Copilot的正式版本摘要：微软宣布其AI助手Copilot正式上线，此前Copilot的预览版已成为很多用户的日常AI伴侣。此次上线后，Copilot将继续提供AI驱动的网络聊天体验，并具备商业数据保护功能，...

大数据 2024-01-02 人工智能

921阅读

一文通透位置编码：从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long

前言关于位置编码和RoPE 应用广泛，是很多大模型使用的一种位置编码方式，包括且不限于LLaMA、baichuan、ChatGLM等等我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的，一篇是关于transformer从零实现...

人工智能 2024-01-01 人工智能

1126阅读

LLaMA, ChatGLM, BLOOM的参数高效微调实践

作者：回旋托马斯x（腾讯NLP算法工程师）项目地址：https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表...

人工智能 2024-01-01 人工智能

1305阅读

stable diffusion中的u net

Stable Diffusion 包含几个核心的组件：一个文本编码器（在 Stable Diffusion 中使用 CLIP 的 ViT-L/14 的文本编码器），用于将用户输入的 Prompt 文本转化成 text embedding；一个 Im...

大数据 2023-12-29 人工智能

1194阅读

深度学习实战29-AIGC项目：利用GPT-2(CPU环境)进行文本续写与生成歌词任务

大家好，我是微学AI，今天给大家介绍一下深度学习实战29-AIGC项目：利用GPT-2(CPU环境进行文本续写与生成歌词任务。在大家没有GPU算力的情况，大模型可能玩不动，推理速度慢，那么我们怎么才能跑去生成式的模型呢，我们可以试一下GPT-2完成一些简...

AIGC 2023-12-29 人工智能

1008阅读

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模...

人工智能 2023-12-29 人工智能

1075阅读