注意力机制第7页

Midjourney V6 引爆社交媒体，AI图像与照片的差别消失；LangChain的2023AI发展状况总结

? AI新闻 ? Midjourney V6 引爆社交媒体，AI图像与照片的差别消失摘要：Midjourney V6 第二次社区评价震惊网友，神图细节逼真，光影效果逆天，皮肤质感细腻，已超越昨日版本。V6即将上线，预计在圣诞节前发布。其出图质量让...

AIGC 2023-12-28 人工智能

616阅读

超越BEVFusion！Lift-Attend-Splat：最新BEV LV融合方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文：Lift-Attend-Splat: Bird’s-eye-view camera-lidar fusion using transformers 链接：https://arxiv.org/pd...

AIGC 2023-12-27 人工智能

575阅读

LLaMa、Qwen、ChatGLM、ChatGLM2的区别

LLaMa、Qwen、ChatGLM、ChatGLM2的区别以下比较的前提是首先和BERT(transfomer 的对比感谢帮忙给我github repository的star，更多最新模型长期更新：https://github.com/zysN...

人工智能 2023-12-27 人工智能

1309阅读

Python+AI实现AI绘画

? 运行环境：Python ? 撰写作者：左手の明天 ? 精选专栏：《python》 ? 推荐专栏：《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???，我是左手の明天！好久不见? ?今天分享py...

人工智能 2023-12-25 人工智能

655阅读

挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

在大模型领域，Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显，比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷，研究者们开发出了很多...

生成式AI 2023-12-25 人工智能

823阅读

Point Transformer V3：更简单、更快、更强!

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Point Transformer V3: Simpler, Faster, Stronger 论文链接：https://arxiv.org/pdf/2312.10035.pdf 代码链接：h...

生成式AI 2023-12-25 人工智能

706阅读

使用 PyTorch FSDP 微调 Llama 2 70B

引言通过本文，你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中，我们主要会用到 Hugging Face Transformers、Accelerate 和 TRL 库。我们还将展示如何在 SL...

大数据 2023-12-21 人工智能

590阅读

MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT

MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...

生成式AI 2023-12-20 人工智能

557阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1228阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

686阅读

Stable Diffusion Webui源码剖析

1、关键python依赖（1）xformers：优化加速方案。它可以对模型进行适当的优化来加速图片生成并降低显存占用。缺点是输出图像不稳定，有可能比不开Xformers略差。（2）GFPGAN：它是腾讯开源的人脸修复算法，利用预先训练号的面部GAN...

大数据 2023-12-17 人工智能

1021阅读

W.A.L.T官网体验入口 AI视频图像生成软件app免费下载地址

《W.A.L.T》是一个基于transformer的实景视频生成方法，它通过联合压缩图像和视频到一个统一的潜在空间，实现跨模态的训练和生成。使用了窗注意力机制来提高内存和训练效率，该方法在多个视频和图像生成基准测试上取得了最先进的性能。《W.A.L.T》在...

大数据 2023-12-12 人工智能

577阅读

2024年AI趋势看这张图，LeCun：开源大模型要超越闭源

2023 年即将过去。一年以来，各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时，另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀？是否能够媲美专有模型的性能？迄今为止，我们一直还只能说...

生成式AI 2023-12-12 人工智能

513阅读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca Introduction Chinese LLaMA Chinese Alpaca Lora-Fin...

大数据 2023-12-12 人工智能

550阅读

使用Midjourney与ChatGPT组合会怎么样？

Midjourney 和 ChatGPT 都是目前比较先进的自然语言处理技术，Midjourney是一种基于深度学习的文本生成模型，而ChatGPT是一种基于自注意力机制的大规模预训练语言模型。使用Midjourney+ChatGPT可以结合两种技术的...

AIGC 2023-12-10 人工智能

510阅读

【原创】AIGC之ChatGPT工作原理

AIGC是什么 AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content...

人工智能 2023-12-10 人工智能

594阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

837阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

623阅读

GTA6预告片播放过亿，AI三巨头也能秒变GTA匪帮

GTA 新出的游戏预告片看了吗？据说，这个预告片已经破了三项吉尼斯世界纪录，观看次数已经破亿。但如果告诉你，AI 三巨头也可以成为 GTA 里的人物，你还能认出他们吗？ AI 三巨头：Yann LeCun、Geoffrey Hinton 和 Yos...

生成式AI 2023-12-08 人工智能

679阅读

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型...

人工智能 2023-12-08 人工智能

633阅读

AIGC产业研究报告 2023——图像生成篇

易观：今年以来，随着人工智能技术不断实现突破迭代，生成式AI的话题多次成为热门，而人工智能内容生成（AIGC）的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势，易观对AIGC产业进行了探索并将发布AIG...

AIGC 2023-12-06 人工智能

591阅读

颠覆Transformer霸权！CMU普林斯顿推Mamba新架构，解决致命bug推理速度暴增5倍

深度学习进入新纪元，Transformer的霸主地位，要被掀翻了？ 2017年6月12日横空出世，让NLP直接变天，制霸自然语言领域多年的Transformer，终于要被新的架构打破垄断了。 Transformer虽强大，却有一个致命的bug：核心注意力...

AIGC 2023-12-05 人工智能

928阅读

Transformer挑战者出现！斯坦福CMU联合团队，开源模型及代码，公司已创办

现在ChatGPT等大模型一大痛点：处理长文本算力消耗巨大，背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构，成为有力挑战者，引起大量关注： Mamba（曼巴，一种蛇），在语...

生成式AI 2023-12-05 人工智能

551阅读

中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用

“ Meta 开源 LLAMA2 后，国内出现了不少以此为基座模型训练的中文模型，这次我们来看看其中一个不错的中文模型：Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中，比较有名的是Meta的LLAM...

AIGC 2023-12-05 人工智能

943阅读

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

「矩阵模拟」的世界或许真的存在。模拟人类神经元，不断进化的Transformer模型，一直以来都深不可测。许多科学家都试着打开这个黑盒，看看究竟是如何工作的。而现在，大模型的矩阵世界，真的被打开了！一位软件工程师Brendan Bycroft制作了...

AIGC 2023-12-04 人工智能

647阅读

DetZero：Waymo 3D检测榜单第一，媲美人工标注！

本文经自动驾驶之心公众号授权转载，转载请联系出处。本文提出了一套离线3D物体检测算法框架DetZero，通过在 Waymo 公开数据集上进行全面的研究和评估，DetZero可生成连续且完整的物体轨迹序列，并充分利用长时序点云特征显着提升感知结果的质...

大数据 2023-12-04 人工智能

603阅读

WPS AI最全申请与使用手册；AIGC制作游戏音乐；便宜快捷使用完整版SD；人人都能看懂的ChatGPT原理课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 面向虚拟世界的生成式AI市场全景图作者在这篇文章中探讨了生成式AI在虚拟世界的应用，并绘制了 Market Map V3.0 (市场全景图，来...

AIGC 2023-12-04 人工智能

667阅读

AIGC时代，大模型微调如何发挥最大作用？

人工智能的快速发展推动了大模型的广泛应用，它们在语言、视觉、语音等领域的应用效果已经越来越好。但是，训练一个大模型需要巨大的计算资源和时间，为了减少这种资源的浪费，微调已经成为一种流行的技术。微调是指在预训练模型的基础上，通过在小数据集上的训练来适应新的任...

人工智能 2023-12-03 人工智能

756阅读

文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研

基于近年来图像处理和语言理解方面的技术突破，融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。文本生成图像（text-to-image）是图像和文本处理的多模态任务的一项子任务，其根据给定文本生成符合描述的真实图像，具有巨大的应用潜力，如...

大数据 2023-12-02 人工智能

955阅读

为什么多数情况下GPT-3.5比LLaMA 2更便宜？

本文旨在为用户选择合适的开源或闭源语言模型提供指导，以便在不同任务需求下获得更高的性价比。通过测试比较 LLaMA-2 和 GPT-3.5 的成本和时延，本文作者分别计算了二者的 1000 词元成本，证明在大多数情况下，选择 GPT...

生成式AI 2023-12-02 人工智能

579阅读

Window下部署使用Stable Diffusion AI开源项目绘图

Window下部署使用Stable Diffusion AI开源项目绘图前言前提条件相关介绍 Stable Diffusion AI绘图下载项目环境要求环境下载运行项目打开网址，即可体验文字生成图像（txt2img）庐山瀑...

生成式AI 2023-12-01 人工智能

617阅读

聊一聊大模型 | 京东云技术团队

事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT，一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界，各大巨头也纷纷跟进发布了自家的大模...

生成式AI 2023-11-30 人工智能

556阅读

Llama 2 来袭 - 在 Hugging Face 上玩转它

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！引言今天，Meta 发布了 Llama 2，其包含了一系列最先进的开放大语言模型，我们很高兴能够将其全面集成入 Hugging Face，并全力支持其发布。Llama 2...

生成式AI 2023-11-29 人工智能

575阅读

paperclub今日分享：一键体验Stable Diffusion 和清晰度修复

收藏推荐：SD和清晰度修复，有趣好玩今天分享一下SD和清晰度修复，并在文末附带源代码。 1. Stable Diffusion Stable Diffusion简称SD，是一个文本到图像的潜在扩散模型，说到SD就得提下Diffusion，简单来讲主...

大数据 2023-11-28 人工智能

658阅读

Meta提出全新注意力机制S2A 大模型准确率提升至80.3%

在2023科技领域，大语言模型（LLM）的应用日益广泛，但其在回答问题时存在的问题引起了关注。Meta团队提出的新注意力机制S2A通过解决LLM容易受到上下文虚假相关性的问题，显著提升了模型的准确性和客观性。这一机制的提出得到了深度学习领域的重要人物LeC...

大数据 2023-11-28 人工智能

563阅读

一个提示，让Llama 2准确率飙至80.3%？Meta提出全新注意力机制S2A，大幅降低模型幻觉

2023的科技界，可以说是被大模型抢尽了风头（虚假的室温超导除外）。我们经历了和LLM对话，见证了它们逐渐进入各个领域，甚至开始感受到威胁。这一切，仅仅发生在一年之内。当然了，基于大语言模型的原理，它诞生之时就有的一些毛病到现在也没有完全改正。比...

大数据 2023-11-28 人工智能

688阅读

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

关于大模型注意力机制，Meta又有了一项新研究。通过调整模型注意力，屏蔽无关信息的干扰，新的机制让大模型准确率进一步提升。而且这种机制不需要微调或训练，只靠Prompt就能让大模型的准确率上升27%。作者把这种注意力机制命名为“System 2...

生成式AI 2023-11-27 人工智能

514阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

774阅读

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训...

生成式AI 2023-11-25 人工智能

947阅读

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是Facebook Research团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。通过使用Llama模型，研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...

人工智能 2023-11-25 人工智能

629阅读

AI视野：ElevenLabs发布“语音转语音”；realme GT5Pro 12月7日发布；Claude2.1被指严重虚标；清华大学提出全新加速训练大模型方法SoT

???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能，用户可上传语音并自动转换为不同音色，实现声音的自由切换，为用户带来全新的语音生成体验。免费体验地址:https://elevenl...

AIGC 2023-11-24 人工智能

627阅读

2023年的深度学习入门指南(20) - LLaMA 2模型解析

2023年的深度学习入门指南(20 - LLaMA 2模型解析上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA 2的模型部分。这一部分需要一些深度神经网络的...

大数据 2023-11-24 人工智能

588阅读

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py 目录一、l...

AIGC 2023-11-24 人工智能

545阅读

ChatGPT 使用到的机器学习技术

作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中，我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。机器学习技术的发展要聊ChatGPT用到的机器学习技术，我们不得不回顾一下机器学...

生成式AI 2023-11-22 人工智能

624阅读

PyTorch团队重写「分割一切」模型，比原始实现快八倍

从年初到现在，生成式 AI 发展迅猛。但很多时候，我们又不得不面临一个难题：如何加快生成式 AI 的训练、推理等，尤其是在使用 PyTorch 的情况下。本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...

人工智能 2023-11-22 人工智能

583阅读

逐行对比LLaMA2和LLaMA模型源代码

几个小时前（2023年7月18日），Meta发布了允许商用的开源模型LLaMA2。笔者逐行对比了LLaMA2模型源代码，和LLaMA相比，几乎没有改动，细节如下：是否改动 LLaMA2 LLaMA 模型整体构架无 Transformer T...

大数据 2023-11-22 人工智能

700阅读

自动驾驶中基于深度学习的预测和规划融合方法综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...

生成式AI 2023-11-20 人工智能

633阅读

揭秘百度文心一言大模型：设计、应用与实战

导言在当今的深度学习领域，大型预训练模型如GPT、BERT等已经取得了显著的进展。而百度公司的文心一言大模型，作为一款基于Transformer结构的巨型模型，也在自然语言处理领域产生了重大影响。本文将详细介绍文心一言大模型的设计原理、特点以及应用场...

人工智能 2023-11-20 人工智能

1138阅读

文心一言发布我怎么看?

文心一言发布我怎么看? 文心一言发布会我只简短的回答两个问题: 补充：文心一言发布会有想看发布会视频的朋友,关注爱书不爱输的程序猿,私信找我拿我只简短的回答两个问题: 1.文心一言能否为百度止颓？...

人工智能 2023-11-19 人工智能

612阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

642阅读