transformer 第8页 - AIGC资讯

基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3，刷新榜单

项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型，由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计，利用尖端技术，在多种生物医学任务中实现了最先进的性能表现。背景： Saam...

生成式AI 2024-06-20 人工智能

1598阅读

基于LLaMA-Factory微调Llama3

本文简要介绍下基于LLaMA-Factory的llama3 8B模型的微调过程环境配置 # 1. 安装py3.10虚拟环境 conda create -n py3.10-torch2.2 python=3.10 source activate c...

生成式AI 2024-06-20 人工智能

1016阅读

AI绘画大模型：国内外『文生图』效果对比

随着人工智能（AI）技术的不断突破，AI绘画作为其中的一项重要应用，逐渐成为了艺术领域的新宠。『文生图』（Text-to-Image）是AI绘画中的一种重要技术，它能够通过自然语言描述生成对应的图像。本文将对国内外具有代表性的『文生图』大模型进行效果对比，...

生成式AI 2024-06-20 人工智能

1404阅读

LLaMA 3 源码解读-大语言模型5

本来不是很想写这一篇，因为网上的文章真的烂大街了，我写的真的很有可能没别人写得好。但是想了想，创建这个博客就是想通过对外输出知识的方式来提高自身水平，而不是说我每篇都能写得有多好多好然后吸引别人来看。那作为对整个合集内容的完善，这篇博客会解析现在最火的LL...

AIGC 2024-06-20 人工智能

1141阅读

stable diffusion本地部署教程

Stable diffusion本地部署教程前言 Stable Diffusion是一种基于深度学习的图像生成模型，能够生成高质量的图像。由于其计算需求较高，需要强大的计算资源来运行。然而，使用云服务或远程服务器来部署Stable Diffu...

人工智能 2024-06-20 人工智能

2490阅读

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

1417阅读

Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成文章目录 Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成不同行...

人工智能 2024-06-19 人工智能

1265阅读

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索（三）

一、前言语音转文本技术具有重要价值。它能提高信息记录和处理的效率，使人们可以快速将语音内容转换为可编辑、可存储的文本形式，方便后续查阅和分析。在教育领域，可帮助学生更好地记录课堂重点；在办公场景中，能简化会议记录工作。同时，该技术也为残障人士提...

人工智能 2024-06-19 人工智能

779阅读

meta-llama/Meta-Llama-3-8B

https://huggingface.co/meta-llama/Meta-Llama-3-8B 型号细节 Meta开发并发布了Meta Llama 3家族大型语言模型(LLM ,这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。L...

人工智能 2024-06-19 人工智能

1003阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

1293阅读

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

本文介绍一个统一音频标记（Audio Tagger）和语音识别（ASR）的模型：Whisper-AT，通过冻结Whisper的主干，并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下，可以在单次前向传递...

大数据 2024-06-18 人工智能

1440阅读

AI教父Hinton：我支持超级AI取代人类！

【新智元导读】「AI教父」Geoffrey Hinton在最近的采访中表达了自己对AI智能的理解——LLM并不是简单的统计模型，已经具备了理解能力。与此同时，网友翻出了去年12月的「过期」视频，惊奇地发现Hinton早就「叛变」了，竟然对超级AI取代人类的...

大数据 2024-06-18 人工智能

869阅读

Llama Factory 笔记

本地环境：cuda 11.7 torch2.1.0 项目文件结构： 1. 项目文件结构：如果利用Llama Factory 进行微调主要会用到 LLama-Factory/src 中的文件 2. src 下的目录结构本地推理的...

生成式AI 2024-06-18 人工智能

1687阅读

LLaMA: Open and Efﬁcient Foundation Language Models

*背景已有的大模型越来越多的追求更大的参数量以实现更高的性能，但有研究表明更小的模型在更大的数据集上同样可以表现良好，因此本文旨在通过大量公开可用的数据集来训练一个语言模型同时取得SOTA的性能，模型大小从7B到65B，并且开源相关模型代码。(htt...

人工智能 2024-06-17 人工智能

1172阅读

图像生成新篇章：Stable Diffusion 3 Medium开源评析

摘要在数字艺术与人工智能的交汇点上，Stable Diffusion 3（SD3）的开源无疑是一场技术革新的盛宴。就在3月份，我撰写了一篇博文，深入探讨了SD3的技术报告内容与介绍，文章发表在CSDN博客上，https://blog.c...

生成式AI 2024-06-17 人工智能

827阅读

Hinton为拒马斯克offer扯谎挂电话，警告AI取代人类比想象中快30年

Geoffrey Hinton老爷子——图灵奖得主、深度学习发明人、AI三巨头、Ilya之师，在最新专访中透露出这个令人心碎的消息。就在这两天，Hinton接受了多家媒体的专访，既有老生常谈的内容，即他对AI发展安全的担忧;也有一些新的话题和八卦。他提...

大数据 2024-06-17 人工智能

855阅读

【LLM第二篇】stable diffusion扩散模型、名词解释

最近在整理大模型的相关资料，发现了几个名词，不是很懂，这里整理一下： stable diffusion（SD 模型：扩散模型（Diffusion model）的一种，主要用于生成高质量的图像，GAN的替代者，扩散模型通过一些列学习步骤生成数据，逐渐从...

人工智能 2024-06-17 人工智能

1367阅读

AIGC从入门到实战：落霞与孤鹜齐飞：AIGC 汹涌而来

作者：禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...

人工智能 2024-06-17 人工智能

984阅读

Llama模型家族之Stanford NLP ReFT源代码探索（三）reft_model.py代码解析

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-16 人工智能

1039阅读

大规模语言模型从理论到实践 LLaMA的模型结构

1.背景介绍随着人工智能技术的不断发展，大规模语言模型（Large Language Models, LLMs）已经成为自然语言处理领域的热点。这些模型通过在大规模数据集上进行训练，能够生成连贯、相关且有趣的文本输出。LLaMA 是 Meta AI 开...

AIGC 2024-06-16 人工智能

1005阅读

AI绘画SD【插件篇】：智能标签提示词插件sd-danbooru-tags-upsampler

大家好，我是c程序员晓晓。关于智能标签提示词插件，在很早之前就介绍过很多款了，今天再给大家介绍一款智能标签提示词插件sd-danbooru-tags-upsampler。该智能提示词插件是今年2月23号才发布的第一版V0.1.0，算是比较新的智能提示词...

AIGC 2024-06-16 人工智能

2043阅读

【AIGC】深入探索AIGC技术在文本生成与音频生成领域的应用

?文章标题 ?AIGC之文本生成 ?应用型文本生成 ?创作型文本生成 ?文本辅助生成 ?重点关注场景 ?音频及文字—音频生成 ?TTS(Text-to-speech 场景 ?乐曲/歌曲生成 ?场景推荐随着科技的飞速发展?，...

人工智能 2024-06-16 人工智能

1037阅读

五一超级课堂---Llama3-Tutorial（Llama 3 超级课堂）---第三节llama 3图片理解能力微调（xtuner+llava版）

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频： https://space.bilibili.com/3546636263360696/channel/collectiondetail?...

大数据 2024-06-16 人工智能

1103阅读

Llama网络结构介绍

LLaMA现在已经是开源社区里炙手可热的模型了，但是原文中仅仅介绍了其和标准Transformer的差别，并没有一个全局的模型介绍。因此打算写篇文章，争取让读者不参考任何其他资料把LLaMA的模型搞懂。结构如图所示为LLaMA的示意图，由Atte...

AIGC 2024-06-16 人工智能

1451阅读

李开复、张亚勤对谈：大模型产业化，To B、To C哪个赛道更有机会？

6月15日消息，在第六届“北京智源大会”上，零一万物CEO、创新工场董事长李开复博士，中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤院士、智源研究院理事长黄铁军教授，三位行业领袖就大模型的成功因素、面临的挑战、产业化场景等多个热点话题展开了深入...

大数据 2024-06-15 人工智能

891阅读

Meta-Llama-3-8B-Instruct本地推理

Meta-Llama-3-8B-Instruct 本地推理基础环境信息（wsl2安装Ubuntu22.04 + miniconda）使用miniconda搭建环境 (base :~$ conda create --name pyto...

AIGC 2024-06-15 人工智能

854阅读

天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（一）：回顾早期工作在2022年的这波AI绘画浪潮中，Stable Diffusion无疑是最受欢迎的图像生成模型。究其原因，第一...

AIGC 2024-06-14 人工智能

1155阅读

大型语言模型（LLMs）在AIGC中的核心地位

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

大数据 2024-06-14 人工智能

912阅读

Llama 3 CPU推理优化指南

备受期待的 Meta 第三代 Llama 现已发布，我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中，我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟，但首先，让我们讨论一下 Meta Lla...

生成式AI 2024-06-14 人工智能

1067阅读

用 Unsloth 微调 LLaMA 3 8B

用 Unsloth 微调 LLaMA 3 8B 今年4月份，Meta 公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而，传统的 LLM 微调过程既耗时又耗费资...

生成式AI 2024-06-14 人工智能

1271阅读

终于来啦！Stable Diffusion 3将在6月12日正式开源

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。本次开源的是Stab...

大数据 2024-06-13 人工智能

853阅读

LLama的激活函数SwiGLU 解释

目录 Swish激活函数 1. Swish函数公式 LLaMA模型中的激活函数 1. SwiGLU激活函数 2. SwiGLU激活函数的表达式 3. SwiGLU激活函数的优势 Swish激活函数 Swish是一种激活函数，其计算...

AIGC 2024-06-13 人工智能

1400阅读

运行stable-diffusion出现的问题(1)

Checkout your internet connection or see how to run the library in offline mode at ‘https://huggingface.co/docs/transformers/ins...

生成式AI 2024-06-13 人工智能

2752阅读

技术前沿 |【大模型LLaMA：技术原理、优势特点及应用前景探讨】

大模型LLaMA：技术原理、优势特点及应用前景探讨一、引言二、大模型LLaMA的基本介绍三、大模型LLaMA的优势特点五、结论与展望一、引言随着人工智能技术的飞速发展，大模型已成为推动这一领域进步的重要力量。近年来...

大数据 2024-06-13 人工智能

1264阅读

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码：绝对位置、相对位置、旋转位置编码

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码文章目录 [从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...

生成式AI 2024-06-13 人工智能

1305阅读

国产Sora来了！清华发布视频生成大模型“视界一粟YiSu”

快科技6月12日消息，据媒体报道，北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟 YiSu”。该大模型拥有模型原生的16秒超长时长，并可生成至1分钟以上视频。据介绍，YiSu模型成本更低、...

人工智能 2024-06-12 人工智能

846阅读

02：从文生图初窥Stable Diffusion，一键玩转AI绘画

前言 Stable Diffusion是一个什么架构呢，或者说是由哪些部分构成，各自发挥着怎么样的作用。我们就先从文生图开始探索文生图我们打开Stable Diffusion的webui，然后选择Stable Diffusion模型，然后选择...

生成式AI 2024-06-12 人工智能

1044阅读

transformers 阅读：Llama 模型

正文学习一下 transformers 库中，Llama 模型的代码，学习过程中写下这篇笔记，一来加深印象，二来可以多次回顾。笔者小白，里面错误之处请不吝指出。层归一化 LlamaRMSNorm transformers 中对于 Llam...

AIGC 2024-06-12 人工智能

1445阅读

Karpathy 4小时AI大课上线，小白看了都会从零构建GPT-2

距上次Karpathy AI大课更新之后，又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。大神Karpathy新一期AI大课又上线了。这一次，他讲的内容是——从头开始实现124M大小的GPT-2模型...

生成式AI 2024-06-12 人工智能

843阅读

一文解读：Stable Diffusion 3究竟厉害在哪里？

知乎原文：叫我Alonzo就好了前言最近一段时间，正当所有人都在为OpenAI发布Sora狂欢时，Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...

AIGC 2024-06-12 人工智能

1362阅读

AI生图格局大震！Stable Diffusion 3开源倒计时，2B单机可跑碾压闭源Midjourney

重磅消息!Stable Diffusion3，大概率会在明天开源。距离2月SD3的横空出世，已经过去了4个月。如果此事为真，生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构，将彻底改变AI生图的格局。现在，全体AI社区都在翘首以盼。万众瞩目...

大数据 2024-06-12 人工智能

840阅读

AIGC系列之：GroundingDNIO原理解读及在Stable Diffusion中使用

目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...

大数据 2024-06-12 人工智能

2327阅读

大模型算法(一)：从Transformer到ViT再到LLaMA

单任务/单领域模型深度学习最早的研究集中在针对单个领域或者单个任务设计相应的模型。对于CV计算机视觉领域，最常用的模型是CNN卷积模型。其中针对计算机视觉中的不同具体任务例如分类任务，目标检测任务，图像分割任务，以CNN作为骨干backbone，加...

AIGC 2024-06-11 人工智能

1223阅读

LLaMA详细解读

LLaMA 是目前为止，效果最好的开源 LLM 之一。精读 LLaMA 的论文及代码，可以很好的了解 LLM 的内部原理。本文对 LLaMA 论文进行了介绍，同时附上了关键部分的代码，并对代码做了注释。摘要 LLaMA是一个系列模型，模型参数量从7B...

人工智能 2024-06-11 人工智能

1529阅读

AIGC学习（SD、LoRA和ControlNet）

目录 Stable Diffusion（稳定扩散模型）为什么叫扩散模型？网络结构 VAE（Variational Auto-Encoder） UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵什么是LoRA？...

人工智能 2024-06-11 人工智能

2118阅读

Stable diffusion文生图大模型——隐扩散模型原理解析

1、前言本篇文章，我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难，甚至说很简单。创新点也相对较少，如果你学会了我以前的文章讲过的模型，学习这个也自然水到渠成！参考论文：High-Resolution Ima...

AIGC 2024-06-11 人工智能

1262阅读

文心一言 vs GPT-4 -- 全面横向比较

文心一言和GPT-4都是当前非常先进的自然语言处理模型，它们在语言理解、生成和翻译等方面都展现出了出色的能力。以下是对这两个模型的全面横向比较：核心技术基础：文心一言：是基于BERT（Bidirectional Encoder Represen...

AIGC 2024-06-10 人工智能

939阅读

stable diffusion比 transformer 作了哪些改进

Stable Diffusion 是一个基于自注意力机制的生成模型，它的设计受到了 Transformer 模型的启发，但也在很多方面进行了改进。以下是 Stable Diffusion 相较于 Transformer 的一些改进之处：稳定性提升：...

大数据 2024-06-10 人工智能

1065阅读

大模型系列：LLaMA大模型简述和本地部署实践

内容摘要 LLaMA大模型背景介绍 LLaMA网络结构相比Transformer的改进 LLaMA中文化Atom大模型简述在Python中调用HuggingFace LLaMA模型基于text-generation-webui部署LLaMA问答平...

生成式AI 2024-06-10 人工智能

1278阅读

AIGC未来展望：AI将如何改变内容创作

AIGC未来展望：AI将如何改变内容创作 1.背景介绍 1.1 内容创作的重要性在当今时代,内容创作无疑已成为一项关键的生产力。无论是营销、教育、娱乐还是其他领域,高质量的内容都是吸引受众、传播信息、实现价值的关键。然而,创作优秀内容需要大量的时间...

大数据 2024-06-10 人工智能

942阅读