解码器第2页 - AIGC资讯

「AIGC」大语言模型系列-Transformer详解

Transformer模型相对复杂，下面我将提供一个简化版的Transformer模型的Python代码示例，使用PyTorch库实现。这个示例将包括模型的基本结构，如编码器和解码器，自注意力机制，位置编码，以及前馈网络。请注意，这个示例主要用于教...

AIGC 2024-08-12 人工智能

875阅读

LLM大模型从入门到精通（6）--Stable Diffusion超详细讲解

本文详细讲解Stable Diffusion的原理与工作流程一、Stable Diffusion简介二、Stable Diffusion原理解析三、Stable Diffusion处理流程四、结语一、Stable Diffusi...

人工智能 2024-08-11 人工智能

1950阅读

Stable Diffusion之最全详细图解

Stable Diffusion是一种生成模型，用于生成高质量的图像。这种模型基于扩散过程，能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解，涵盖其原理、模型结构、训练过程及应用示例。一、Stable Diffusi...

人工智能 2024-08-11 人工智能

1700阅读

【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC：几种AIGC底层技术的代码详解

为了更好地理解AIGC（AI Generated Content，人工智能生成内容）的底层技术，我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络（GANs）、变分自编码器（VAEs）和自回归模型（如Transformer和GPT）。 1....

人工智能 2024-08-09 人工智能

1056阅读

Meta发布Llama 3.1 405B模型：开源与闭源模型之争的新篇章

引言在人工智能领域，开源与闭源模型之争一直是热点话题。近日，Meta发布了最新的Llama 3.1 405B模型，以其强大的性能和庞大的参数规模，成为了开源模型中的佼佼者。本文将详细介绍Llama 3.1 405B模型的性能、功能及其在开源领域的影响...

大数据 2024-08-05 人工智能

893阅读

Stable Diffusion 深入浅出,一看就会

Stable Diffusion 是一个基于深度学习的图像生成模型，旨在生成高质量的图像。下面是一个 Stable Diffusion 入门案例教程，旨在帮助您快速入门 Stable Diffusion。安装 Stable Diffusion 首先，...

人工智能 2024-08-05 人工智能

1082阅读

Stable Diffusion 使用详解（2）---- 图生图原理，操作，参数

目录背景图生图原理基本原理 1. 扩散模型基础 2. 图生图的具体流程 3. 关键技术点 4. 应用实例 CLIP 原理 1.基本概念 2. 核心特点使用及参数随机种子重绘幅度图像宽高采样方法 1. DPM（...

AIGC 2024-08-04 人工智能

1150阅读

导出 Whisper 模型到 ONNX

前言在语音识别领域，Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型，导出为 ONNX 格式是一个有效的途径。ONNX（Open Neural Network Exchange）是一个开放格式...

AIGC 2024-08-03 人工智能

2044阅读

AIGC-ComfyUI工作流基础篇-入门教程

一、前沿随着人工智能技术的日益成熟和广泛应用，艺术创作领域正经历着一场革命性的变革。特别是AIGC（人工智能生成内容）技术的崛起，为内容创作提供了前所未有的高效和便捷。在这场变革中，Comfyui作为一款前沿的AI绘画软件，正引领着艺术创作的新潮流。...

大数据 2024-08-01 人工智能

1594阅读

【AI学习】LLaMA 系列模型的进化（二）

在前面LLaMA 系列模型的进化（一）中学习了LLama模型的总体进化发展，再来看看其中涉及的一些重要技术。 PreLayerNorm Layer Norm有Pre-LN和Post-LN两种。Layer Normalization（LN）在Trans...

大数据 2024-08-01 人工智能

1556阅读

stable diffusion最全插件大全，新手必备指南

Stable diffusion30个必备插件推荐，给我点个赞吧，兄弟们 1，ComfyUI，SD扩展里面直接搜索就行， ComfyUI 是一个基于节点操作的UI界面，玩过建模的更容易学安装后大概是这样的评价：comfyui,...

人工智能 2024-07-31 人工智能

1338阅读

超详细高质量图解 Stable Diffusion

最近有一篇国外博主分享的图解Stable Diffusion 博客写的非常的好，让你从零开始彻底搞懂图像生成模型的原理，我在这里给大家专业翻译整理一下。正文开始人工智能图像生成是最新的人工智能功能，令人惊叹不已（包括我的）。从文本描述中创造出...

人工智能 2024-07-31 人工智能

830阅读

【Stable Diffusion】ComfyUI-插件-生成透明通道素材！

前言哈喽大家好，刚接触SD生成素材的时候，就想过能不能一步到位，直接生成带透明通道的图层，这期分享下ComfyUI中的这种插件，开始之前先来感受下透明通道素材 1、安装插件将zip的压缩包解压到以下路径 ···\ComfyUI\cus...

生成式AI 2024-07-30 人工智能

2006阅读

stable diffusion文生图代码解读

使用diffusers运行stable diffusion，文生图过程代码解读。只按照下面这种最简单的运行代码，省略了一些参数的处理步骤。 from diffusers import DiffusionPipeline pipeline = Diffu...

大数据 2024-07-29 人工智能

1251阅读

Stable Diffusion系列（六）：原理剖析——从文字到图片的神奇魔法（潜空间篇）

文章目录 LDM 概述原理模型架构自编码器模型扩散模型条件引导模型图像生成过程实验结果指标定义 IS（越大越好） FID（越小越好）训练成本与采样质量分析不带条件的图片生成基于文本的图片生成基于语义框的图片生...

生成式AI 2024-07-29 人工智能

1476阅读

python系列&deep_study系列：实战whisper第三天：fast whisper 语音识别服务器部署，可远程访问，可商业化部署（全部代码和详细部署步骤）

实战whisper第三天：fast whisper 语音识别服务器部署，可远程访问，可商业化部署（全部代码和详细部署步骤）实战whisper第三天：fast whisper 语音识别服务器部署，可远程访问，可商业化部署（全部代码和详细部署步骤...

生成式AI 2024-07-24 人工智能

1446阅读

Stable Diffusion工作原理一篇文章带你详解！

前言翻译自How does Stable Diffusion work? 1. SD能做什么最基本的功能是：文生图（text-to-image） SD以文字提示为输入，输出与提示相配的图像 2. 扩散模型 SD属于扩散模...

大数据 2024-07-24 人工智能

1154阅读

【技术追踪】SDSeg：医学图像的 Stable Diffusion 分割（MICCAI-2024）

这医学图像分割领域啊，终究还是被 Stable Diffusion 闯进去了~ SDSeg：第一个基于 Stable Diffusion 的 latent 扩散医学图像分割模型，在五个不同医学影像模态的基准数据集上超越了现有的最先进方法~ 论...

大数据 2024-07-24 人工智能

1744阅读

一文者懂LLaMA 2（原理、模型、训练）

引言 LLaMA（Large Language Model Meta AI）是Meta（前身为Facebook）开发的自然语言处理模型家族之一，LLaMA 2作为其最新版本，展示了在语言理解和生成方面的显著进步。本文将详细解读LLaMA 2的基本原理、...

生成式AI 2024-07-23 人工智能

981阅读

openai 开源模型Whisper语音转文本模型下载使用

Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。官方地址 https://github.com/openai/whisper 方法...

AIGC 2024-07-21 人工智能

1209阅读

每日AIGC最新进展(33)：小米提出单步扩散模型SDXS、阿米蒂大学提出加速SD的统一模块LCM-LORA、国立台湾大学提出生成QR二维码的扩散模型

Diffusion Models专栏文章汇总：入门与实战 SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions 本文介绍了一种名为SDXS的新型实时一步潜在...

AIGC 2024-07-19 人工智能

890阅读

Stable Diffusion背后的技术原理与实现细节

Stable Diffusion背后的技术原理与实现细节 I. 引言 A. Stable Diffusion的定义 B. 技术重要性概述 C. 本文目标与结构 II. 深度学习与图像生成 A. 深度学习简介 B. 图像生成任务 C. 生成...

人工智能 2024-07-18 人工智能

1156阅读

Diffusion【1】：SDSeg——基于Stable Diffusion的单步扩散分割！

文章目录前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...

大数据 2024-07-16 人工智能

1171阅读

万字长文破解 AI 图片生成算法-Stable diffusion (第一篇）

想象一下：你闭上眼睛，脑海中构思一个场景，用简短的语言描述出来，然后“啪”的一声，一张栩栩如生的图片就出现在你眼前。这不再是科幻小说里才有的情节，而是Stable Diffusion——一种前沿的AI图片生成算法——所带来的现实。在本系列的万字长...

AIGC 2024-07-16 人工智能

1025阅读

AI作画算法详解：原理、应用与未来发展

随着人工智能技术的不断发展，AI作画逐渐成为了一个热门话题。AI作画，即利用人工智能算法生成绘画作品，不仅仅是技术的展示，更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理，并通过实例帮助读者更好地理解和掌握这一技术。文章最后，给大家推...

AIGC 2024-07-15 人工智能

1067阅读

如何使用Whisper语音识别模型

Whisper 是一个通用语音识别模型，由 OpenAI 开发。它可以识别多种语言的语音，并将其转换为文本。Whisper 模型采用了深度学习技术，具有高准确性和鲁棒性。 1、技术原理及架构 Whisper 的工作原理：音频被分割成...

大数据 2024-07-12 人工智能

1785阅读

一文看懂LLaMA 2：原理、模型与训练

引言人工智能领域的快速发展，带来了许多强大的语言模型。LLaMA 2 是其中之一，以其出色的性能和灵活的应用能力，吸引了广泛关注。这篇文章将带你深入了解 LLaMA 2 的原理、模型架构和训练过程，帮助你全面掌握这一前沿技术。什么是LLaMA...

AIGC 2024-07-10 人工智能

1242阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1089阅读

AIGC：生成式模型简介

AIGC：生成式模型简介变分自编码器（VAE）生成对抗网络（GAN）自回归模型（Autoregressive Model）流模型（Flow Model）扩散模型（Diffusion Model）此博客将从原理、优点和缺点几...

大数据 2024-07-06 人工智能

1062阅读

结合RNN与Transformer双重优点，深度解析大语言模型RWKV

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》，作者：Freedom123。一、前言 Transformer模型作为一种革命性的神经网络架构，于2017年由Vaswani等人提出，并在诸多任务中...

人工智能 2024-07-05 人工智能

1115阅读

全网最全讲解Stable Diffusion原理，小白也能看懂！速来！！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取...

人工智能 2024-07-04 人工智能

1029阅读

8人半年肝出开源版GPT-4o，0延迟演示全网沸腾！背后技术揭秘，人人免费用

【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过，由法国8人团队打造的原生多模态Moshi，已经实现了接近GPT-4o的水平，现场演示几乎0延迟，AI大佬纷纷转发。没想到，「开源版」GPT-4o这么快就来了! 昨夜，来自法国AI实验室kyu...

生成式AI 2024-07-04 人工智能

959阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

1201阅读

【AI原理解析】— 文心一言模型

目录模型架构 Transformer模型编码器-解码器结构训练过程预训练微调关键技术知识增强上下文感知个性化生成推理与生成应用场景问答系统文本生成对话系统模型架构 Trans...

人工智能 2024-07-04 人工智能

1258阅读

AIGC入门（一）从零开始搭建Transformer！（上）

前言我记得曾经看过一篇综述，综述里曾这样讲过：多模态使用Transformer作为基石模型的一个原因之一，就是因为它能够很好地统一视觉（ViT、DiT）和文本，并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。笔者...

AIGC 2024-07-02 人工智能

1132阅读

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

嵌入模型是大型语言模型检索增强生成(RAG 的关键组成部分。它们对知识库和用户编写的查询进行编码。使用与LLM相同领域的训练或微调的嵌入模型可以显著改进RAG系统。然而，寻找或训练这样的嵌入模型往往是一项困难的任务，因为领域内的数据通常是稀缺的。但...

大数据 2024-07-02 人工智能

878阅读

【末文附资料】Stable Diffusion详解图解！零基础速看！！

Stable Diffusion详解图解 1. Stable Diffusion介绍 1.1 研究背景 1.2 学术名词 2.Stable Diffusion原理解析 2.1 技术架构 2.2 原理介绍...

AIGC 2024-07-02 人工智能

923阅读

【小沐学AI】Python实现语音识别（Whisper-Web）

文章目录 1、简介 2、下载 2.1 openai-whisper 2.2 whisper-web 结语 1、简介 https://openai.com/index/whisper/ Whisper 是一种自动语音识别（A...

生成式AI 2024-07-01 人工智能

1086阅读

AIGC涉及到的算法（一）

目录 1. 生成对抗网络(GAN 2. 变分自编码器(VAE 3. 扩散模型(Diffusion Model 4. Transformer 模型 5. 自然语言处理算法(NLP 6. 计算机视觉算法(CV 7. 神经网络算法...

人工智能 2024-06-30 人工智能

980阅读

【AI 大模型】大模型应用架构 ( 业务架构 - AI Embedded、AI Copilot、AI Agent | 技术架构 - 提示词、代理 + 函数调用、RAG、Fine-tuning )

文章目录一、大模型技术方向 - 大模型训练 / 大模型应用二、大模型应用 - 业务架构 1、AI Embedded 模式 2、AI Copilot 模式 3、AI Agent 模式三、大模型应用 - 技术架构 1、提示词技术架构...

人工智能 2024-06-30 人工智能

1464阅读

AIGC技术深度剖析：底层原理及其应用

AIGC技术深度剖析：底层原理及其应用引言人工智能生成对话技术（AIGC）是一种能够模拟人类语言表达和生成自然语言响应的技术。它是由AI对话大师调用的聊天生成语言大模型所提供的。本文将深入剖析AIGC技术的底层原理，并探讨它在各个领域的应用。...

大数据 2024-06-28 人工智能

1615阅读

Stable Diffusion 3: Research Paper

Stable Diffusion 3: Research Paper 1. 核心理念扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比，在书写效果以及...

AIGC 2024-06-28 人工智能

960阅读

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成学习前言源码下载地址 EasyAnimate V2简介技术储备 Diffusion Transformer (DiT Mo...

AIGC 2024-06-27 人工智能

1294阅读

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一）

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一） Meta 通过推出新的开源 AI 模型 Llama 3 以及新版本的 Meta AI，正在加强其在人工智能 (AI 竞赛中的竞争力。该虚拟助手由 Llama 3 提供支持，现已可在所...

人工智能 2024-06-25 人工智能

1088阅读

每日AIGC最新进展(29)：复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流

Diffusion Models专栏文章汇总：入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法，旨在通过人类反馈...

AIGC 2024-06-25 人工智能

887阅读

原来Stable Diffusion是这样工作的

stable diffusion是一种潜在扩散模型，可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢？这是因为与在高维图像空间中操作不同，它首先将图像压缩到潜在空间中，然后再进行操作。在这篇文章中，我们将深入了解它到底是如何工作的,还能够知道文生图...

生成式AI 2024-06-24 人工智能

1007阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

1278阅读

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

本文介绍一个统一音频标记（Audio Tagger）和语音识别（ASR）的模型：Whisper-AT，通过冻结Whisper的主干，并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下，可以在单次前向传递...

大数据 2024-06-18 人工智能

1412阅读

变分自编码器（VAE）在AIGC中的应用及其技术解析

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

人工智能 2024-06-18 人工智能

1104阅读

AIGC |「多模态模型」系列之OneChart：端到端图表理解信息提取模型

论文标题: OneChart: Purify the Chart Structural Extraction via One Auxiliary Token 论文作者: Jinyue Chen, Lingyu Kong, Haoran Wei, Chen...

人工智能 2024-06-18 人工智能

1149阅读