-
Stable Diffusion原理说明
本文参考:深入浅出讲解Stable Diffusion原理,新手也能看明白 - 知乎 目录 1、Stable Diffusion能做什么? 2、扩散模型(Diffusion model) (1)前向扩散(Forward Diffusion)...
-
Stable Diffusion条件控制生成---相关论文集合
Stable Diffusion条件控制生成 1. IP-Adapter 2. ControlNet 3. InstantID 4. T2I-Adapter 5. Uni-ControlNet 6. Composer 7. MGPF 8. Sa...
-
开源语音实时交互新突破:LLaMA-Omni实现大语言模型无缝语音交互
像 GPT-4o 这样的模型通过语音实现了与大型语言模型(LLMs)的实时交互,与基于文本的传统交互相比,显著提升了用户体验。然而,目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题,我们提出了 LLaMA-Omni,这是一个...
-
Stable Diffusion【Lora模型】:用AI绘画也能搞服装设计了,让服装设计变得更加多彩多姿
大家好,我是程序员晓晓 今天和大家分享一个服装饰品分类背景的基于SDXL的Lora模型:分类背景 XUER。该LORA模型由模型训练大佬绪儿8月份推出的,目前推出的是V1版本,作者声称图片精度没有到达预期,拆分还是有点不太一样,正在改进优化中,相信不久会...
-
中科院提出GPT-4o实时语音交互的开源对手:Llama-Omni
论文:LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址:https://arxiv.org/pdf/2409.06666 研究背景 研...
-
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions
创新点: VQ-VAE 👉 Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...
-
Lawyer LLaMA(中文法律大模型本地部署)
Lawyer LLaMA(中文法律大模型本地部署 1.模型选择(lawyer-llama-13b-v2) 2.运行环境 1.建议使用Python 3.8及以上版本。 2.主要依赖库如下: transformers >=...
-
【笔记】扩散模型(七):Latent Diffusion Models(Stable Diffusion)论文解读与代码实现
论文链接:High-Resolution Image Synthesis with Latent Diffusion Models 官方实现:CompVis/latent-diffusion、CompVis/stable-diffusion 这一...
-
AIGC-初体验
线性分类 提问,目的试图让AI自动线性分类 A类:(10,21 ,(3,7),(9,20)(121,242 B类:(3,9 ,(5,11 ,(70,212 ,(11,34 根据线性关系分类 请问 (100,300 ,(100,201)属于哪一类 下...
-
如何微调 Llama 3 进行序列分类?
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集: 《大模...
-
VAE(Variational auto-encoder)
1.VAE(Variational auto-encoder) 笔记来源及推荐文章: 1.变分自编码器(一):原来是这么一回事 2.变分自编码器(二):从贝叶斯观点出发 3.变分自编码器(三):这样做为什么能成? 4.变分自编码器(四):一步到位的聚类...
-
ESP32-S3百度文心一言大模型AI语音聊天助手(支持自定义唤醒词训练)【手把手非常详细】【万字教程】
简介 此项目主要使用ESP32-S3实现一个AI语音聊天助手,可以通过该项目熟悉ESP32-S3 arduino的开发,百度语音识别,语音合成API调用,百度文心一言大模型API的调用方法,音频的录制及播放,SD卡的读写,Wifi的配置(smartconf...
-
分享一个AI开发者的强力助手:openMind Library
在人工智能的浪潮中,深度学习开发套件 openMind Library,以其强大的功能和易用性,逐步成为AI开发者们的强力助手。本文将通过魔乐社区近期关注挺高的大模型平台魔乐社区,深入了解openMind Library。 openMind Librar...
-
【diffusers极速入门(七)】Classifier-Free Guidance (CFG)直观理解以及对应代码
系列文章目录 【diffusers 极速入门(一)】pipeline 实际调用的是什么? call 方法! 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函数 【diffusers极速...
-
Stable Diffusion【Lora模型】【服饰妆造】:AI绘画技术,让服装设计变得更加多彩多姿
大家好,我是小梁子。专注于AI绘画技术干货分享。喜欢的可以添加个人微信:willard_liang(文章底部可扫码),加入小梁子AI绘画学习交流群,期待与你一路同行,共同成长。 今天和大家分享一个服装饰品分类背景的基于SDXL的Lora模型:分类背景...
-
从【人工智能】到【计算机视觉】,【深度学习】引领的未来科技创新与变革
前几天偶然发现了一个超棒的人工智能学习网站,内容通俗易懂,讲解风趣幽默,简直让人欲罢不能。忍不住分享给大家,点击这里立刻跳转,开启你的AI学习之旅吧! 前言 – 人工智能教程https://www.captainbed.cn/lzx 1. 引言...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
【扩散模型(六)】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
Stable Diffusion Web UI基础入门之常用参数
在之前的文章中我们介绍了,Stable Diffusion的基础知识和使用工具———Stable Diffusion AI入门介绍。这篇文档带大家了解一下Stable Diffusion Web UI的常用参数,在日常绘图中如何使用。 我们知道在St...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024
让AI绘画模型变“乖”,现在仅需3秒调整模型参数。 效果be like:生成的风险图片比以往最佳方法减少30%! 像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。 在移除裸露内容上,效果达到“只穿衣服,不改结构”。 这就是复旦大学提...
-
在亚马逊云科技上对Stable Diffusion模型提示词、输出图像内容进行安全审核
项目简介: 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技机器学习托管服务Sage...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
AI机器人本地免费部署(部署Llama 3.1详细教程)
昨日,Meta公司发布了人工智能模型——Llama 3.1。 那么Llama 3.1 405B的效果怎么样?我们来对比一张图,横向对比一下GPT-4。 可以看出,Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
【机器学习】机器学习与医疗健康在疾病预测中的融合应用与性能优化新探索
文章目录 引言 第一章:机器学习在医疗健康中的应用 1.1 数据预处理 1.1.1 数据清洗 1.1.2 数据归一化 1.1.3 特征工程 1.2 模型选择 1.2.1 逻辑回归 1.2.2 决策树 1.2.3 随机森林 1.2...
-
Stable Diffusion【基础篇】:提示词引导系数(CFG Scale)
大家好,我是极客菌 CFG(Classifier-Free Guidance) 用于控制Stable Diffusion在采样期间应遵循提示词的严格程度。几乎所有稳定扩散 AI 图像生成器都提供了此参数设置。今天我们重点来看看在Stable Diffus...
-
stable diffusion文生图代码解读
使用diffusers运行stable diffusion,文生图过程代码解读。 只按照下面这种最简单的运行代码,省略了一些参数的处理步骤。 from diffusers import DiffusionPipeline pipeline = Diffu...
-
【八股文】算法岗位八股文、深度学习、AIGC八股文面试经验(一)
1. 请解释一下Batch Normalization的原理及其在训练深度神经网络中的作用。 Batch Normalization(批归一化)是一种在训练深度神经网络时常用的技术,旨在提高训练速度、稳定性和性能。 2. 在图像预处理过程中,如何选择合适...
-
Classifier-Free Guidance (CFG) Scale in Stable Diffusion
1.Classifier-Free Guidance Scale in Stable Diffusion 笔记来源: 1.How does Stable Diffusion work? 2.Classifier-Free Diffusion Guida...
-
【小沐学AI】Python实现语音识别(whisper+HuggingFace)
文章目录 1、简介 1.1 whisper 2、HuggingFace 2.1 安装transformers 2.2 Pipeline 简介 2.3 Tasks 简介 2.3.1 sentiment-analysis 2.3.2 zero-...
-
快速上手文心一言指令:从零开始的详细指南
快速上手文心一言指令:从零开始的详细指南 一、引言 随着人工智能技术的不断进步,自然语言处理(NLP)已成为现代计算机科学和人工智能领域中的一个重要研究方向。它不仅在学术界取得了显著成果,更在实际应用中展现出巨大的价值,如智能客服、文本生成、情感分...
-
天才程序员周弈帆 | Stable Diffusion 解读(四):Diffusers实现源码解读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(四):Diffusers实现源码解读 接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源...
-
基于MindSpore实现BERT对话情绪识别
本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》,作者:JeffDing。 模型简介 BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder...
-
【Python】科研代码学习:十六 Model架构的代码细节,附架构图:Llama 为例 (v4.28.0)
【Python】科研代码学习:十六 Model与网络架构 的代码细节:Llama 为例(v4.28.0) 前言 导入依赖 `LlamaRMSNorm`:改进的 层正则化 `LlamaRotaryEmbedding`:旋转式位置编码 `Llama...
-
全网最全讲解Stable Diffusion原理,小白也能看懂!速来!!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取...
-
基于Python和TensorFlow实现BERT模型应用
本文分享自华为云社区《使用Python实现深度学习模型:BERT模型教程》,作者: Echo_Wish。 BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一种用...
-
天才程序员周弈帆 | Stable Diffusion 解读(二):论文精读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(二):论文精读 【小小题外话】端午安康! 在上一篇文章天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早...
-
(5-5-02)金融市场情绪分析:使用Llama 2 大模型实现财经信息的情感分析微调(2)
5.5.4 Llama-2语言模型操作 编写下面的代码,功能是加载、配置 Llama-2 语言模型以及其对应的分词器,准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...
-
原来Stable Diffusion是这样工作的
stable diffusion是一种潜在扩散模型,可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢?这是因为与在高维图像空间中操作不同,它首先将图像压缩到潜在空间中,然后再进行操作。 在这篇文章中,我们将深入了解它到底是如何工作的,还能够知道文生图...
-
AIGC笔记--Stable Diffusion源码剖析之UNetModel
1--前言 以论文《High-Resolution Image Synthesis with Latent Diffusion Models》 开源的项目为例,剖析Stable Diffusion经典组成部分,巩固学习加深印象。...
-
变分自编码器(VAE)在AIGC中的应用及其技术解析
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
AIGC从入门到实战:落霞与孤鹜齐飞:AIGC 汹涌而来
作者:禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...
-
Llama模型家族之Stanford NLP ReFT源代码探索 (三)reft_model.py代码解析
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
51-34 DALLE2 结合预训练CLIP和扩散模型实现图像生成
今天要分享的论文是OpenAI于2022年4月出品的DALLE2,全名Hierarchical Text-Conditional Image Generation with CLIP Latents。该工作是在CLIP和GLIDE基础之上完成。 很早之前...
-
transformers 阅读:Llama 模型
正文 学习一下 transformers 库中,Llama 模型的代码,学习过程中写下这篇笔记,一来加深印象,二来可以多次回顾。 笔者小白,里面错误之处请不吝指出。 层归一化 LlamaRMSNorm transformers 中对于 Llam...
-
Llama模型家族训练奖励模型Reward Model技术及代码实战(三) 使用 TRL 训练奖励模型
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
Stable Diffusion 模型演进:LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集: 持续火爆!!...
-
pipeline-stable-diffusion.py文件逐行解释
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...
-
LightGBM实战+随机搜索调参:准确率96.67%
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...