-
Stable Diffusion最强功能—— 图片背景完美替换
今天分享 Stable Diffusion 图片背景完美替换 功能,通过 Stable Diffusion 图生图重绘蒙版进行背景图的二次重绘。 在广告产品图、头像背景替换、图片后期处理等场景下用到的都很频繁。 整体步骤: 通过 removebg...
-
从零预训练一个tiny-llama#Datawhale组队学习Task2
完整的教程请参考:datawhalechina/tiny-universe: 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe (github.com 这是Task2的学习任务 目录 Qwen-blog Tokenizer(分词器...
-
AIGC:Flux.1 NF4 使用 diffusers 推理
背景介绍 Flux 参数量很大 (包括 ext encoder2, autoencoder, 以及 diffusion model , 使用Diffusers推理,显存占用 30GB。 有大佬做了 NF4 版本,效果依旧能打。所以本文使用 diffu...
-
AIGC提示词(3):AI的创造力之谜:相同提示词,不同内容
引言 在这个数字化的时代,人工智能生成内容(AIGC)已经变得无处不在。想象一下,只需输入几个关键词,AI就能创作出各种内容,无论是文字、图片,还是其他形式。但这里有个有趣的问题:如果我们给AI相同的提示词,它们生成的内容会一样吗?这个问题触及了AI内...
-
DataWhale Task02:从零预训练一个tiny-llama 20923
DataWhale Task02:从零预训练一个tiny-llama 20923 原文link:https://github.com/KMnO4-zx/tiny-llm 开源内容:https://github.com/datawhalechina/t...
-
128 深入解析Llama Index的响应合成生成 llamaindex.core.response_synthesizers.generation.py
深入解析Llama Index的响应合成生成 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的生成器模块(Generation),并通过详细的代码示例和技...
-
ComfyUI系列教程(4)--ComfyUI基础节点LoRA
ComfyUI基础节点LoRA 2. ComfyUI基础节点 2.1. LoRA 2.1.1.LoRA原理 2.1.2.LCM-LoRA 2.1.3.ComfyUI示例 2. ComfyUI基础节点 本文主要介绍LoRA模...
-
Learning Multi-dimensional Human Preference for Text-to-Image Generation
Paper name Learning Multi-dimensional Human Preference for Text-to-Image Generation Paper Reading Note Paper URL: https://arx...
-
【Stable Diffusion 炼丹教程】Text Inversion: 比 Lora 更简单地训练人脸
前言 Stable Diffusion的最大魅力体现在其DIY的能力上。它不是什么图都能画出来,但是我们可以根据自己的需求,训练它成为我们想要的样子。 其中,Text Inversion 就是一种最简单有效的训练方式。它比 Lora 训练更简单,对数...
-
11、LLaMA-Factory自定义数据集微调
1、数据集定义 针对实际的微调需求,使用专门针对业务垂直领域的私有数据进行大模型微调才是我们需要做的。因此,我们需要探讨如何在LLaMA-Factory项目及上述创建的微调流程中引入自定义数据集进行微调。**对于LLaMA-Factory项目,目前...
-
AI作画提示词(Prompts)工程:技巧与最佳实践
GPT-4o (OpenAI AI 作画提示词(prompts)工程可以极大地提高生成图像的质量和细节表现。以下是一些技巧和最佳实践,以帮助你优化提示词的使用: 一、明确的描述 1. 具体化:明确描述你想要的元素和风格。例如,“一只在森林中奔跑的狼”比...
-
Stable Diffusion绘画 | ControlNet应用-Inpaint(局部重绘):更完美的重绘
Inpaint(局部重绘 相当于小号的AI版PS,不但可以进行局部画面的修改,还可以去除背景中多余的内容,或者是四周画面内容的扩充。 预处理器说明 Inpaint_Global_Harmonious:重绘-全局融合算法,会对整个图片的画面和色调均有...
-
每日AIGC最新进展(55):清华大学提出Pose引导视频生成模型、佐治亚理工学院提出消除扩散模型中的偏见影响、卡耐基梅隆大学提出多物体控制视频生成模型
Diffusion Models专栏文章汇总:入门与实战 GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models 在这项研究中,我们介绍了一个名为G...
-
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大语言模型还能向上突破,OpenAI 再次证明了自己的实力。 北京时间9月13日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记及心得
从零入门AI生图原理&实践是Datawhale 2024年AI夏令营第四期“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 主要是通过对模型的微调,以及对prompt的调整,可以根据要求生成不同...
-
利用Stable Diffusion AI图像模型评估智能车模型算法表现(下篇)
今天小李哥将介绍亚马逊云科技的Jupyter Notebook机器学习托管服务Amazon SageMaker上,通过AI图像生成模型Stable Diffusion Upscale和Depth、向量知识库和LangChain Agent,生成用于AI 智...
-
#Datawhale X 魔搭 AI 夏令营# AIGC文生图 Task2
1. 什么是AI生图 一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说,AI生图模型获得图片生成能力主要是通过 学习 图...
-
AI终于会画手了,Flux.1一出世就直接碾压Stable Diffusion(SD)和Midjourney(MJ)
Flux.1模型一发布,AI文生图终于会画手了,Flux.1模型比Stable Diffusion(SD)和Midjourney(MJ)更能将手部和长文本生成得更好更合理。 Flux.1模型生成的图,现在手部不再有畸形了。 同时,画面质感堪比Mid...
-
使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意
引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere...
-
中国图象图形学学会、蚂蚁集团、CSA大中华区等发起全球AI攻防挑战赛
9月6日上午,在2024Inclusion·外滩大会“以AI守护AI 大模型时代的攻守之道”论坛上,国内首个大模型攻防主题的科技赛事—“全球AI攻防挑战赛”宣布正式启动。该赛事聚焦AI大模型产业实践,设计了攻、防双向赛道,邀请各路白帽黑客、技术人才分别进行...
-
107 深入解析Llama Index的响应合成器 llamaindex.core.response_synthesizers.facotry.py
深入解析Llama Index的响应合成器 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的一个关键组件——响应合成器(Response Synthesi...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
本地搭建Stable Diffusion,文生图再也不用求别人了!
前言 本地搭建Stable Diffusion,文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型,用于生成高质量的图像。它基于一种名为扩散过程的生成方法,能够在给定条件的情况下生成具有丰富细节的图像。...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...
-
AI数据告急,大厂盯上廉价年轻人
为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。 坐落于北京大钟寺的字节办公楼,集中了字节的抖音业务团队和火山引擎业务团队,从年初便开始招募素人为豆包大模型录音。两人结组、单次3小时,包...
-
他在淘宝开了个AI店铺,投入几百就能月入过万?
昨天朋友给我发了一个店铺,说有人用AI在淘宝做一个很奇特的业务,有点猎奇,但是又非常稳定的月入过万。 就是用AI生成还没出生的宝宝长相。 你只要把你在医院拍的宝宝的四维彩超图,发给店家,然后店家用AI模型生成一张"未来宝宝照",给你看看你的宝宝生下来以后长...
-
【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起
前不久,Meta开源了LLaMA 3.1 405B【1】,模型扩展了上下文长度至 128K,支持八种语言,效果非常惊艳,是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型,已经赶上截至目...
-
精通 Stable Diffusion 调优秘籍
一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具,其调优具有至关重要的意义。通过合理的调优,可以显著提升图像生成的质量、速度和准确性,满足用户更加多样化和精细化的需求。 调优主要涵盖了...
-
开源项目:Stable Diffusion Prompt Reader 教程
开源项目:Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器,用于在Web UI外部读取...
-
超算互联网活动实操教程(stable-diffusion-3-medium-diffusers)
🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型
OpenAI的下一代旗舰大语言模型,要来了? 据悉,新模型代号Orion(猎户座),就是能超越GPT-4的下一代模型。 而猎户座的预训练数据,正是由草莓模型生成的。 而草莓模型驱动的聊天机器人,很可能就会在今年秋天上线! 关于OpenAI的草莓,外媒The...
-
突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!
OpenAI不藏了,终于展示江湖流传已久的秘密项目“草莓”(Strawberry)和猎户座(Orion 。 根据Theinformation消息,OpenAI已经向美国国家安全官员展示了草莓这个秘密项目,保证会在安全、合理的范围内来开发和使用。同时Open...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 2 震惊!!!AI小白竟然用AI生成这种图片......
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一.问题的提...
-
#Datawhale AI夏令营第4期#AIGC方向 文生图 Task2
Task2任务:对baseline的代码有一个更加细致的理解,然后学习如何借助AI来提升我们的自学习能力. 前沿知识:了解一下 AI生图技术 的能力&局限 AI生图技术,通常指的是使用人工智能(尤其是深度学习)来生成图像的技术。这类技术可以用于...
-
微调LLama 3.1——七月论文审稿GPT第5.5版:拿早期paper-review数据集微调LLama 3.1
前言 为更好的理解本文,建议在阅读本文之前,先阅读以下两篇文章 七月论文审稿GPT第2版:用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4 提升大模型数据质量的三大要素:找到早期paper且基于GPT摘要出来7方面revi...
-
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
🔍在之前AIGC助力ResNet分类任务:跃升10个百分点-CSDN博客文章中,提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强,再进行分类任务,精度上升。 📕而今天要聊到的这篇论文更全面地探究了扩散模型...
-
“Datawhale X 魔搭” AI夏令营第四期:AIGC方向——Task2&Task3
背景介绍 AIGC技术 AIGC(AI-Generated Content 是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。例如,通过输入关键词、描述或样本...
-
Stable Diffusion【Pony模型】【2.5D模型】:细腻画质&可爱韩版风格的大模型Speciosa 2.5D
大家好我是安琪!!! Stable Diffusion是一款前沿的AI图像生成技术,它能够根据提示词创造出极具艺术感的图像。本文将探讨如何利用Stable Diffusion的图生图功能和局部重绘(手涂蒙版)技术,为您的艺术创作带来全新的创意和个性化表达...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
小爱大模型来了!9款无屏小爱音箱推送新系统:免费用
快科技8月23日消息,上个月,小米宣布小爱大模型将迎来全量升级,全部免费。 据悉,小爱升级大模型之后会更聪明,比如支持智能问答功能,并能够根据用户要求创作等等,甚至闲聊的体验都能大幅升级。 根据官方公布的时间表,7月底是手机、平板、电视等升级,而8月底无屏...
-
【AI绘画】Midjourney前置指令/settings设置详解
文章目录 💯Midjourney前置指令/settings设置详解 💯Use the default model(AI绘画所使用的大模型) Midjourney Model(Midjourney 模型) Niji Model(Niji模型)...
-
一文搞定大模型备案
《生成式人工智能服务安全基本要求》背景 1.1.基本要求对应的流程和介绍 "生成式人工智能服务安全基本要求"是针对"生成式人工智能(大语言模型)上线备案"流程制定的标准,这一流程也被称作"大模型上线备案"。这是继"生成合成(深度合成)类算法备案"之...
-
MagicClothing: 给人物照片换装的ComfyUI工作流(干货满满)
前言 在试验了各种ComfyUI 工作流,换了3台电脑,失败了无数次之后,终于又一次跑通了ComfyUI。 接下来会分享跑成功的各种ComfyUI工作流。 今天就拿给人物换装的新出来的这个做一个样本。 上一次文章提到给人物换装的模型[OOTDiff...
-
RWKV 发布中文小说模型,也擅长角色扮演!
大家好,RWKV 近期发布了 “RWKV-6-ChnNovel” 系列中文小说模型 。 相较于 RWKV-6 基底模型, RWKV-6-ChnNovel 中文小说模型在小说续写、小说扩写方面有非常好的效果。 不仅如此,使用 RWKV 小说模型进行角色扮...
-
一键收藏!5组 Stable Diffusion 常用人物提示词!
Stable Diffusion 是近年来最火的 AI 绘画工具之一,能够生成高质量的图片。想要使用 Stable Diffusion 生成人物图片,需要使用人物提示词来引导模型生成想要的效果。 以下是 5 组常用的 Stable Diffusion 人...
-
Datawhale AI夏令营第四期 AIGC方向 task02 初学者笔记
一、Prompt工程介绍:1、概念: Prompt工程,也称为提示工程或指令工程,是在自然语言处理(NLP)领域中一种重要的技术和方法。它主要用于指导预训练的大规模语言模型(Large Language Models, LLMs)生成高质量、准确且有针对...
-
Datawhale X 魔搭 AI夏令营–AIGC Task1
Datawhale X 魔搭 AI夏令营–AIGC Task1 文章目录 Datawhale X 魔搭 AI夏令营--AIGC Task1 赛事介绍 文生图基础知识介绍 实践操作 step0:开通阿里云PAI-DSW试用 step1...
-
清华唐杰团队新作:一口气生成2万字,大模型开卷长输出
一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同问题下,输出结果直接从1800字增加到7800字,翻4倍。 要知道,目前大模型的生成长度普遍在2k以下。这对于内容创作、问...
-
【Datawhale AI夏令营第四期】魔搭-AIGC方向 Task01笔记
报名参加了和鲸的AI夏令营,出于任务要求,也出于我一贯的学习习惯,写篇笔记记录一下自己学习过程中遇到的困难,和积累的资源、经验等。 课程链接: https://space.bilibili.com/1069874770/channel/collect...