-
stable-diffusion 预训练模型汇总
目前各个github上各个库比较杂乱,故此做些整理方便查询 Stable UnCLIP 2.1 New stable diffusion finetune (Stable unCLIP 2.1, Hugging Face at 768x768 re...
-
stable-diffusion官方版本地复现手册(2023年4月10日)
stable diffusion v1.4官方版(CompVis)本地复现手册 主页:https://github.com/wjxpro 邮箱:804359553@qq.com 文章目录 **stable diffusion v1...
-
midjournery AI绘画使用指南
midjournery AI绘画使用指南 基于Discord的Midjournery配置: https://www.bilibili.com/video/BV16d4y1A7Zq/?spm_id_from=333.337.search-card.a...
-
AI专业教您保姆级在暗影精灵8Windows11上本地部署实现AI绘画:Stable Diffusion(万字教程,多图预警)
目录 一、Stable Diffusion介绍 二、Stable Diffusion环境搭建 1.Anaconda下载与安装 2.Pycharm(IDE)下载与安装 3.CUDA、CuDNN下载与安装 三、Stable Diffusion...
-
华人团队获最佳论文、最佳系统论文,CoRL获奖论文出炉
自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。 2023 年的 CoRL 大会...
-
LoRa模型训练教程(炼丹,Stable Diffusion)
1. lora介绍(Low Rank Adaption) 何为LoRA?LoRA并不是扩散模型专有的技术,而是从隔壁语言模型(LLM)迁移过来的,旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖,比如最近新出...
-
Stable Diffusion 本地部署教程
1.前言: 最近看Stable Diffusion开源了,据说比Disco Diffusion更快,于是从git上拉取了项目尝试本地部署了,记录分享一下过程~ 这里是官网介绍:https://stability.ai/blog/stable-diffu...
-
各种文字生成图片的AIGC模型(openAI、谷歌、stable、Midjourney等)
1 前言 AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、视频等。 本文主要描述文字生成图片的模型。而且目前扩散模型(Diffusion Models)流行,所以下...
-
【原创】用 VisualGLM 进行AIGC多模识别和内容生成
最近几个月,整个AI行业的LLM(大语言模型)蓬勃发展,除了过去传统的纯文字的多模态能力的视觉语言模型,如 GPT-4,ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日,智谱...
-
Stable-diffusion安装时Can‘t load tokenizer for ‘openai/clip-vit-large-patch14‘问题解决
Can’t load tokenizer for 'openai/clip-vit-large-patch14’问题解决. 如果你在安装stable-diffusion的时候遇到了这个问题,可以下载本博客的绑定资源,然后修改项目中的文件地址就可以了。...
-
【AIGC】Baichuan2-13B-Chat模型微调
环境 微调框架:LLaMA-Efficient-Tuning 训练机器:4*RTX3090TI (24G显存 python环境:python3.8, 安装requirements.txt依赖包 一、Lora微调 1、准备数据集 2、训...
-
ai图片合成要如何操作?看完这篇就知道ai绘画怎么弄了
看看这些图片,是不是很想拿去当头像啊!你们知道这些照片是怎么做的吗?想自己创作出这么好看的头像吗?你听说过ai绘画技术吗?今天我就为大家介绍ai绘画技术是什么,ai图片合成怎么做。话不多说,直接进入正题吧! 合成方法一:利用starryai合...
-
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。 如何让机器像人类...
-
stable diffusion API 调用,超级详细代码示例和说明
本文主要介绍 stable diffusion API 调用,准确来说是对 stable diffusion webui 的 API 调用。接口文档可以查看: http://sd-webui.test.cn/docs 这里的 sd-webui...
-
AI绘图风格对照表/画风样稿详细研究记录及经验总结(分析Midjourney和Stable Diffusion风格提示词实际使用情况)不断更新中...
作为AI绘图头牌的Midjourney和Stable Diffusion,其风格提示词都相同 Midjourney是收费的在线服务,通过discord对话形式来生图,局限较大,但由于官方模型做得好,因此效果非常完美; Stable Diffusion...
-
来聊聊近期火爆的几个大模型和自动驾驶概念
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近期大模型各种应用依然火爆,10月初前后出现了一系列颇有噱头的文章,试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题,写这篇文章,一方面是发现其实包括我在内,在过去其实都混淆了一些很相关...
-
【AI绘画】《超入门级教程:训练自己的LORA模型》,MM超爱的萌宠图片实战
目录 前言 一、SD-Trainer webui使用介绍 二、准备工作 2-1、登录在线训练平台 2-2、购买算力并创建工作空间 2-3、启动工作空间 三、开始训练 3-1、打开终端 3-2、准备训练数据 3-3、准备模型文件 3-3-...
-
〔021〕Stable Diffusion 之 提示词反推、自动补全、中文输入 篇
✨ 目录 ▷ 反推提示词 / Tagger ▷ 反推提示词 Tagger 使用 ▷ 英文提示词自动补全 / Booru tag ▷ 英文提示词自动补全 Booru tag 使用 ▷ 中文提...
-
打开stable diffusion webui时,提示缺少clip或clip安装不上的解决方案(windows下的操作)
1.问题描述 打开stable diffusion webui时,提示缺少clip或clip安装不上 2.解决方案 原因:stable diffusion webui环境中的clip其实是open_clip,不能用pip install clip...
-
【AI画画教程】无整合包使用LoRA和Dreambooth训练全流程详解(Linux)
前言 本教程遵循简单原则,不使用任何民间整合包。 目前很多AI画画训练整合包臃肿复杂,教程也是名词乱炖,容易对初学者造成理解误差和使用困难。因为许多整合包都依赖于sd-scripts库,它自身就能支持绝大多数的训练场景,学会这个后,自己也可以根据自己...
-
北大具身智能团队提出需求驱动导航,对齐人类需求,让机器人更高效
如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑真实环境,当要求机器人找某个特定的物品时,这个物品不一定真的存在当前的环境内,机器人无论如何也找不到;但是环境当中是不是可能存在一个其他物品,它和用户要求...
-
AIGC专栏7——EasyPhoto 人像训练与生成原理详解
AIGC专栏7——EasyPhoto 人像训练与生成原理详解 学习前言 源码下载地址 为什么是Lora EasyPhoto的训练流程 1、数据的预处理 a、人像排序 i、人脸特征向量提取过程 ii、人脸偏移角度计算 iii、人像排序 b...
-
LLMs:LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微
LLMs:LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】 的简介、...
-
Stable Diffusion WebUI linux部署问题
当我部署好环境后,准备大张旗鼓开搞时,进入项目地址运行python launch.py后发现 下面连接着的报错是 OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'....
-
【AI绘画--七夕篇】:如何训练Lora模型打造令人惊叹的AI绘画
目录 前言 一、? 选择合适的云端平台 1-1、云端平台的优势 1-2、选择适合的云端平台 二、? 账号注册 三、? 开始炼丹 3-1、购买算力并创建工作空间 3-2、启动工作空间 3-3、应用市场一键安装 四、? 使用Stable-D...
-
万字长文解读Stable Diffusion的核心插件—ControlNet
目录 一、介绍 二、使用方法 三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.S...
-
带你认识一下多模态对比语言图像预训练CLIP
本文分享自华为云社区《多模态对比语言图像预训练CLIP:打破语言与视觉的界限》,作者:汀丶。 一种基于多模态(图像、文本)对比训练的神经网络。它可以在给定图像的情况下,使用自然语言来预测最相关的文本片段,而无需为特定任务进行优化。CLIP的设计类似于GP...
-
Stable Diffusion Lora模型训练详细教程
1. 介绍 通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好...
-
大数据项目实战——基于某招聘网站进行数据采集及数据分析(一)
大数据项目实战 第一章 项目概述 文章目录 大数据项目实战 第一章 项目概述 学习目标 一、项目需求和目标 二、预备知识 三、项目架构设计及技术选取 四、开发环境和开发工具介绍 五、项目开发流程 总结 学习目标 掌...
-
How To Debug PHP Code And Useful PHP Debugging ...
PHP does not have an internal debugging facility. You can use only external tools to debug PHP code. Here i tried to list down P...
-
初识PHP(1):PHP是什么
PHP,Hypertext Preprocessor,翻译过来就是超文本预处理器,是一种在服务器上执行的脚本语言。 PHP可以做什么? 那么为什么在HTML,CSS的基础上,还需要PHP呢? 前2者在为我们提供静态页面内容的时候,PHP可以为我们...
-
SpringCloud 分布式日志采集方案
前言 由于微服务架构中每个服务可能分散在不同的服务器上,因此需要一套分布式日志的解决方案。spring-cloud提供了一个用来trace服务的组件sleuth。它可以通过日志获得服务的依赖关系。 基于sleuth,通过使用ELK(elasti...
-
python爬虫代码运行_怎么运行python爬虫程序
python爬虫程序运行有两种方式:1、在python交互式命令行下直接输入python代码回车运行;2、在命令行中使用“python 文件名.py”。 python运行有两种方式,一种是在python交互式命令行下运行;另一种是使用文本编...
-
Windows上的音频采集技术(转)
转自:http://shanewfx.github.io/blog/2013/08/14/caprure-audio-on-windows/ 前一段时间接到一个任务,需要采集到声卡的输出信号,以便与麦克风的输入信号进行混音。 之前一直没有研究过音频的相关...
-
python爬虫:爬取某网站视频
把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载。(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import BeautifulSoup import reques...
-
ELK日志采集
ELK 即 Elasticsearch、Logstash、Kibana,组合起来可以搭建线上日志系统,在目前这种分布式微服务系统中,通过 ELK 会非常方便的查询和统计日志情况. 本文以 pigx 的 upms 模块为例 ELK 中各个服务的作用...
-
AI水印能解决生成式AI的信任问题吗?
随着生成AI技术的飞速发展,人们越来越难以区分AI生成的内容和人工生成的内容。这一挑战引发了一个重要问题:数字水印技术是否能帮助人类重新获得对内容的控制? 数字水印是一种类似于纸币上的水印,它被认为是不可改变的内容附加物,用来指示其来源或出处。最近,美国总...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头
AI黑盒如何才能解? 神经网络模型在训练的时,会有些ReLU节点「死亡」,也就是永远输出0,不再有用。 它们往往会被被删除或者忽略。 恰好赶上了模糊了生与死的界限的节日——万圣节,所以这是探索那些「死节点」的好时机。 对于大多数图像生成模型来说,会输出正...
-
Luma AI发布Discord机器人Genie,实现文本生成3D模型
硅谷初创公司 Luma AI 专注于将 AI 技术与3D 内容相结合,例如从智能手机视频中生成 NeRF 或其他3D 格式。现在,该公司发布了一个名为 Genie 的 Discord 机器人,用于生成文本到3D。 它可以从文本提示中生成3D内容,并在约20...
-
微软发布Windows 11重大更新 人工智能助手Copilot来了
11月1日消息,美国时间周二,软件巨头微软发布了个人电脑操作系统Windows 11的重大更新版本。其中包含了名为Copilot AI的人工智能助手,与人工智能研究公司OpenAI的热门聊天机器人ChatGPT有许多相似之处。 据了解,微软Copilo...
-
使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习
强化学习(RL 是一种机器学习方法,它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励,因采取行动导致预期结果而受到惩罚。随着时间的推移,代理学会采取行动,使其预期回报最大化。 RL代理通常使用马尔可夫决策过程(MDP ...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩
鹅厂大模型,又有新玩法! 发布不到两个月,腾讯混元大模型就速通了一个新版本,除了语言模型升级以外,还悄悄上线了AIGC最火热?的功能—— 文生图。 和语言模型一样,文生图同样可以通过微信小程序直接体验。 不过与Midjourney独立出图不同,混元的文生...
-
生成式人工智能如何重新定义图像搜索
译者 | 李睿 审校 | 重楼 近几个月来,生成式人工智能凭借其创造独特的文本、声音和图像的能力引起了人们的极大兴趣。但生成式人工智能的力量并不局限于创造新的数据。 生成式人工智能的底层技术(例如Transformer和扩散模型)可以为许多其他应用提供...
-
苹果“套娃”式扩散模型,训练步数减少七成!
苹果的一项最新研究,大幅提高了扩散模型在高分辨率图像上性能。 利用这种方法,同样分辨率的图像,训练步数减少了超过七成。 在1024×1024的分辨率下,图片画质直接拉满,细节都清晰可见。 苹果把这项成果命名为MDM,DM就是扩散模型(Diffusion...
-
解读OpenAI最强文生图模型—DALL·E 3
Midjourney、Stable Difusion在商业变现和场景化落地方面获得了巨大成功,这让OpenAI看到了全新的商机,也是推出DALL·E3的重要原因之一。 上周,OpenAI宣布在ChatGPT Plus和企业版用户中,全面开放文生图模型DAL...
-
HiLM-D:自动驾驶多模态大语言模型玩出花了
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人的一些思考 不得不说,最近大模型在学术界火起来了,基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外,大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...