-
ChatGPT研究(三)——AIGC多模态交互功能,奠定多场景商用基础
✏️写作:个人博客,InfoQ,掘金,知乎,CSDN ?公众号:进击的Matrix ?特别声明:创作不易,未经授权不得转载或抄袭,如需转载可联系小编授权。 前言 最近ChatGPT,想必大家已经是耳熟能详了,一度认为ChatGPT的到来是...
-
【AI绘画】Midjourney的使用及程序示例
Midjourney 1.背景 2.Midjourney的原理 3.Midjourney的使用方法 4.Midjourney的示例代码 1.背景 Midjourney 是一款基于深度学习的图像转换工具,其可以将一张图像转换成...
-
人工智能中的文本分类:技术突破与实战指导
在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。 关注TechLead,分享A...
-
如何训练一个简单的stable diffusion模型(附详细注释)
注:代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的...
-
AI画图_stable-diffusion-webui安装使用指南(1)
本文章适用于: 有一定学习能力和钻研能力,遇到问题能合理使用搜索引擎尝试解决问题的人 想在windows系统中尝试使用AI作画工具stable-diffusion-webui进行绘画的人 有一定的计算机基础(会魔法上网、知道 python和Git)和英...
-
OpenAI Whisper and ChatGPT 语音助手
OpenAI Whisper and ChatGPT ASR Gradio Web UI 一 环境准备 1.1 python 1.2 windows 二 导入所需要的包 三 加载模型 四 定义openai和whisper接口 五 生成Gra...
-
python训练ai作画的代码
你可以使用 Python 来训练一个 AI 来进行绘画。这里是一个基本的代码示例: ``` import tensorflow as tf 定义输入和输出的占位符 inputs = tf.placeholder(shape=...
-
FQS:一种神奇的数仓查询优化技术
本文分享自华为云社区《根据执行计划优化SQL【绽放吧!GaussDB(DWS 云原生数仓】》,作者:西岭雪山。 引言 如果您刚接触DWS那一定会好奇想要知道"REMOTE_FQS_QUERY" 到底代表什么意思?我们看官网的描述是代表这执行计划已经...
-
数字图像处理的图像操作
图像操作在计算机视觉和图像处理中发挥着至关重要的作用。这些操作对于诸如预处理、增强图像质量和启用高级算法等任务至关重要。在计算机视觉中,诸如调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础的。它们允许进行高效的计算、提取感兴趣区域、规范化图像...
-
Google Cloud 与 Mistral AI 合作,支持其大型语言模型在谷歌云基础设施上分发
Google Cloud 和巴黎的生成型 AI 初创公司 Mistral AI 当地时间周三联合宣布合作,允许这家初创公司在科技巨头的基础设施上分发其语言模型。 根据双方的联合声明,「根据协议,Mistral AI 将使用 Google Cloud 的...
-
Stable Diffusion - SD v1.6+ 版本导致 BLIP Interrogate CLIP (CLIP 反推) 功能 RuntimeError 异常
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132994678 图像来源于 麦橘写实_MajicMIX_R...
-
AIGC: 关于ChatGPT中对输出文本进行审核
违禁词 与 logit_bias 参数 前文,通过GPT的API实现了一个简单的聊天机器人, 当然也可以做一些内容审核相关的应用 这里有一个非常核心,需要重点关注的一个方向,就是对于文本的审核 对于一些违禁词,我们需要准确的识别出来,避免出现...
-
《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》
简介: OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字...
-
stable diffusion打造自己专属的LORA模型
通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好的Lora模型放...
-
LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘
微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...
-
Output 推出 Co-Producer:AI 驱动的 Pack Generator 为音乐制作人提供探索灵感的新途径
音乐创作软件公司 Output 今天宣布推出 Co-Producer,这是一项生成式 AI 技术,旨在增强音乐制作中的人类创造力,而非取代它。Co-Producer 的首个工具是 Pack Generator,它允许任何人通过简单的文本提示创建独特的免版税...
-
llama.cpp部署通义千问Qwen-14B
llama.cpp是当前最火热的大模型开源推理框架之一,支持了非常多的LLM的量化推理,生态比较完善,是个人学习和使用的首选。最近阿里开源了通义千问大语言模型,在众多榜单上刷榜了,是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...
-
基于LoRA微调部署Stable Diffusion【免费试用阿里云】
文章目录 Stable Diffusion介绍 环境及资源准备过程 交互式建模(PAI-DSW)的试用 在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署 下载stable-diffusion-webui开源库...
-
2023.05.10- 使用Loopback Scaler来改善Stable Diffusion的绘图效果
简介 Loopback Scaler可以添加画面细节 渣图挽救者:在图生图中对原图迭代重绘,修复渣图。脚本在多个循环中处理输入图像,每个循环提高分辨率并优化图像质量。然后,一个循环的图像结果作为下一个循环的输入图像插入,该循环不断基于已创建的内...
-
一文掌握Ascend C孪生调试
本文分享自华为云社区《一文掌握Ascend C孪生调试》,作者:昇腾CANN。 1 What,什么是孪生调试 Ascend C提供孪生调试方法,即CPU域模拟NPU域的行为,相同的算子代码可以在CPU域调试精度,NPU域调试性能。孪生调试的整体方案...
-
国内部署Stable diffusion 无法安装Gfpgan
Installing gfpgan Traceback (most recent call last : File "/Users/fufan/stable-diffusion-webui/launch.py", line 360, in <mo...
-
AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例
AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例 学习前言 源码下载地址 原理解析 一、先验知识 二、什么是inpaint 三、Stable Diffusion中的inpaint 1、开源的inpain...
-
把检测器加进来,YOLOv8部署实战!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0 把检测器加进来 本文是我在学习韩博《CUDA与TensorRT部署实战课程》第六章的课程部分输出的个人学习笔记,欢迎大家一起讨论学习! 1 导出onnx需要注意的地方 不要pip instal...
-
谷歌发布Cloud TPU v5p和AI超级计算机:人工智能处理能力飞跃
谷歌在推出其张量处理单元Cloud TPU v5p和具有突破性的超级计算机架构AI Hypercomputer时掀起了轩然大波。这些创新的发布,再加上资源管理工具Dynamic Workload Scheduler,标志着在处理组织的人工智能任务方面迈出了...
-
StableDiffusion 学习笔记 - 训练 LoRA
最近一直在学习使用 Stable Diffusion,目前开始学习 LoRA 训练,试图使用 LoRA 微调预训练模型,实现脸型替换等常用功能 最开始我跑去了 LoRA 的官方仓库,虽然找到了 lora_pti 工具,但是没有理解数据集的准备方式,翻...
-
设计师解放双手之作!3秒生成风景园林效果图,AIGC赋能景观设计
项目简介 在过去几十年,风景园林经历了从“刀耕火种”的完全手绘设计时代到当下比较流行的参数化设计时代,过去的每一轮技术革新都让风景园林作品的表现形式产生了巨大的改变。随着计算机图像技术的发展,我们有更多的建模和渲染软件辅助提升图纸表现效果,...
-
本地部署stable diffusion
计划本地部署stable diffusion,然后将其软件化为exe(始终认为用gradio属于原型开发,而不是部署落地) 1 一键安装包 目前比较主流的有秋叶包,提取码:xvro 2 代码开发 安装xformer pip install...
-
MAC搭建M1环境的stable-diffusion
MAC M1 搭建 stable-diffusion 环境 文章目录 MAC M1 搭建 stable-diffusion 环境 环境准备 1. 硬件环境 2. 系统环境 3. 基础软件环境 主要参考资料 操作步骤 1. 下载g...
-
LLM各层参数详细分析(以LLaMA为例)
网上大多分析LLM参数的文章都比较粗粒度,对于LLM的精确部署不太友好,在这里记录一下分析LLM参数的过程。 首先看QKV。先上transformer原文 也就是说,当h(heads) = 1时,在默认情况下,...
-
在 Mac M1 上运行 Llama 2 并进行训练
在 Mac M1 上运行 Llama 2 并进行训练 Llama 2 是由领先的人工智能研究公司 Meta (前Facebook)开发并发布的下一代大型语言模型 (LLM 。 它基于 2 万亿个公共数据 token 进行了预训练,旨在帮助开发人员和...
-
语言模型:GPT与HuggingFace的应用
本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。 受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型...
-
【AI绘画】Stable Diffusion的介绍及程序示例
Stable Diffusion 1.背景 2.StableD 的原理 3.StableD 的应用 3.1.如何使用 StableD 进行图像生成 3.2 图像生成与编辑 3.2.1 生成新图像 3.2.2 图像编辑 1.背...
-
Stable diffusion LoRA 训练过程
1、使用diffusers-0.14.0, stabel-diffusion 模型 v-1.5版本 下载diffusers-0.14.0 并解压,新建文件test.py, 写入以下: import torch from diffusers impor...
-
Stable Diffusion 插件开发基础讲解
近来Stable diffusion扩散网络大热,跟上时代,简单的文生图,图生图,其实可以满足绝大多数设计师的应用,但是有什么是赛博画手无法做到的呢? 那就是他们使用到的stable diffusion的插件开发,他们并不清楚stable diffusin...
-
【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(三)
文章目录 源码资源下载 Python环境 试玩controlnet 训练 数据准备 选一个Stable diffusion模型 开始训练 第一篇:https://qq742971636.blog.csdn.net/article/...
-
打造AI虚拟数字人,Stable Diffusion+Sadtalker教程
站长笔记 2 个月前 1 1k 如何使用Stable Diffusion整合Sadtalker Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU...
-
使用 LoRA 进行 Stable Diffusion 的高效参数微调
LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术,主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...
-
一种平价的chatgpt实现方案,基于清华的 ChatGLM-6B + LoRA 进行finetune.(aigc大模型风口,校招找工作必备)
** 清华大学的chatglm-6b开源模型对话能力虽然能基本满足对话需求,但是针对专业领域和垂直领域回答显得智商捉急,这个时候就需要进行微调来提升效果,但是但是同学们显卡的显存更捉急,这时候一种新的微调方式诞生了,现在大火的ai作画里面的lora训练方式...
-
首超人类专家!OpenAI“混乱”之际,谷歌多模态大模型Gemini“大杀四方”
在OpenAI“混乱”之际,Google准备“大杀四方”。 就在昨日晚间,Google 和 Alphabet CEO Sundar宣布Gemini上线,并称之为“我们规模最大、能力最强的 AI 模型”,语惊四座。 Gemini的关键词是“多模态”,Go...
-
Stable Diffusion:开启AI魔法绘画的无限可能
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能技术的蓬勃发展,图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中,St...
-
Stable Diffusion WebUI使用AnimateDiff插件生成动画
AnimateDiff 可以针对各个模型生成的图片,一键生成对应的动图。 配置要求 GPU显存建议12G以上,在xformers或者sdp优化下显存要求至少6G以上。 要开启sdp优化,在启动参数加上--sdp-no-mem-attention 实...
-
大模型LLaMA和微调LLaMA
1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens,和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化 与Transf...
-
Stable-Diffusion 在线部署
Stable-Diffusion 在线部署 1. 注册 链接:https://aistudio.baidu.com/aistudio/newbie?invitation=1&sharedUserId=4982053&sharedUs...
-
stable-diffusion使用openpose报错
依据教程 : https://post.smzdm.com/p/awz2l2xg/ 使用 stable-diffusion教学之ControlNet+lora换脸 报错: urllib.error.URLError: <urlopen er...
-
Github Copilot Chat的规则泄露,详细分析这31条规则
GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它是一种基于机器学习的代码自动完成工具,旨在帮助开发人员更高效地编写代码。 GitHub Copilot Chat是GitHub Copilot的一部分,...
-
如何使用ChatGPT给出MidJourney提示-【秘密武器】
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...
-
AI实战营:生成模型+底层视觉+AIGC多模态 算法库MMagic
目录 环境安装 黑白照片上色 文生图-Stable Diffusion 文生图-Dreambooth 图生图-ControlNet-Canny 图生图-ControlNet-Pose 图生图-ControlNet Animation 训...
-
stable-diffusion基础问题记录
一、windows安装 1、启动 如果自己是anaconda,python版本不是3.10.6 conda create -n python_3_10_6 python=3.10.6,创建一个这样的环境 修改webui-user.bat set P...
-
在m1/m2芯片的mac电脑上运行Stable Diffusion的全步骤
最近开源社区里最火的项目肯定有Stable Diffussion一个席位。作为一个AI通过文本描述绘画的开源项目,其优秀的生成结果和极快的生成速度也让它在AI绘画项目中一夜封神。 不过遗憾的是,这类AI项目要在苹果公司的自研芯片m1/m2上运行有点麻...
-
StableDiffusion模型发展历史
参考资料: 相应的github和huggingface LDM [github] StableDiffusion v1.1 ~ v1.4 [github] [huggingface] StableDiffusion...