-
stable-diffusion 3 体验部署流程(ComfyUI)
环境准备 下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints: sd3_medium_incl_clips.s...
-
llama-factory-0.7.0微调llama3-8B-Instruct-262k
1.摘要 用llama-factory-0.7.0微调Llama-3-8B-Instruct-262k,微调数据是1.5k的论文审稿。 GPU配置是A40. 用llama-factory的0.7.1版本微调Llama-3-8B-Instruct-26...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...
-
whisper使用
whisper使用 1. 直接调用 语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...
-
五分钟上手IoT小程序
五分钟上手IoT小程序 IoT小程序框架 搭建开发环境 首先安装NodeJs 安装NodeJs 验证安装成功 安装cnpm 安装VSCode 开发IDE 下载开发IDE 安装开发IDE 安装框架脚手架 下载模拟器 创建工程项目 应用...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
Meta Llama 3 性能提升与推理服务部署
利用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能 我们很高兴地宣布 NVIDIA TensorRT-LLM 支持 Meta Llama 3 系列模型,从而加速和优化您的 L...
-
爬虫概念、基本使用及一个类型和六个方法(一)
目录 一、爬虫简介 1.什么是爬虫 2.爬虫的核心 3.爬虫的用途 4.爬虫的分类 5.反爬手段 二、Urllib基本使用 1.导入我们需要的包 2.定义一个url 3.模拟浏览器向服务器发送请求 4.获取响应中的页面的源码 5....
-
element 树组件 tree 横向纵向滚动条
Html <el-card shadow="hover" > <div slot="header" class="clearfix">...
-
【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents
文章目录 一、前言 (一)DALLE2 简介 (二)DALLE2和DALLE的对比 (三)相关模型推出时间 二、文章概要 (一)标题 (二)摘要 (三)引言 (四)模型架构 三、方法 (一)图像生成的相关工作 (二)diffusion...
-
51-34 DALLE2 结合预训练CLIP和扩散模型实现图像生成
今天要分享的论文是OpenAI于2022年4月出品的DALLE2,全名Hierarchical Text-Conditional Image Generation with CLIP Latents。该工作是在CLIP和GLIDE基础之上完成。 很早之前...
-
Meta-Llama-3-8B-Instruct本地推理
Meta-Llama-3-8B-Instruct 本地推理 基础环境信息(wsl2安装Ubuntu22.04 + miniconda) 使用miniconda搭建环境 (base :~$ conda create --name pyto...
-
【V831】智能语音对话:语音识别、文心一言回答、语音合成
1、实验设备 01科技的V831 2、总体概述 按下按键,蓝灯亮起,开始定时录音,录音结束,蓝灯熄灭。接着,通过百度的语音识别API进行语音转文字,得到文字后通过百度的文心一言API进行回答,得到的回答通过百度的语音合成API把回答的文字合成为音...
-
Web 安全之点击劫持(Clickjacking)攻击详解
目录 什么是点击劫持攻击? 点击劫持攻击的原理 点击劫持攻击的危害 点击劫持攻击防范措施 小结 在当今数字化时代,网络安全问题日益凸显,各种网络攻击手段层出不穷。点击劫持(Clickjacking)攻击作为一种常见的网络攻击手段,对用户的...
-
springboot+vue项目接入文心一言API
参考文心一言ERNIE-Bot 4.0模型流式和非流式API调用(SpringBoot+OkHttp3+SSE+WebSocket - autunomy - 博客园 (cnblogs.com 后端 引入依赖 <dependency>...
-
Spring Boot后端调用文心一言响应式问答
Spring Boot后端调用文心一言响应式问答 1.获取文心服务 要在我们的后端服务中接入文心一言,就要获取文心的服务,首先我们要进入百度智能云中注册一个账号:https://console.bce.baidu.com/qianfan/ais/...
-
Stable Diffusion原理
一、Diffusion扩散理论 1.1、 Diffusion Model(扩散模型) Diffusion扩散模型分为两个阶段:前向过程 + 反向过程 前向过程:不断往输入图片中添加高斯噪声来破坏图像 反向过程:使用一系列马尔可夫链逐步将噪声还原...
-
【Python】我的第一个文心一言API调用
文章目录 前言 一、注册百度千帆大模型平台 1、注册账号,注册时按个人或企业选择创建 2、创建应用 3、明确模型收费规则 二、Python调用模型 1、找到对应调用方法 2、查看默认调用文档 3、选择python对应方法 2、标准结果显示...
-
Stable Diffusion AI绘画:绘画参数与原理全攻略参上!千万别错过!
一、基础模型和外挂VAE模型 Ⅰ. 基本术语讲解 基础模型(大模型/底模型):属于预调模型,它决定了AI图片的主要风格。 VAE模型:全称Variational auto enconder变分自编码器,它类似于图片生成后的滤镜。 “基础模型”和...
-
Stable Diffusion【写实模型】:逼真,逼真,超级逼真的国产超写实摄影大模型万享XL
今天和大家分享的是一个国产万享系列中使用量最高的大模型:万享XL_超写实摄影,顾名思义,该大模型主要是面向写实摄影,一方面生成的图片人物皮肤纹理细节超级逼真,另一方面对于光影效果的处理也非常到位。 对于万享XL超写实摄影大模型,不同的版本参数设置是不一样...
-
【Stable Diffusion】:SDXL1.0大模型的发布给SD带来全新的使用体验
1.Stable Diffusion XL模型是什么? SDXL是stabilityai公司推出的最新的图像大模型,可以使用stable diffusion生成Ai图像,SDXL模型与之前的Stable Diffusion v1-v2.1模型相比,使用...
-
运行stable-diffusion出现的问题(1)
Checkout your internet connection or see how to run the library in offline mode at ‘https://huggingface.co/docs/transformers/ins...
-
stable diffusion官方版本复现
踩了一些坑,来记录下 环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程 按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...
-
Windows部署语音转文字项目_Whisper
Windows部署语音转文字项目_Whisper 一、前置安装准备 Github源仓库,Whisper 下载安装whisper及其依赖项 官方有两种部署方法,一种是通过默认pip源拉取安装: 以管理员身份运行powershell,输入如下命令p...
-
人工智能学习笔记(2):认识和安装Stable Diffusion
人工智能学习笔记(2):认识和安装Stable Diffusion 文章目录 人工智能学习笔记(2):认识和安装Stable Diffusion Stable Diffusion的起源和发展历程 Stable Diffusion的应用...
-
Stable Diffusion | Gradio界面设计及ComfyUI API调用
本文基于ComfyUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL,Stable Cascade),Lora,ControlNet,图生视频(SVD_xt_1_1),图像修复(FaceDeta...
-
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码:绝对位置、相对位置、旋转位置编码
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 文章目录 [从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...
-
02:从文生图初窥Stable Diffusion,一键玩转AI绘画
前言 Stable Diffusion是一个什么架构呢,或者说是由哪些部分构成,各自发挥着怎么样的作用。我们就先从文生图开始探索 文生图 我们打开Stable Diffusion的webui,然后选择Stable Diffusion模型,然后选择...
-
一文解读:Stable Diffusion 3究竟厉害在哪里?
知乎原文:叫我Alonzo就好了 前言 最近一段时间,正当所有人都在为OpenAI发布Sora狂欢时,Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...
-
AI生图格局大震!Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
重磅消息!Stable Diffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构,将彻底改变AI生图的格局。现在,全体AI社区都在翘首以盼。 万众瞩目...
-
Stable Diffusion webUI 最全且简单配置指南
Stable Diffusion webUI 配置指南 本博客主要介绍部署Stable Diffusion到本地,生成想要的风格图片。 文章目录 Stable Diffusion webUI 配置指南 1、配置环境 (1)pip环境[...
-
Java对接文心一言
注册千帆大模型 首先就是注册百度的千帆大模型平台,第一次注册会送一张20元的优惠卷,可以用这个先免费用一段时间。 创建应用 目的:获得APIKey和SecretKey 注册以后进入到百度智能云控制台应用接入(百度智能云控制台 (baidu.com ...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 课程文档:Llama3-Tutorial/docs/llava.md at main · Smart...
-
LLMs之Llama3:基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-
LLMs之Llama3:基于Colab平台(免费T4-GPU 利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】 对llama-3-8b-Instruct-bnb-4bit模型采用alpa...
-
Stable diffusion文生图大模型——隐扩散模型原理解析
1、前言 本篇文章,我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难,甚至说很简单。创新点也相对较少,如果你学会了我以前的文章讲过的模型,学习这个也自然水到渠成! 参考论文:High-Resolution Ima...
-
AI绘画SD入门教程:图生图基础用法,我不允许你还不会!
大家好,我是程序员晓晓 在上一篇中,我们学会了文生图的基础用法以及参数设置,这一篇我们继续讲解图生图。图生图就是给出一张参考图,由AI在参考图上做修改。简单来说,就是用原图和提示词进行图片二创。图生图的出现是为了弥补文生图的不足,因为文生图有个无法避免...
-
AIGC-Stable Diffusion进阶1(附代码)
在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。 SD模型的组成 在之前也讲过了,SD由CLIP、UNet、Schedule,VAE组成。再来回顾一下知识点: 1.CLIP Te...
-
AIGC你了解多少呢?
AIGC全面介绍 一、引言 随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content)作为生成式人工智能的重要分支,正在逐渐改变我们的生产、生活和工作方式。AIGC是人工智能1.0时代进入...
-
【AIGC】PULID:对比对齐的ID定制化技术
论文链接:https://arxiv.org/pdf/2404.16022 github:https://github.com/ToTheBeginning/PuLID comfyui节点:GitHub - cubiq/PuLID_ComfyUI: P...
-
(js)通过js批量下载下载所有ChatGPT(文心一言示例)查询后的结果
因工作中需要用到ChatGPT,而gpt查询后的结果只能一个一个复制,查询的条目多的时候就比较麻烦,所以在这记录我的解决方案 一、通过脚本下载结果 以文心一言为例 1.首先是f12或右键查看元素找到对应块的元素 tps:文心一言会打开debug...
-
- 使用 LMDeploy部署Llama 3
一.环境,模型准备 # 如果你是InternStudio 可以直接使用 # studio-conda -t lmdeploy -o pytorch-2.1.2 # 初始化环境 conda create -n lmdeploy python=3.10 co...
-
GitHub Copilot插件登录流程
GitHub OAuth应用有一套流程,用于获取用户的授权信息。这个流程是一个OAuth2的流程,主要分为以下几个步骤: 用户点击登录按钮,触发登录请求。 应用将用户重定向到GitHub的授权页面。 用户授权应用访问其GitHub账号。 GitHub验...
-
Stable Diffusion XL(未待完续)
模型介绍 Stable Diffusion XL 是一种基于人工智能的图像生成模型,由Stability AI开发。它是Stable Diffusion系列模型中的一员,专门设计用来生成更高质量的图像。这个模型在原有的Stable Diffusion模型...
-
【AI绘画/作图】风景背景类关键词模板参考
因为ds官网被墙,所以翻了IDE的源码整理了下stablestudio里的官方模板,顺便每个模板生成了一份…不知道怎么写关键词的可以参考 Stunning sunset over a futuristic city, with towering skys...
-
为Stable Diffusion模型瘦身并达到SOTA!LAPTOP-Diff:剪枝蒸馏新高度(OPPO)
文章链接:https://arxiv.org/pdf/2404.11098 在AIGC时代,对低成本甚至设备端应用扩散模型的需求日益增加。在压缩Stable Diffusion模型(SDM)方面,提出了几种方法,其中大多数利用手工设计的层移除方法来获得更...
-
Jenkins 自动化更新 Stable Diffusion 介绍
本文介绍如何使用 Jenkins 自动化更新 Stable Diffusion WebUI 和 Queue Agent 在 Amazon Elastic Kubernetes Service (EKS 上的部署过程。 步骤解释 1. 登录 ECR...
-
AI | LLaMA-Factory 一个好用的微调工具
‘’ LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。此外,它还提供了由 Hiyouga 提供的 Hugging Face 空间,可...