-
Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移
IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models(文本到图像扩散模型的文本兼容图像提示适配器),是腾讯研究院出品的一个新的Contr...
-
Stable Diffusion 模型演进:LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集: 持续火爆!!...
-
WhisperCLI-本地部署语音识别系统;Mis开源LLM推理平台;Dokploy-开源版Vercel;Mem-大规模知识图谱
1. Whisper-cli:可本地部署的开源语音识别系统 近日,Ruff的开发团队发布了一款名为Whisper cpp cli的全新语音识别系统,该系统已在GitHub Repo上开源。这是一款完全自主研发的语音转文字系统,基于Whisper技术构建。...
-
Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解
文章目录 Diffusion Model 生成模型 DDPM概述 向前扩散过程 前向扩散的逐步过程 前向扩散的整体过程 反向去噪过程 网络结构 训练和推理过程 训练过程 推理过程 优化目标 详细数学推导 数学基础 向前扩散过程 反向...
-
Stable Diffusion之API接口调用
1、开启api调用模式 开启api模式,关闭可视化窗口,并且建议关闭登录权限(详细查看文章最后Stable Diffusion之Ubuntu下部署-CSDN博客) ./webui.sh --disable-safe-unpickle --ap...
-
【Diffusion实战】基于Stable Diffusion实现文本到图像的生成(Pytorch代码详解)
来试试强大的Stable Diffusion吧,基于Stable Diffusion的pipeline,进一步了解Stable Diffusion的结构~ Diffusion实战篇: 【Diffusion实战】训练一个diffusion模型生成...
-
什么!Intel/AMD/Apple Silicon也能本地部署的Llama工具来了
主流的LLM都需要通过CUDA才能高效的运行在本地,但是随着Github上出现了Llama.cpp这个神器,一切都改变了。它通过AVX指令和MPI来实现CPU上并行计算,从而在本地计算机高效地运行各种主流的类Llama模型。同时它也支持metal,使得Ap...
-
Stable Diffusion XL之使用Stable Diffusion XL训练自己的AI绘画模型
文章目录 一 SDXL训练基本步骤 二 从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型 2.1 配置训练环境与训练文件 2.2 SDXL训练数据集制作 (1 数据筛选与清洗 (2 使用BLIP自动标注cap...
-
pipeline-stable-diffusion.py文件逐行解释
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...
-
Stable Diffusion教程|怎么写提示词prompt语法格式详解和实战
怎么画出高质量的AI图像? 不管使用Stable Diffusion的文生图或图生图进行AI绘画,都可以用提示词描述相关图像效果,通过尝试不同提示词组合和参数,从而达成更好的AI绘图效果和创意。与其天天在网上找别人的提示词,不如自己学会写好提示词,读懂本...
-
基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署
一、引言 阿里云人工智能平台 PAI 提供了面向开发者与企业的深度学习工程平台,其中交互 式建模 PAI-DSW 集成了 Jupyter 等多种云端开发环境,提供丰富的计算资源与镜像环 境,实现开箱即用的高效开发模式。LLaMA Factory 则是一款...
-
Midjourney原理与代码实例讲解
1. 背景介绍 1.1 人工智能生成内容的兴起 近年来,人工智能技术突飞猛进,其中一个引人注目的领域是人工智能生成内容 (AIGC 。AIGC 利用人工智能算法,自动生成各种形式的内容,例如文本、图像、音频和视频。AIGC 的兴起为创意产业带来了革命性...
-
Llama 3消费级PC安装与运行教程
我是 Llama 的忠实粉丝。 Meta 发布其 LLM 开源代码对整个科技界来说是一项净收益,其宽松的许可证允许大多数中小型企业在几乎没有任何限制的情况下使用其 LLM(当然,在法律范围内)。 他们的最新版本是备受期待的 Llama 3。 Llama...
-
无需搭建环境,零门槛带你体验Open-Sora文生视频应用
案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts,将会进入到ModelArts CodeLab中,这时需要你登录华为云账号,如果没有账号,则需要...
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著的成就,几乎成为了AI领域的主导技术。 然而,虽然Transformer架构及其众多变体在实践中取得了巨大成功,但其设计大多是基于经验的,...
-
与AI结对:一位高级开发人员构建插件的历程
作者分享了他使用 ChatGPT 学习 Go、浏览 Kolide API 以及构建一个复杂的 Steampipe 插件的经验。 译自Pairing With AI: A Senior Developer's Journey Building a Plug...
-
Unity接入文心一言大模型
一、百度云平台创建应用 1、创建一个自己的应用 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application 2、获取ApiKey和Secret...
-
手把手教你调用文心一言API,含py调用示例代码
获取API密钥 打开网址:百度智能云千帆大模型 (baidu.com 注册或登录账号 选择应用接入 创建应用 随便起个名字 点击显示即可。 这个API Key和Secret Key就是我们需要的。 Pyth...
-
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
循环调用CLIP,无需额外训练就有效分割无数概念。 包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。 牛津大学与谷歌研究院联合团队的这项新成果,已被CVPR 2024接收,并开源了代码。 团队提出名为CLIP as RNN(简称CaR)的新技...
-
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK,用于实时的 Speech AI 服务。它是一个高度可定制的工具,并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型,这些模型开箱即用,可以直接使用...
-
有哪些好的 Stable Diffusion 提示词(Prompt)可以参考?
看完这八种“提示词”种类,你也会Ai高质量出图! 作为一个老法师,Prompt需要我们自己搜集,然后总结。很多人习惯于通过教程和模型来学习绘画,沿着别人预设的轨道前行,这样一开始没有错,但是长久缺乏自主思考和创造的能力,机械式的学习方式只会限制个人的表达...
-
【AI】本地部署可以与文件沟通的GPT:Llama 2 + GPT4All + Chroma
【背景】 还是继续致力于实践可以保护数据隐私的本地化LLM部署。 这次用的是Llama 2 + GPT4All + Chroma实现RAG。 【概念】 基于LangChain模板的各个部分的作用: Llama2-》语言模型管理 GPT4AL...
-
Midjourney可以通过接口调用啦
在数字艺术创作领域,Midjourney一直以其出色的图片生成效果受到广泛关注。然而,由于需要通过discord界面操作等一系列限制,也给很多用户带来了不便。现在,通过日月摘星接口,用户可以直接访问和调用midjourney,大大简化了操作...
-
LlamaFactory源码解析 PPO
class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
编译 | 言征 作者 | Aksh Garg 备注:发稿前作者已经删掉原文 出品 | 51CTO技术栈(微信号:blog51cto) 近日,一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队,身陷“抄袭”中国大模型的泥潭后,火速删稿...
-
文心一言API接入指南
一、了解文心一言 文心一言是百度打造出来的人工智能大语言模型,具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间...
-
基于Llama 3搭建中文版(Llama3-Chinese-Chat)大模型对话聊天机器人
前面两篇博文,我们分别在个人笔记本电脑部署了Llama 3 8B参数大模型,并使用Ollama搭建了基于 Web 可视化对话聊天机器人,可以在自己电脑上愉快的与Llama大模型 Web 机器人对话聊天了。但在使用过程中,笔者发现Llama大模型经常出现中文...
-
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色,而且还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...
-
实时局部建图的深入思考 | MapTR继往开来的18篇论文剖析!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 实时局部建图领域自从端到端方案MapTR(2023.1 [1]问世后已经又涌现出非常多优秀的工作,基本是在MapTR基本框架的基础上进行一系列改进,包括原班人马的升级作品MapTRv2(2023.8 ...
-
Stable Diffusion高级教程 - 图生图(img2img)模式
前言 现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能:图生图 (img2img 。顾名思义,除了根据正向和反向提示词之外,还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
Stable Diffusion插件(翻译)
Agent Scheduler(代理调度器):一个用于排队和跟踪任务历史的工具,使得管理生成任务变得井井有条。 TemporalKit(时间稳定工具包):这是一个全能解决方案,通过一个自动化扩展,为Stable Diffusion渲染添加时间稳定性,保持...
-
stable diffusion常用的模型
一、Checkpoint模型 1.1、二次元模型 可以搭配负面提示词优化EasyNegative使用 1.1.1 counterfeitV30_v30.safetensors C站地址:https://civitai.com/models/4...
-
基于Wechaty实现微信接入文心一言
引言与效果 上篇文章写了怎么用Wechaty接入ChatGPT,这篇写一下怎么接入文心一言的模型。国内的模型用起来会更方便一些,而且也不用科学上网。最终实现效果如下: Wechaty机器人介绍与部署 在上一篇中已详细展开说,这一篇就不再说明...
-
IC-Light-在stable diffusion中实现图像的光影控制新方法 - 技术原理篇
?背景与来源 最近在stable diffusion的粉丝群看到光影控制又有了新的玩法,是controlnet的作者lllyasviel,发了一款名为IC-Light的模型,并且已经被另外一位名为huchenlei的朋友实现了comfyui和webUI(...
-
Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流
Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流 1、 Llama 3...
-
安装部署Stable Diffusion WebUI实现AI绘画
Stable Diffusion WebUI 安装部署 环境准备 下载代码 启动webu.sh 访问WebUI 其他异常 其他设置 开启VAE和CLIP 部分参数说明 安装插件 中文汉化插件 安装civitai插件 提示词插件 ol...
-
基于百度语音识别、文心一言大模型、百度语音合成的一套完整的语音交互(利用Python实现)
本人小白,因为毕设项目需要用的语音交互,便查网上的资料利用百度api实现,比较简单的过程,供大家借鉴批判。 项目框架大致分为3步:(1)百度语音识别可以将我们输入的语音转化为文本输入到文心一言大模型;(2)文心一言大模型根据输入以输出响应文...
-
欢迎 Llama 3:Meta 的新一代开源大语言模型
介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Fac...
-
如何在Linux服务器上安装Stable Diffusion WebUI
如何在Linux服务器上安装Stable Diffusion WebUI 一、前提条件 1、硬件条件 2、软件条件 二、安装步骤 1、创建Python虚拟环境 2、安装必要的软件和库 3、克隆Stable Diffusion WebUI仓...
-
10 分钟,教你如何用 LLama-Factory 训练和微调 LLama3 模型
本文将探讨于2024年3月21日发布的LLama-Factory,并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务,我们将使用 NVIDIA A4000 GPU,它被认为是功能最强大...
-
百度文心一言api Python调用ERNIE-Lite-8K-0922具体教程
ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922(原ERNIE-Bot-turbo-0922)是模型的一个模版,本文介绍了相关API及应用。 创建chat...
-
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
ControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现在只需一句超简单的提示词说明意图,Agent就会自己开始“构图”: 这就是ControlNet作者Lvmin Zhang的新玩具...
-
AI绘画Stable Diffusion学习指南【图生图篇】
大家好,我是程序员晓晓 今天的文章里我会为你详细介绍图生图的工作原理、工具解析和图像重绘的应用方向,如果没有看过【文生图篇】的朋友建议先去学习下,以便你更好的理解今天的内容。 01、图生图功能初识 1.1 传统意义上的喂参考图 我们都知道,模型在运...
-
基于 Llama-Index、Llama 3 和 Qdrant,构建一个 RAG 问答系统!
构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统 尽管大型语言模型(LLMs)有能力生成有意义且语法正确的文本,但它们面临的一个挑战是幻觉。 在LLMs中,幻觉指的是它们倾向于自信地生成错误答案,制造出看似令人信...
-
大神开发的Stable Diffusion出了安卓客户端,完全免费
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。由于它是一款完全免费的开源软件,可以在大多数配备有适度GPU的电脑硬件上运行。他不像chatgpt和其他AI工具,模型(如DALL-E和Midjourney)只能通过云计算服务访...
-
玩转AI,笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端
2024 年 4 月 18 日,Meta开源了 Llama 3 大模型,把 AI 的门槛降低到了最低,这是人工智能领域的一个重要飞跃。我们个人也可以部署大模型了,这简直就是给个人开发者发了个大红包!Llama 3 模型有不同的参数版本,本文主要分享我在个人...