-
【文心一言 vs. 通义千文】一言对千问:自百度之后,阿里终于还是出手了——通义千问
通义千问 : https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录 通义千问 : 达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...
-
Stable Diffusion - 采样器 DPM++ 3M SDE Karras 与 SDXL Refiner 测试
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132978866 Paper: DPM-Solver++: Fas...
-
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务)、同
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务 、同时微调LLaMA2模型(采用Conda环境安装tg we...
-
Win11的dev通道更新Build23493版本后启用Windows Copilot的解决办法
博客嘛,多偷懒少打字,先上图: 首先是微软宣布了对dev通道版本推送了Windows Copilot for Windows 11,但是相信像我这样的小白想体验又对win一窍不通的人应该也有不少,经历了一次重装,五次版本的回退再更新后终于...
-
【Stable Diffusion】FID、CLIP、cfg-scales都是什么
在stable-diffusion 仓库中,是这样评价模型的。 Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7....
-
whisper.cpp在Windows VS的编译
Whisper是OpenAI开源的一款语音识别的模型,包含有英语和多国语言的模型,根据实际情况来看,其支持的90多种语言的准确率着实表现惊艳,英文甚至可以做到3%左右的误词率,官方图表显示中文的误词率大约是14%,但是实际使用的情况来看,误词率也是相当低,...
-
真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像
最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是,扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片,因...
-
【2023云栖】大模型驱动DataWorks数据开发治理平台智能化升级
随着大模型掀起AI技术革新浪潮,大数据也进入了与AI深度结合的创新时期。2023年云栖大会上,阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品...
-
AI - stable-diffusion(AI绘画)的搭建与使用
最近 AI 火的一塌糊涂,除了 ChatGPT 以外,AI 绘画领域也有很大的进步,以下几张图片都是 AI 绘制的,你能看出来么? 一、环境搭建 上面的效果图其实是使用了开源的 AI 绘画项目 stable-diffusion 绘制的,这是它的官...
-
AIGC时代,用Midjourney设计UI,跟“灵魂画手”说拜拜
使用 Midjourney 进行 UI 设计 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 引言 Midjourney、Dalle-2和 Stable Diffusion等文本到图像 AI 工具可以从纯文本生成图像。现在互联网...
-
本地部署开源大模型的完整教程:LangChain + Streamlit+ Llama
在过去的几个月里,大型语言模型(llm 获得了极大的关注,这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员。 大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...
-
使用 GitHub Copilot 进行 Prompt Engineering 的初学者指南(译)
文章目录 什么是 GitHub Copilot ? GitHub Copilot 可以自己编码吗? GitHub Copilot 的底层是如何工作的? 什么是 prompt engineering? 这是 prompt engineering...
-
AI生成图像竟如此真实了?Stable Diffusion Model本地部署教程
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 ?个人主页:小嗷犬的个人主页 ?个人网站:小嗷犬的技术小站 ?个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 本文目录 图像生成 sta...
-
【stable diffusion】图片批量自动打标签、标签批量修改(BLIP、wd14)用于训练SD或者LORA模型
参考: B站教学视频【:AI绘画】新手向!Lora训练!训练集准备、tag心得、批量编辑、正则化准备】 官方教程:https://github.com/darkstorm2150/sd-scripts/blob/main/docs/train_RE...
-
stable diffusion(Lora的训练)
以坤坤为例,上网随便找了几个坤坤的人脸图像,作为训练的数据集 1 训练环境搭建 建议看一遍教程,虽然这个up主好像不是很专业的样子,不过流程差不多是这样的,重点关注一下虚拟环境搭建完之后,在终端选择配置的操作,就是一堆yes no,的选项,跟着视...
-
GPTs有哪些值得推荐的应用?14款热门GPTs应用合集
GPTstore是OpenAi推出的GPT应用商店,类似于Appstore,支持普通用户自定义自己的GPT并与其他用户分享。GPTs即将发布的消息一公布就吸引了众多人的热议,目前已经有很多好用的GPTs应用,下面就给大家带来14款值得推荐的GPTs应用,另...
-
数画-AI绘画-免费的人工智能AI绘画网站
文章目录 AIGC 什么是AI作画? Prompt 数画 AIGC的未来发展 结语 AIGC AIGC(AI Generated Content)是指利用人工智能生成内容。是利用人工智能来生成你所需要的内容,GC的意思是创作内容...
-
AIGC文生图:stable-diffusion-webui部署及使用
1 stable-diffusion-webui介绍 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Dif...
-
第三方应用接入discord midjourney
背景 目前midjourney没有对外开放api,想体验他们的服务只能在discord中进入他们的频道进行体验或者把他们的机器人拉入自己创建的服务器中Midjourney Quick Start Guide(目前免费的已经无法体验了,需要使用就订阅?,后续...
-
Mac环境 Stable Diffusion Web Ui 安装教程
背景 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion: 1、St...
-
faster-whisper-webui
摘要 whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster...
-
【深度学习 AIGC】stable diffusion webUI 使用过程,参数设置,教程,使用方法
文章目录 docker快速启动 vae .ckpt或者.safetensors CFG指数/CFG Scale 面部修复/Restore faces Refiner Tiled VAE Clip Skip prompt提示词怎么写 roop U...
-
AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例
AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例 学习前言 源码下载地址 网络构建 一、什么是Stable Diffusion(SD) 二、Stable Diffusion的组成 三、i...
-
stable diffusion ——img2img Api参数数据格式参考,插件包含ControlNet和roop换脸
{ "init_images": [ "" ], "resize_mode": 0, "denoising_strength": 1.0, "image_cfg_scale": 1.5, "m...
-
[stable-diffusion-art] 指北-4 模型
Beginner's guide to Stable Diffusion models and the ones you should know - Stable Diffusion ArtHow to install, use and merge sta...
-
如何在 Windows 11 中启用 Copilot
这是一个快速教程,用于展示如何在 Windows 11 中启用 Copilot .在Windows的开发和金丝雀版本中,如果您没有以某种方式获得copilot,则可以激活/启用copilot。在这里,我将提到您必须执行的一些步骤,以便从侧边栏访问 Wind...
-
Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成
原文链接: Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成 High-Resolution Image Synthesis with Latent Diffusion Models...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...
-
AIGC视频生成/编辑技术调研报告
人物AIGC:FaceChain人物写真生成工业级开源项目,欢迎上github体验。 简介: 随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
.Net 使用OpenAI开源语音识别模型Whisper
.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...
-
研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。本文将着重介绍MM...
-
开源一键拥有你自己的ChatGPT+Midjourney网页服务,用不用是另一回事,先收藏!
功能支持 原ChatGPT-Next-Web所有功能 midjourney imgine 想象 midjourney upscale 放大 midjourney variation 变幻 midjourney describe 识...
-
GPT-5 正在开发中!OpenAI:希望微软能再给资金支持
今年6月,OpenAI CEO Sam Altman 在印度经济时报主办的一场会议上表示:“在我们开始训练下一代模型之前,我们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始。” 仅时隔半年后,在OpenAI刚带来全新的GPT...
-
LLaMA微调记录
本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调 其他参考链接: Accelerating LLaMA with Fabric: A Comprehensive Guide...
-
Midjourney推出5.2版本,更新zoom out功能
Midjourney是一款专业的图像处理软件,它可以让用户轻松地创造出高质量的图像。它最近宣布推出了5.2版本,这是一个重大的更新,其中最亮眼的功能就是zoom out功能。 zoom out功能可以让用户无限地缩小原始图像,同时保持图像的清晰度和细节不...
-
私人定制AI绘画——快速finetune stable diffusion教程
最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。 举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy,...
-
关于AI 绘画,我给你总结了一份详细的关键词(Prompt 知识)
写在前面 随着人工智能技术的不断发展,越来越多的应用场景被发掘。其中,AI绘画是一种新兴的领域,其应用范围涵盖了数字媒体、游戏设计、动画制作、艺术创作等多个领域。在本文中,我们将介绍AI绘画的基本概念、发展历程、技术原理以及应用前景。 基本概念...
-
ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高
ICLR 2024审稿结果公布了! ICLR是机器学习领域重要的学术会议之一,每年举办一次。2024年是第十二届,将在奥地利维也纳5月7日-11日召开。 根据OpenReview官方放出的结果显示,今年共有7135篇投稿论文。 此外,另有国内开发者魏国...
-
如何申请文心一言&文心千帆大模型API调用资格、获取access_token,并使用SpringBoot接入文心一言API
前段时间,百度文心一言&文心千帆大模型开放了API调用的测试,接下来,教大家申请测试资格并接入文心千帆大模型的API。 一、文心一言&文心千帆的测试资格申请 1. 确保拥有一个百度智能云的账号 右上角点击注册,内容如实填写并完成实...
-
零基础手把手教你如何使用Laf免费玩转Midjourney
一、什么是Laf? Laf 是一个 Serverless 框架,提供开箱即用的云函数,云数据库,对象存储等能力,是一个非常干净清爽的开发平台,不仅入门简单,还能像写博客一样写代码!最重要的是,敲重点,三分钟即可上线 ChatGPT 应用! 若想深入了解...
-
AI绘图实战(七):室内设计线稿渲染、景观设计手绘稿改动、建筑照片转线稿|Stable Diffusion成为设计师生产力工具
S:AI能取代设计师么? I :至少在设计行业,目前AI扮演的主要角色还是超级工具,要顶替?除非甲方对设计效果无所畏惧~~ 预先学习: 安装及其问题解决参考:《Windows安装Stable Diffusion WebUI及问题解决记录》; 运...
-
Text-to-SQL小白入门(五)开源最强代码大模型Code Llama
摘要 本文介绍了Code Llama大模型的基本概括,包含了论文的摘要、结果、结论以及核心方法,对于了解和实践Code Llama有一定帮助。 论文概述 上一篇介绍了指令进化大模型WizardLM,留了一个坑,补上Code Llama论文学习,...
-
Stable Diffusion超详细教程!从0-1入门到进阶
一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable-Diffusion(简称SD)。MJ需要付费使用,而SD开源免费,但是上...
-
基于LoRA进行Stable Diffusion的微调
文章目录 基于LoRA进行Stable Diffusion的微调 数据集 模型下载 环境配置 微调过程 推理 WebUI部署 基于LoRA进行Stable Diffusion的微调 数据集 本次微调使用的数据集为: Lam...
-
当ChatGPT遇上Stable Diffusion
之前有在前面的图文和大家分享过stable diffusion--二次元福利 (qq.com ,缺点就是prompt很难准确的把握,受限于自己的文字表达能力,以及中英文对照不恰当。 最近出现了让很多人都疯狂的AIGC模型ChatGPT,一个由Op...
-
stable-diffusion真的好用吗?
hi,各位大佬,今天尝试下diffusion大模型,也是CV领域的GPT,但需要prompt,我给了prompt结果并不咋滴,如下示例,并附代码及参考link 1、img2img 代码实现: import torch from PIL import...
-
stable-diffusion-webui安装(2):扩展模块extensions——汉化、双语等
相关博文- stable-diffusion-webui的基础功能手动安装,了解代码结构、依赖、模型出处 主要教程参考:https://jihulab.com/hunter0725/stable-diffusion-webui-localization-...
-
【Stable Diffusion】windows 1050显卡,17年笔记本还能再战
文章目录 一、环境安装 Git Python NVIDIA驱动 CUDA 安装Visual Studio 安装CUDA stable-diffusion-webui 二、Stable Diffusion使用 参数 底模 LORA 三...