gui 第12页 - AIGC资讯

新的生图模型DeepFloyd IF来了，可以拳打Stable Diffusion，脚踢Dall-E？

简介： Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型（cascaded pixel diffusion model），复现了...

大数据 2023-11-22 人工智能

1291阅读

【Stable Diffusion】ControlNet基本教程（一）

1.ControlNet是什么 ControlNet是Stable Diffusion用于图像风格迁移和控制的一款插件，作者是2021年才本科毕业，现在在斯坦福大学读博士一年级的中国学生张吕敏。ControlNet的出现代表着 AI 生成开始进入真正可控的...

生成式AI 2023-11-22 人工智能

1115阅读

LlamaIndex的使用 | LangChain的研究 | pdfgpt安装使用

LlamaIndex在https://github.com/jerryjliu/llama_index 文档在https://gpt-index.readthedocs.io/en/latest/guides/primer/usage_pattern...

大数据 2023-11-22 人工智能

942阅读

A卡2023最新AI画图教程：3A主机安装ROCm运行Stable Diffusion画图

硬件平台：3A主机（内存16G）显卡：AMD RX6700 XT 12GB 华擎幻影电竞处理器：AMD R5 3500X 6C6T 主板：华硕TUF B450M-PRO GAMING 安装Ubuntu22.04.2 LTS系统更...

生成式AI 2023-11-22 人工智能

1037阅读

【文心一言 vs. 通义千文】一言对千问：自百度之后，阿里终于还是出手了——通义千问

通义千问： https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录通义千问：达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...

人工智能 2023-11-22 人工智能

1122阅读

Stable Diffusion - 采样器 DPM++ 3M SDE Karras 与 SDXL Refiner 测试

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132978866 Paper: DPM-Solver++: Fas...

大数据 2023-11-21 人工智能

1428阅读

LLMs之LLaMA-2：基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务)、同

LLMs之LLaMA-2：基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务、同时微调LLaMA2模型(采用Conda环境安装tg we...

AIGC 2023-11-21 人工智能

844阅读

Win11的dev通道更新Build23493版本后启用Windows Copilot的解决办法

博客嘛，多偷懒少打字，先上图：首先是微软宣布了对dev通道版本推送了Windows Copilot for Windows 11，但是相信像我这样的小白想体验又对win一窍不通的人应该也有不少，经历了一次重装，五次版本的回退再更新后终于...

生成式AI 2023-11-20 人工智能

844阅读

【Stable Diffusion】FID、CLIP、cfg-scales都是什么

在stable-diffusion 仓库中，是这样评价模型的。 Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7....

生成式AI 2023-11-20 人工智能

1272阅读

whisper.cpp在Windows VS的编译

Whisper是OpenAI开源的一款语音识别的模型，包含有英语和多国语言的模型，根据实际情况来看，其支持的90多种语言的准确率着实表现惊艳，英文甚至可以做到3%左右的误词率，官方图表显示中文的误词率大约是14%，但是实际使用的情况来看，误词率也是相当低，...

人工智能 2023-11-20 人工智能

1361阅读

真正实现一步文生图，谷歌UFOGen极速采样，生成高质量图像

最近一年来，以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是，扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片，因...

大数据 2023-11-20 人工智能

818阅读

【2023云栖】大模型驱动DataWorks数据开发治理平台智能化升级

随着大模型掀起AI技术革新浪潮，大数据也进入了与AI深度结合的创新时期。2023年云栖大会上，阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品...

生成式AI 2023-11-20 人工智能

1013阅读

AI - stable-diffusion(AI绘画)的搭建与使用

最近 AI 火的一塌糊涂，除了 ChatGPT 以外，AI 绘画领域也有很大的进步，以下几张图片都是 AI 绘制的，你能看出来么？一、环境搭建上面的效果图其实是使用了开源的 AI 绘画项目 stable-diffusion 绘制的，这是它的官...

AIGC 2023-11-19 人工智能

967阅读

AIGC时代，用Midjourney设计UI，跟“灵魂画手”说拜拜

使用 Midjourney 进行 UI 设计微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩引言 Midjourney、Dalle-2和 Stable Diffusion等文本到图像 AI 工具可以从纯文本生成图像。现在互联网...

大数据 2023-11-19 人工智能

1000阅读

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2023-11-18 人工智能

1288阅读

使用 GitHub Copilot 进行 Prompt Engineering 的初学者指南（译）

文章目录什么是 GitHub Copilot ? GitHub Copilot 可以自己编码吗？ GitHub Copilot 的底层是如何工作的？什么是 prompt engineering? 这是 prompt engineering...

大数据 2023-11-18 人工智能

1311阅读

AI生成图像竟如此真实了？Stable Diffusion Model本地部署教程

✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。 ?个人主页：小嗷犬的个人主页 ?个人网站：小嗷犬的技术小站 ?个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录图像生成 sta...

AIGC 2023-11-18 人工智能

2174阅读

【stable diffusion】图片批量自动打标签、标签批量修改（BLIP、wd14）用于训练SD或者LORA模型

参考： B站教学视频【：AI绘画】新手向！Lora训练！训练集准备、tag心得、批量编辑、正则化准备】官方教程：https://github.com/darkstorm2150/sd-scripts/blob/main/docs/train_RE...

人工智能 2023-11-18 人工智能

3564阅读

stable diffusion(Lora的训练)

以坤坤为例，上网随便找了几个坤坤的人脸图像，作为训练的数据集 1 训练环境搭建建议看一遍教程，虽然这个up主好像不是很专业的样子，不过流程差不多是这样的，重点关注一下虚拟环境搭建完之后，在终端选择配置的操作，就是一堆yes no，的选项，跟着视...

生成式AI 2023-11-18 人工智能

1058阅读

GPTs有哪些值得推荐的应用？14款热门GPTs应用合集

GPTstore是OpenAi推出的GPT应用商店，类似于Appstore，支持普通用户自定义自己的GPT并与其他用户分享。GPTs即将发布的消息一公布就吸引了众多人的热议，目前已经有很多好用的GPTs应用，下面就给大家带来14款值得推荐的GPTs应用，另...

大数据 2023-11-17 人工智能

1537阅读

数画-AI绘画-免费的人工智能AI绘画网站

文章目录 AIGC 什么是AI作画？ Prompt 数画 AIGC的未来发展结语 AIGC AIGC（AI Generated Content）是指利用人工智能生成内容。是利用人工智能来生成你所需要的内容，GC的意思是创作内容...

AIGC 2023-11-17 人工智能

962阅读

AIGC文生图：stable-diffusion-webui部署及使用

1 stable-diffusion-webui介绍 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用，利用 gradio 模块搭建出交互程序，可以在低代码 GUI 中立即访问 Stable Dif...

生成式AI 2023-11-17 人工智能

1177阅读

第三方应用接入discord midjourney

背景目前midjourney没有对外开放api，想体验他们的服务只能在discord中进入他们的频道进行体验或者把他们的机器人拉入自己创建的服务器中Midjourney Quick Start Guide（目前免费的已经无法体验了，需要使用就订阅?，后续...

大数据 2023-11-17 人工智能

2088阅读

Mac环境 Stable Diffusion Web Ui 安装教程

背景 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用，利用 gradio 模块搭建出交互程序，可以在低代码 GUI 中立即访问 Stable Diffusion： 1、St...

大数据 2023-11-17 人工智能

991阅读

faster-whisper-webui

摘要 whisper开源之后，很多相关的衍生产品也开源了，比如faster-whisper，它是一个比whisper转录更快的技术实现，转录速度是whisper的4倍，并且占用的显存更少，占用显存是whisper的1/2。而我们这次要讲的是faster...

AIGC 2023-11-17 人工智能

1466阅读

【深度学习 AIGC】stable diffusion webUI 使用过程，参数设置，教程，使用方法

文章目录 docker快速启动 vae .ckpt或者.safetensors CFG指数/CFG Scale 面部修复/Restore faces Refiner Tiled VAE Clip Skip prompt提示词怎么写 roop U...

生成式AI 2023-11-16 人工智能

1638阅读

AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例

AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例学习前言源码下载地址网络构建一、什么是Stable Diffusion（SD）二、Stable Diffusion的组成三、i...

AIGC 2023-11-16 人工智能

1041阅读

stable diffusion ——img2img Api参数数据格式参考，插件包含ControlNet和roop换脸

{ "init_images": [ "" ], "resize_mode": 0, "denoising_strength": 1.0, "image_cfg_scale": 1.5, "m...

AIGC 2023-11-16 人工智能

1010阅读

[stable-diffusion-art] 指北-4 模型

Beginner's guide to Stable Diffusion models and the ones you should know - Stable Diffusion ArtHow to install, use and merge sta...

人工智能 2023-11-16 人工智能

1450阅读

如何在 Windows 11 中启用 Copilot

这是一个快速教程，用于展示如何在 Windows 11 中启用 Copilot .在Windows的开发和金丝雀版本中，如果您没有以某种方式获得copilot，则可以激活/启用copilot。在这里，我将提到您必须执行的一些步骤，以便从侧边栏访问 Wind...

AIGC 2023-11-16 人工智能

858阅读

Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成

原文链接： Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成 High-Resolution Image Synthesis with Latent Diffusion Models...

AIGC 2023-11-16 人工智能

801阅读

微调Whisper语音识别模型和加速推理

前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对W...

生成式AI 2023-11-16 人工智能

1338阅读

AIGC视频生成/编辑技术调研报告

人物AIGC：FaceChain人物写真生成工业级开源项目，欢迎上github体验。简介：随着图像生成领域的研究飞速发展，基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天，视频生成/编辑技术也引起了学术界和产...

大数据 2023-11-15 人工智能

1085阅读

实时文生图速度提升5-10倍，清华LCM/LCM-LoRA爆火，浏览超百万

文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中，我们发现它们通常运行缓慢，导致我们要等一段时间才能拿到生成结果。但最近，一种名叫「LCM」的模型改变了这种情况，它甚至能做到实时的连续生图。图源：https://twitter.com/...

AIGC 2023-11-15 人工智能

905阅读

微软用GPT-4V解读视频，看懂电影还能讲给盲人听，1小时不是问题

世界各地的人们每天都会创造大量视频，包括用户直播的内容、短视频、电影、体育比赛、广告等等。视频是一种多功能媒介，可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法，就能帮助人们设计出具备强大能力的认知机器 —— 它不...

生成式AI 2023-11-15 人工智能

1063阅读

.Net 使用OpenAI开源语音识别模型Whisper

.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络，且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...

生成式AI 2023-11-15 人工智能

3213阅读

研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物

在当今智能手机技术不断发展的世界中，对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求，该代理结合了图像处理和文本推理，使其能够在iPhone上执行购物任务。本文将着重介绍MM...

人工智能 2023-11-15 人工智能

931阅读

开源一键拥有你自己的ChatGPT+Midjourney网页服务,用不用是另一回事，先收藏！

功能支持原ChatGPT-Next-Web所有功能 midjourney imgine 想象 midjourney upscale 放大 midjourney variation 变幻 midjourney describe 识...

人工智能 2023-11-14 人工智能

1103阅读

GPT-5 正在开发中！OpenAI：希望微软能再给资金支持

今年6月，OpenAI CEO Sam Altman 在印度经济时报主办的一场会议上表示:“在我们开始训练下一代模型之前，我们还有很多工作要做。我们正在研究我们认为需要的新想法，但我们肯定还没有准备好开始。” 仅时隔半年后，在OpenAI刚带来全新的GPT...

生成式AI 2023-11-14 人工智能

839阅读

LLaMA微调记录

本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调其他参考链接： Accelerating LLaMA with Fabric: A Comprehensive Guide...

大数据 2023-11-14 人工智能

980阅读

Midjourney推出5.2版本，更新zoom out功能

Midjourney是一款专业的图像处理软件，它可以让用户轻松地创造出高质量的图像。它最近宣布推出了5.2版本，这是一个重大的更新，其中最亮眼的功能就是zoom out功能。 zoom out功能可以让用户无限地缩小原始图像，同时保持图像的清晰度和细节不...

人工智能 2023-11-14 人工智能

861阅读

私人定制AI绘画——快速finetune stable diffusion教程

最近AI绘图非常火，只需要输入文本就能得到令人惊艳的图。举个例子，输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy,...

人工智能 2023-11-14 人工智能

1104阅读

关于AI 绘画，我给你总结了一份详细的关键词（Prompt 知识）

写在前面随着人工智能技术的不断发展，越来越多的应用场景被发掘。其中，AI绘画是一种新兴的领域，其应用范围涵盖了数字媒体、游戏设计、动画制作、艺术创作等多个领域。在本文中，我们将介绍AI绘画的基本概念、发展历程、技术原理以及应用前景。基本概念...

大数据 2023-11-14 人工智能

892阅读

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

ICLR 2024审稿结果公布了！ ICLR是机器学习领域重要的学术会议之一，每年举办一次。2024年是第十二届，将在奥地利维也纳5月7日-11日召开。根据OpenReview官方放出的结果显示，今年共有7135篇投稿论文。此外，另有国内开发者魏国...

大数据 2023-11-13 人工智能

1041阅读

如何申请文心一言&文心千帆大模型API调用资格、获取access_token，并使用SpringBoot接入文心一言API

前段时间，百度文心一言&文心千帆大模型开放了API调用的测试，接下来，教大家申请测试资格并接入文心千帆大模型的API。一、文心一言&文心千帆的测试资格申请 1. 确保拥有一个百度智能云的账号右上角点击注册，内容如实填写并完成实...

大数据 2023-11-13 人工智能

1274阅读

零基础手把手教你如何使用Laf免费玩转Midjourney

一、什么是Laf？ Laf 是一个 Serverless 框架，提供开箱即用的云函数，云数据库，对象存储等能力，是一个非常干净清爽的开发平台，不仅入门简单，还能像写博客一样写代码！最重要的是，敲重点，三分钟即可上线 ChatGPT 应用！若想深入了解...

生成式AI 2023-11-13 人工智能

863阅读

AI绘图实战（七）：室内设计线稿渲染、景观设计手绘稿改动、建筑照片转线稿｜Stable Diffusion成为设计师生产力工具

S：AI能取代设计师么？ I ：至少在设计行业，目前AI扮演的主要角色还是超级工具，要顶替？除非甲方对设计效果无所畏惧~~ 预先学习：安装及其问题解决参考：《Windows安装Stable Diffusion WebUI及问题解决记录》；运...

人工智能 2023-11-13 人工智能

1161阅读

Text-to-SQL小白入门（五）开源最强代码大模型Code Llama

摘要本文介绍了Code Llama大模型的基本概括，包含了论文的摘要、结果、结论以及核心方法，对于了解和实践Code Llama有一定帮助。论文概述上一篇介绍了指令进化大模型WizardLM，留了一个坑，补上Code Llama论文学习，...

大数据 2023-11-12 人工智能

1104阅读

Stable Diffusion超详细教程！从0-1入门到进阶

一、本地部署 Stable Diffusion 前言目前市面上比较权威，并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney（简称MJ），另一个叫Stable-Diffusion（简称SD）。MJ需要付费使用，而SD开源免费，但是上...

生成式AI 2023-11-12 人工智能

1097阅读

基于LoRA进行Stable Diffusion的微调

文章目录基于LoRA进行Stable Diffusion的微调数据集模型下载环境配置微调过程推理 WebUI部署基于LoRA进行Stable Diffusion的微调数据集本次微调使用的数据集为： Lam...

人工智能 2023-11-12 人工智能

1025阅读