gui 第8页 - AIGC资讯

AIGC专栏2——Stable Diffusion结构解析-以文本生成图像（文生图，txt2img）为例

AIGC专栏2——Stable Diffusion结构解析-以文本生成图像（文生图，txt2img）为例学习前言源码下载地址网络构建一、什么是Stable Diffusion（SD）二、Stable Diffusion的组成三、生...

AIGC 2024-01-22 人工智能

957阅读

discord+midjourney图片生成器

这里写自定义目录标题背景接入步骤 1.创建discord服务器 2.创建机器人 3.postman测试生成图片背景目前midjourney没有对外开放api，想体验他们的服务只能在discord中进入他们的频道进行体验...

生成式AI 2024-01-22 人工智能

1017阅读

AIGC中的视觉生成文献整理

文章目录文件夹文献总览图像生成技术视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...

大数据 2024-01-21 人工智能

1215阅读

Stable Diffusion 源码解析（1）

参考1：https://blog.csdn.net/Eric_1993/article/details/129393890 参考2：https://zhuanlan.zhihu.com/p/613337342 1.StableDiff...

AIGC 2024-01-20 人工智能

1189阅读

全网最全AI绘画Stable Diffusion关键技术解析

背景很多人觉得AI绘画不稳定，对于以后是否替代插画师，摄影工作者，设计师，表示存疑，作为AI从业者本文从AI绘画关键技术分析，明白以前生产者肯定会被淘汰，现在没有到达黄金期。技术一定会让更多人失业，而我们拥抱变化，增强自身。 AI绘画中Stab...

生成式AI 2024-01-20 人工智能

996阅读

stable-diffusion打造自己的lora模型（使用lora-scripts）

1、训练图片收集比如要训练一个自己头像的模型，就可以拍一些自己的照片（20-50张，最少15张），要求画质清晰，脸部轮廓清楚，背景较为简单的照片。 2、使用stable_diffusion的预处理功能进行图片的预处理这里可以根据自己的情况设置...

人工智能 2024-01-20 人工智能

1434阅读

ChatGPT和Copilot协助Vue火速搭建博客网站

AI 对于开发人员的核心价值网上会看到很多 AI 的应用介绍或者教程使用 AI 聊天，咨询问题 —— 代替搜索引擎使用 AI 写各种的电商文案（淘宝、小红书）使用 AI 做一个聊天机器人 —— 这最多算猎奇、业余爱好、或者搞个套壳产品来收费...

生成式AI 2024-01-20 人工智能

2489阅读

Stable Diffusion背后原理(Latent Diffusion Models)

前言 2023年第一篇博客，大家新年好呀~ 这次来关注一下Stable Diffusion背后的原理，即 High-Resolution Image Synthesis with Latent Diffusion Models 这篇论文。之前关注的...

人工智能 2024-01-19 人工智能

1031阅读

一键实景转动画，清华系初创公司全球首发4D骨骼动画框架，还能生成个性化角色

前几日，苹果宣布首款虚拟头显设备 Vision Pro 将于 2 月 2 日正式发售，XR 设备作为下一代终端预计将迎来快速发展。未来随着虚拟显示设备的普及，数字交互将从平面走向立体，立体模型、立体动画将成为未来主流的内容形态，虚实融合下的多维沉浸式交互...

AIGC 2024-01-19 人工智能

980阅读

吞吐量提升5倍，联合设计后端系统和前端语言的LLM接口来了

大型语言模型 (LLM 越来越多地用于需要多个链式生成调用、高级 prompt 技术、控制流以及与外部环境交互的复杂任务。然而，用于编程和执行这些应用程序的现有高效系统存在着明显的缺陷。现在，开源社区的研究者们面向 LLM 提出了一种结构化生成语言（...

人工智能 2024-01-19 人工智能

866阅读

最近读的AIGC相关论文思路解读

AIGC之SD可控生成论文阅读记录提示：本博客是作者本人最近对AIGC领域相关论文调研后，临时记录所用，所有观点都是来自作者本人局限理解，以及个人思考，不代表对。如果你也正好看过相关文章，发现作者的想法和思路有问题，欢迎评论区留言指正！既然是论...

生成式AI 2024-01-19 人工智能

968阅读

如何使用ChatGPT + Midjourney批量生成图片

我们都知道，视觉内容对于一个内容创作者来说非常重要。但是，对于没有设计技能的人来说，制作视觉内容可能是一项很困难的任务。不过，随着人工智能技术的不断进步，我们可以使用一些AI工具来帮助我们创建视觉内容，例如使用ChatGPT和Midjourney批量生成图...

AIGC 2024-01-19 人工智能

1143阅读

开源 AI库Stable Diffusion 介绍

Stable Diffusion 是一个用于生成高质量 AI 绘画的 Python 库，以下是一些使用 Stable Diffusion 的基本步骤：安装 Stable Diffusion 库。您可以使用 pip 安装，命令如下： pip inst...

AIGC 2024-01-19 人工智能

1017阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1474阅读

GitHub Copilot 功能介绍和使用场景

原文： https://openaigptguide.com/github-copilot/ GitHub Copilot是一款由GitHub、OpenAI和Microsoft联合开发的AI辅助开发工具，它以人工智能的方式提供语法结构、表达式、变量名等...

人工智能 2024-01-18 人工智能

1688阅读

Java调用Midjourney进行AI画图原生版抓包实现支持中文

用途介绍 Midjourney是一个目前优秀的AI画图工具，不挂梯无法直接访问本代码主要用于搭建镜像站使用适合人群本代码不适合新手，建议使用过okhttp、且具有二开能力的同学使用~ 实现原理通过调用发送信息接口发送请求，通过轮询房间消...

大数据 2024-01-18 人工智能

1018阅读

20源代码模型的数据增强方法：克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】

Data Augmentation Approaches for Source Code Models: A Survey 写在最前面对nlp领域其他方向的启发英文版：论文名片论文总结一个有意思的表 1.背景Background...

大数据 2024-01-18 人工智能

964阅读

Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码

文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...

大数据 2024-01-18 人工智能

1680阅读

【Stable Diffusion XL】huggingface diffusers 官方教程解读

文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...

AIGC 2024-01-17 人工智能

1476阅读

【慕伏白】stable diffusion webui 使用手册

文章目录 Global Parameters 1. Stable Diffusion checkpoint 2. Functions text2img 1. Prompt Prompt Editing 2. Negative prompt...

大数据 2024-01-17 人工智能

1580阅读

AI绘画的技巧与实践

1.三个不错的AI绘画平台最近，AI绘画非常流行，只要输入一些关键词（prompt脚本），就可以AI帮你绘画出精美的图画，真的很有意思。在百度上随便搜一下，就能搜出各种乱七八糟的AI绘画平台，哪些平台比较值得推荐呢？小灰为大家推荐三个很好用的AI...

生成式AI 2024-01-17 人工智能

1078阅读

【论文简介】Stable Diffusion的基础论文:2112.High-Resolution Image Synthesis with Latent Diffusion Models

稳定扩散生成模型(Stable Diffusion 是一种潜在的文本到图像扩散模型，能够在给定任何文本输入的情况下生成照片般逼真的图像 Stable Diffusion 是基于latent-diffusion 并与 Stability AI and Run...

大数据 2024-01-17 人工智能

1260阅读

基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率...

人工智能 2024-01-17 人工智能

2567阅读

深入浅出解析Stable Diffusion完整核心基础知识 | 【算法兵器谱】

Rocky Ding 公众号：WeThinkIn 最新更新： Rocky也一直在更新Stable Diffusion系列的文章内容，包括最新发布的Stable Diffusion XL。Rocky都进行...

AIGC 2024-01-17 人工智能

1499阅读

复现问题记录 | Stable Diffusion(LDM) (in python3)（一）

复现环境代码 util.py 测试 Text-to-Image 直接使用网页生成记录复现LDM遇到的问题环境 conda env create -f environment.yaml 根据environment.ya...

大数据 2024-01-17 人工智能

1162阅读

大型语言模型检索增强生成利器——向量搜索引擎

译者 | 朱先忠审校 | 重楼简介随着大型语言模型（LLM）席卷全球，向量搜索引擎也紧随其后。同时，向量数据库也构成大型语言模型长期记忆系统的基础。通过有效的算法找到相关信息并使其作为上下文传递给语言模型，向量搜索引擎可以提供超出训练截止值的最...

AIGC 2024-01-17 人工智能

974阅读

基于ChatGPT的代码解释神器：GPT Academic、GitHub Copilot

（个人推荐使用第二个GitHub Copilot） 1. GPT 学术优化 (GPT Academic 工具简介 GPT Academic是什么为ChatGPT/GLM提供实用化交互界面，特别优化论文阅读/润色/写作体验，模块化设计，支持自定...

生成式AI 2024-01-17 人工智能

1610阅读

Stable Diffusion/Win/本地部署

一、本地部署 Stable Diffusion 前言目前市面上比较权威，并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney（简称MJ），另一个叫Stable-Diffusion（简称SD）。MJ需要付费使用，而SD开源免费，但是上手难...

大数据 2024-01-17 人工智能

1150阅读

用 llama.cpp 跑通 mixtral MoE 模型

这里是用 llama.cpp 跑通 mixtral MoE 模型视频的笔记哦。主要命令安装 huggingface_hub: pip install huggingface_hub -U 下载模型 huggingface-cli down...

生成式AI 2024-01-16 人工智能

961阅读

【生成模型】Stable Diffusion原理+代码

文章目录前言一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE：三、Diffusion扩散模型 1.前向过程 2.逆向过程四、多模态 cross attention 五...

生成式AI 2024-01-16 人工智能

1579阅读

使用Gradio搭建Stable Diffusion模型生成图像：简单快捷的图像生成体验

目录 0 开发环境 1 介绍 1.1 Gradio简介 1.2 Stable Diffusion模型简介 2 使用Gradio搭建基本界面 2.1 安装依赖库 2.2 加载预训练模型 2.3 解析返回的数据 2.4 构建图像字幕应用程序...

人工智能 2024-01-16 人工智能

1933阅读

史上超全自动驾驶岗位介绍

本文经自动驾驶之心公众号授权转载，转载请联系出处。 1.背景近日分享如何高新转型到自动驾驶领域时，几位朋友不约而同的问到了我同一个问题：“L2~L4自动驾驶的岗位都有哪些？对应着具体的什么工作内容？需要哪方面的技能？”今天就针对这个大家都很想了解的...

人工智能 2024-01-16 人工智能

997阅读

我们是怎么一步步被Hugging Face收购的：开源库Gradio构建者分享背后故事

不知大家是否还记得 2021 年年末，Hugging Face 宣布收购 Gradio 一事。两年过去了，Gradio 是如何成长起来的，又是如何被收购的，Gradio CEO 兼联合创始人 Abubakar Abid 说出了一些内幕故事。图源：ht...

AIGC 2024-01-15 人工智能

884阅读

AI：你总要高清视频，它来了

Magnific 图像超分 & 增强工具还正在火热体验中，它强大的图像升频与再创能力收获一致好评。现在，视频领域也有了自己的 Magnific。拍摄的街道视频一片模糊，仿佛高度近视没戴眼镜一样：与之相比，下面的视频清晰度高了很多：视频画...

生成式AI 2024-01-15 人工智能

807阅读

软件开发人员指南：在自己的数据上训练ChatGPT

译者 | 李睿审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto） OpenAI公司推出的ChatGPT对于对话式人工智能具有革命性意义。虽然其开箱即用的功能令人印象深刻，但ChatGPT的功能本质上受到2021年固有训练数据的...

人工智能 2024-01-15 人工智能

910阅读

AIGC之Image2Video（一）| Animate Anyone：从静态图像生成动态视频，可将任意图像角色动画化

近日，阿里发布了Animate Anyone，只需一张人物照片，结合骨骼动画，就能生成人体动画视频。项目地址：https://humanaigc.github.io/animate-anyone/ 论文地址：https://ar...

AIGC 2024-01-15 人工智能

1085阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1211阅读

Stable Diffusion的入门介绍和使用教程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图...

AIGC 2024-01-14 人工智能

1066阅读

AI成CES顶流！大模型定义硬件时代来了

作为全球最大的科技盛会，CES（国际消费类电子产品展览会）无疑是观察科技行业变化最好的窗口。今年也不例外，美国当地时间1月9日~12日，CES 在拉斯维加斯迎来了全球超过150个国家和地区的4000余家参展商，参会者超过13万人，其中就有超过1114家中...

生成式AI 2024-01-14 人工智能

920阅读

【AI绘画】万字长文——（超详细）ControlNet的详细介绍&使用Stable Diffusion的艺术二维码完全生成攻略

目录前言一、名词解释 1-1、Stable Diffusion介绍 1-2、ControlNet介绍 1-2-1、ControlNet介绍&工作原理 1-2-2、ControlNet控制方法介绍 1-3、案例分析 1-3-1...

AIGC 2024-01-14 人工智能

1166阅读

1、aigc图像相关

aigc图像相关一、Diffusion webui 在autodl上部署一些问题二、lora和kohyass （1）角色模型（2）风格模型（3）dreambooth （4）模型合并（5）Lora加Adetail 其他三、sd a...

人工智能 2024-01-09 人工智能

2197阅读

Jetson Orin安装riva以及llamaspeak，使用 Riva ASR/TTS 与 Llama 进行实时交谈，大语言模型成功运行笔记

NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外，RIVA 可以构建应用程序，在本地设备（如 NVIDIA Jetson）上处理所有这些内容。 RIVA 是一个综合性库，包括：自动语音识别（ASR）文本转语音合成（TT...

生成式AI 2024-01-08 人工智能

1258阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1961阅读

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将一幅图像转换为3D的方法通常采用Score Distillation Sampling（SDS）的方法，尽管结果令人印象深刻，但仍然存在多个不足之处，包括多视角不一致、过度饱和、过度平滑的纹理，以及生成速度缓慢等问题。为了解决这些问题，北京大学、新加坡...

AIGC 2024-01-08 人工智能

863阅读

AI绘画 | stable diffusion简介和原理

Stable Diffusion中文的意思是稳定扩散，本质上是基于AI的图像扩散生成模型。 Stable Diffusion是一个引人注目的深度学习模型，它使用潜在扩散过程来生成图像，允许模型在生成图像时考虑到文本的描述。这个模型的出现引起了广泛的关注和讨...

AIGC 2024-01-08 人工智能

1663阅读

SparseOcc：全稀疏3D全景占用预测（语义+实例双任务）

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文：Fully Sparse 3D Panoptic Occupancy Prediction 链接：https://arxiv.org/pdf/2312.17118.pdf 这篇论文的出发点是什么...

AIGC 2024-01-08 人工智能

966阅读

文心一格: AIGC简介及文心一格简单使用

文章目录 @[toc] 一、AIGC 二、AI作画三、Prompt 四、文心一格 1.文心一格小程序 2.使用方法 3.使用小程序进行AI绘图六、未来发展小结其他一、AIGC AIGC（AI Generat...

AIGC 2024-01-08 人工智能

1440阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

854阅读

解决新版Edge浏览器右上角不显示Copilot图标的问题

概述本文主要介绍一种在Windows平台上，通过删除或替换配置文件来解决新版Edge浏览器右上角不显示Copilot图标的方法，该方法适用于Edge的正式版和Dev版。另外，文章最后还补充了一种通过下载旧版Edge浏览器解决这个问题的方法，以备将...

人工智能 2024-01-08 人工智能

2076阅读

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度，与此同时，Faster-Whisper也...

人工智能 2024-01-08 人工智能

916阅读