sif 第3页 - AIGC资讯

扩散模型的发展过程梳理多个扩散模型理论知识总结/DDPM去噪扩散概率/IDDPM/DDIM隐式去噪/ADM/SMLD分数扩散/CGD条件扩散/Stable Diffusion稳定扩散/LM

前言 1.最近发现自己光探索SDWebUI功能搞了快两个月，但是没有理论基础后面科研路有点难走，所以在师兄的建议下，开始看b站视频学习一下扩散模型，好的一看一个不吱声，一周过去了写个博客总结一下吧，理理思路。不保证下面的内容完全正确，只能说是一个菜鸟的思...

AIGC 2024-02-15 人工智能

2145阅读

揭开向量索引概念的神秘面纱

自从ChatGPT公开发布以来，人们几乎没有一天不讨论LLM（大型语言模型）、RAG（检索增强生成：Retrieval Augmented Generation）和向量数据库的新内容。技术世界充斥着LLM的可能性，LLM被视为将改变我们生活的最新技术：...

人工智能 2024-02-14 人工智能

1005阅读

AIGC工具

1. 图转文 BLIP：输入图片，生成对图片的描述，用于制作训练模型的数据集工具 GitHub - salesforce/BLIP: PyTorch code for BLIP: Bootstrapping Language-Image Pre-tr...

人工智能 2024-02-13 人工智能

903阅读

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

2005年，划时代之作「The Graph Neural Network Model」的问世，将图神经网络带到每个人面前。在此之前，科学家处理图数据的方式是，在数据预处理阶段，将图转换为一组「向量表示」。而CNN的出现彻底改变这种信息丢失的弊端，近2...

生成式AI 2024-02-07 人工智能

845阅读

OS-AIGC通用生成式人工智能模型加密接入标准API协议-2023 Beta版

说明 OS-AIGC通用生成式人工智能模型加密接入标准API协议（Universal Language Model Encryption Access Standard API Protocol）国内的通用语言大模型的加密接入标准API协议。能够适配各种...

人工智能 2024-02-06 人工智能

1010阅读

流量工程将代码生成的准确率提高一倍：由19%提高至44%

一篇新论文的作者提出了一种“强化”代码生成的方法。代码生成是人工智能中一项越来越重要的能力。它指训练机器学习模型，基于对所需程序功能的自然语言描述自动生成计算机代码，并有许多潜在的应用，从将软件规格转换成实用代码、自动化后端开发到协助人类程序员，不一...

人工智能 2024-02-05 人工智能

945阅读

【多模态】13、Vision-Language 模型在视觉任务中的调研

文章目录一、简介二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集三、迁移学习 3.1 使用 prompt tunin...

生成式AI 2024-02-05 人工智能

1174阅读

图感知对比学习提升多变量时间序列分类效果

今天给大家介绍一篇AAAI 2024中，由新加坡科技研究局（A*STAR）和新加坡南洋理工大学联合发表的时间序列分类工作，通过图感知对比学习改善多变量时间序列分类，取得了非常显著的效果提升。图片论文标题：Graph-Aware Contrasting...

大数据 2024-02-04 人工智能

1103阅读

AIGC面经大全（持续更新）

目录 DDPM算法原理部分： DDIM算法原理部分：⾼阶采样⽅案：特征编码篇： Stable Diffusion篇： SDXL篇：⼤模型微调篇：控制模型篇：适配器篇： DDPM算法原理部分：简述DDP...

AIGC 2024-02-04 人工智能

1464阅读

【CV】稳定扩散模型（Stable Diffusion）

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自...

人工智能 2024-02-03 人工智能

1012阅读

AI绘画：超全Stable Diffusion详解之常用参数设置

SD-Web UI是来自B站的秋葉aaaki大佬制作的一款AI绘画启动器。非常开心又进入学习时间，今天来学习关于图像大小、数量、CFG、种子等参数设置。英版原文：https://stable-diffusion-art.com/autom...

人工智能 2024-02-03 人工智能

2244阅读

深度学习（生成式模型）—— stable diffusion：High-Resolution Image Synthesis with Latent Diffusion Models

文章目录前言 motivation Conditioning Mechanisms 实验结果如何训练autoencoder LDM性能与autoencoder深度的联系 LDM带来的图像生成速率提升 LDM在图像生成任务上与sota方法比...

大数据 2024-02-02 人工智能

1011阅读

Ai作画区域控制的几种方法

背景距上次发文章，又过去好久。这期分享给大家带来的是Ai作画的图结构控制几种方法。现在大家用AI作画大部分情况是直接使用AI单图生成能力，其实并不太会取考虑构图，也不太会考虑到大图的图结构这件事。其实构图这件事是一件很综合复杂的事情，很难去定义什么样的...

AIGC 2024-02-02 人工智能

937阅读

diffusion model（五）stable diffusion底层原理（latent diffusion model， LDM）

LDM: 在隐空间用diffusion model合成高质量的图片！ [论文地址] High-Resolution Image Synthesis with Latent Diffusion Models [github] https://githu...

人工智能 2024-01-30 人工智能

1471阅读

重塑3D生成核心理论：VAST、港大、清华用「零」训练数据生成了3D模型

无需任何训练数据，只需对着模型描述一句话，如「一个做作业的香蕉人」：或是「一只戴着 VR 眼镜的猫」：就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此，还能对已有的 3D 模型进行精细化贴图。这是港大与清华大学联合 3D 生成明星...

AIGC 2024-01-29 人工智能

853阅读

检测路在何方？YOLOv8终极指南

本文经自动驾驶之心公众号授权转载，转载请联系出处。 YOLOv8是计算机视觉领域的最新发展，它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外，YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...

大数据 2024-01-29 人工智能

1181阅读

Mamba论文为什么没被ICLR接收？AI社区沸腾了

基于 Mamba 的创新正不断涌现，但原论文却被 ICLR 放到了「待定区」。 2023年，Transformer 在 AI 大模型领域的统治地位被撼动了。发起挑战的新架构名叫「Mamba」，它是一种选择性状态空间模型（ selective state s...

生成式AI 2024-01-26 人工智能

869阅读

剧透GPT-5，物色芯片厂，2024年的Sam Altman已经火力全开，只因不敢停下来

尽管如今的AI圈花样层出、新闻满天，但OpenAI的新动向仍然一直是人们最关注的话题之一。最近， OpenAI首席执行官 Sam Altman就在参加达沃斯论坛时高调表示，公司目前的首要任务就是推出下一代大型语言模型，可能被称为GPT-5。他还剧透了一...

大数据 2024-01-23 人工智能

833阅读

[论文精读] 自条件图像生成 - 【恺明大神新作，AIGC 新基准】

论文导读: 论文背景: 2023年8月，AI大神何恺明在个人网站宣布，2024年将加入MIT担任教职，回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文，论文一作本科毕业于清华姚班，二作为MIT电气工程与计算机科学系教授，今年的斯...

生成式AI 2024-01-23 人工智能

1017阅读

DALL·E 2 论文阅读笔记

《Hierarchical Text-Conditional Image Generation with CLIP Latents》 Paper: https://cdn.openai.com/papers/dall-e-2.pdf Proj...

人工智能 2024-01-23 人工智能

1049阅读

扩散模型实战（十）：Stable Diffusion文本条件生成图像大模型

推荐阅读列表：扩散模型实战（一）：基本原理介绍扩散模型实战（二）：扩散模型的发展扩散模型实战（三）：扩散模型的应用扩散模型实战（四）：从零构建扩散模型扩散模型实战（五）：采样过程扩散模型实战（六）：Diffusers DDPM初探...

人工智能 2024-01-23 人工智能

1490阅读

AIGC神器CLIP：技术详解及应用示例

编者按：上一期，我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期，我们将共同走进另一项AI重要突破——CLIP，著名的DALLE和Stable Diffusion均采用了CLIP哦。 Nikos Kafrit...

人工智能 2024-01-23 人工智能

1146阅读

扩散模型 - Stable Diffusion

4 Stable Diffusion Stable Diffusion 是由 Stability AI 开发的开源扩散模型。Stable Diffusion 可以完成多模态任务，包括：文字生成图像（text2img）、图像生成图像（img2img）...

人工智能 2024-01-23 人工智能

1044阅读

AIGC中的视觉生成文献整理

文章目录文件夹文献总览图像生成技术视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...

大数据 2024-01-21 人工智能

1216阅读

Stable Diffusion 源码解析（1）

参考1：https://blog.csdn.net/Eric_1993/article/details/129393890 参考2：https://zhuanlan.zhihu.com/p/613337342 1.StableDiff...

AIGC 2024-01-20 人工智能

1192阅读

Stable Diffusion背后原理(Latent Diffusion Models)

前言 2023年第一篇博客，大家新年好呀~ 这次来关注一下Stable Diffusion背后的原理，即 High-Resolution Image Synthesis with Latent Diffusion Models 这篇论文。之前关注的...

人工智能 2024-01-19 人工智能

1031阅读

最近读的AIGC相关论文思路解读

AIGC之SD可控生成论文阅读记录提示：本博客是作者本人最近对AIGC领域相关论文调研后，临时记录所用，所有观点都是来自作者本人局限理解，以及个人思考，不代表对。如果你也正好看过相关文章，发现作者的想法和思路有问题，欢迎评论区留言指正！既然是论...

生成式AI 2024-01-19 人工智能

968阅读

文心一言,通营销之学,成一家之言,百度人工智能AI大数据模型文心一言Python3.10接入

“文心”取自《文心雕龙》一书的开篇，作者刘勰在书中引述了一个古代典故：春秋时期，鲁国有一位名叫孔文子的大夫，他在学问上非常有造诣，但是他的儿子却不学无术，孔文子非常痛心。一天，孔文子在山上遇到了一位神仙，神仙告诉他：“你的儿子之所以不学无术，是因为你没...

AIGC 2024-01-19 人工智能

947阅读

AI视野：谷歌推几何模型Alpha Geometry；三星发布AI手机Galaxy S24；Runway更新运动笔刷功能；Midjourney v6下周补齐缩放平移等功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ????大模型动态谷歌推数学几何...

人工智能 2024-01-18 人工智能

856阅读

SIFU官网体验入口 AI图像3D虚拟人物服装重建在线使用地址

SIFU是一种先进的计算机视觉技术，专门用于通过侧视图像重建高质量的3D服装虚拟人物模型。这种方法的核心创新在于提出了一种新型基于侧视图像的隐式函数，能够有效增强特征提取和提高几何精度。SIFU不仅在处理复杂姿势和宽松衣物方面表现出色，还通过引入一种3D一...

生成式AI 2024-01-18 人工智能

971阅读

非营利组织计划推出Fairly Trained认证计划，确保AI模型生成内容不侵权

针对人工智能的潜在法规要求对模型进行审查，一些组织开始向AI公司提供认证计划，以展示他们的工作不侵犯版权。据彭博社报道，Fairly Trained是由前Stability AI音频副总裁Ed Newton-Rex创立的，该组织为那些证明已经征得版权许可...

AIGC 2024-01-18 人工智能

833阅读

20源代码模型的数据增强方法：克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】

Data Augmentation Approaches for Source Code Models: A Survey 写在最前面对nlp领域其他方向的启发英文版：论文名片论文总结一个有意思的表 1.背景Background...

大数据 2024-01-18 人工智能

965阅读

几何纹理重建新SOTA！浙大提出SIFU：单图即可重建高质量3D人体模型

在AR、VR、3D打印、场景搭建以及电影制作等多个领域中，高质量的穿着衣服的人体3D模型非常重要。传统的方法创建这些模型不仅需要大量时间，还需要能够捕捉多视角照片的专业设备，此外还依赖于技术熟练的专业人员。与此相反，在日常生活中，我们最常见...

生成式AI 2024-01-18 人工智能

900阅读

Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码

文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...

大数据 2024-01-18 人工智能

1682阅读

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1230阅读

【Stable Diffusion XL】huggingface diffusers 官方教程解读

文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...

AIGC 2024-01-17 人工智能

1479阅读

【慕伏白】stable diffusion webui 使用手册

文章目录 Global Parameters 1. Stable Diffusion checkpoint 2. Functions text2img 1. Prompt Prompt Editing 2. Negative prompt...

大数据 2024-01-17 人工智能

1582阅读

深入浅出解析Stable Diffusion完整核心基础知识 | 【算法兵器谱】

Rocky Ding 公众号：WeThinkIn 最新更新： Rocky也一直在更新Stable Diffusion系列的文章内容，包括最新发布的Stable Diffusion XL。Rocky都进行...

AIGC 2024-01-17 人工智能

1502阅读

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

前言近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...

大数据 2024-01-16 人工智能

1151阅读

AIGC：ChatGPT(一个里程碑式的对话聊天机器人)的简介(意义/功能/核心技术等)、使用方法(七类任务)、案例应用(提问基础性/事实性/逻辑性/创造性/开放性的问题以及编程相关)之详细攻略

AIGC：ChatGPT(一个里程碑式的对话聊天机器人的简介(意义/功能/核心技术等、使用方法(七类任务、案例应用(提问基础性/事实性/逻辑性/创造性/开放性的问题以及编程相关之详细攻略导读：回拨到2020年5月，OpenAI提出了更...

AIGC 2024-01-15 人工智能

1491阅读

Stable Diffusion的入门介绍和使用教程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图...

AIGC 2024-01-14 人工智能

1068阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1961阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1100阅读

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将一幅图像转换为3D的方法通常采用Score Distillation Sampling（SDS）的方法，尽管结果令人印象深刻，但仍然存在多个不足之处，包括多视角不一致、过度饱和、过度平滑的纹理，以及生成速度缓慢等问题。为了解决这些问题，北京大学、新加坡...

AIGC 2024-01-08 人工智能

866阅读

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发，是语音识别领域的一大...

人工智能 2024-01-08 人工智能

1007阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

857阅读

Meta最新模型LLaMA详解（含部署+论文）

来源：投稿作者：毛华庆编辑：学姐前言本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。文章标题：LLaMA: Open and Efficient Foundation Language Mode...

大数据 2024-01-08 人工智能

1017阅读

Llama~transformers搭建

本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼。并且训练它来实现一个有趣的实例：两数之和。输入输出类似如下：输入："12345+54321=" 输出："66666" 我们把这个任务当做一个...

AIGC 2024-01-07 人工智能

1146阅读

检测脸部情绪有多难？10行代码就可以搞定！

面部表情展示人类内心的情感。它们帮助我们识别一个人是愤怒、悲伤、快乐还是正常。医学研究人员也使用面部情绪来检测和了解一个人的心理健康。人工智能在识别一个人的情绪方面可以发挥很大的作用。在卷积神经网络的帮助下，我们可以根据一个人的图像或实时视频来识别他...

大数据 2024-01-07 人工智能

864阅读

[玩转AIGC]如何训练LLaMA2（模型训练、推理、代码讲解，并附可直接运行的kaggle连接）

目录一、clone仓库二、数据集下载与处理 1、数据集下载 2、数据集标记化（耗时较长）三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解 1、导包 2、定义模型训练参数与相关设置 3、加载模型配置 4、迭代...

AIGC 2024-01-07 人工智能

1157阅读