gan 第8页 - AIGC资讯

自回归超越扩散！北大、字节 VAR 范式解锁视觉生成 Scaling Law

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...

大数据 2024-04-20 人工智能

945阅读

人工智能和物联网如何颠覆关键行业

人工智能(AI 和物联网(IoT 已经分别推动了制造业和银行业等行业的重大发展，但这两种技术结合起来，在广泛的行业中提供了强大的机会。物联网创造了一个由相互连接的设备组成的实时通信网络，已经成为一个价值数万亿美元的产业;据Statista估计，到20...

AIGC 2024-04-12 人工智能

834阅读

【探索AI】人人都在讲AIGC，什么是AIGC？

AIGC 概述示例展示我们日常用到的一些工具/应用核心技术介绍核心技术的算法解析案例及部分代码实现 1. 艺术作品 2. 设计项目 3. 影视特效 4. 广告创意总结一张图先了解下：概述 "人工智能生成创造...

生成式AI 2024-04-11 人工智能

3539阅读

AIGC实战——StyleGAN(Style-Based Generative Adversarial Network)

AIGC实战——StyleGAN 0. 前言 1. StyleGAN 1.1 映射网络 1.2 合成网络 1.3 自适应实例归一化层 1.4 风格混合 1.5 随机变化 2. StyleGAN 生成样本 3. StyleGAN2 3.1...

生成式AI 2024-04-11 人工智能

1714阅读

AI绘画自动生成器：让艺术创作触手可及

随着人工智能技术的飞速发展，越来越多的应用领域逐渐与AI技术融合。在艺术领域，AI绘画自动生成器成为了一款备受关注的产品。它利用深度学习算法，让用户通过输入关键词或描述性文本，就能在几秒钟内生成一幅独特的艺术作品。在这篇文章中，我们将探讨AI绘画自动生成器...

大数据 2024-04-11 人工智能

1433阅读

AIGC-Stable Diffusion发展及原理总结

目录一. AIGC介绍 1. 介绍 2. AIGC商业化方向 3. AIGC是技术集合 4. AIGC发展三要素 4.1 数据 4.2 算力 4.3 算法 4.3.1 多模态模型CLIP 4.3.2 图像生成模型二. Stable...

生成式AI 2024-04-10 人工智能

1198阅读

尝试着在Stable Diffusion里边使用SadTalker进行数字人制作

首先需要标明的是，我这里是图片说话类型，而且是看了知识星球AI破局俱乐部大航海数字人手册进行操作的。写下这篇文章是防止我以后遗忘。我使用的基础软件是Stable Diffusion，SadTalker是作为插件放进来的，需要注意的是这对自己的电脑GPU要...

AIGC 2024-04-10 人工智能

1201阅读

Spotify 推出个性化AI播放列表，用户可以使用提示构建

Spotify 推出了 AI 播放列表功能，让用户能够通过书面提示来生成个性化的音乐列表。这项新功能最初将在英国和澳大利亚的 Android 和 iOS 设备上推出，并将在未来几个月内不断改进。除了基于流派或时间范围等传统播放列表创建请求之外，Spot...

AIGC 2024-04-08 人工智能

938阅读

AIGC实战——ProGAN(Progressive Growing Generative Adversarial Network)

AIGC实战——ProGAN 0. 前言 1. ProGAN 2. 渐进式训练 3. 其他技术 3.1 小批标准差 3.2 均等学习率 3.3 逐像素归一化 4. 图像生成小结系列链接 0. 前言我们已经学习了使用生成对...

人工智能 2024-04-08 人工智能

1641阅读

月之暗面真的很强？我们来用一个问题评测这些 ChatGPT 平替

号称平替甚至超越 ChatGPT 的产品层出不穷，今天就来做一个横向评测。本次评测的对象有: ChatGPT 3.5 ChatGPT 4 Google Gemini Anthropic Claude 3 Sonnet Perplexit...

人工智能 2024-04-08 人工智能

1529阅读

llama.cpp部署

llama.cpp 介绍部署介绍大模型的研究分为训练和推理两个部分：训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化；推理结果最优化的过程；训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理，对外...

AIGC 2024-04-08 人工智能

1185阅读

值得你花时间看的扩散模型教程，来自普渡大学

想了解更多AIGC的内容：请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型（Diffusion Model）是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法，扩散模型另辟...

大数据 2024-04-08 人工智能

896阅读

ICCV 2023 | 最全AIGC梳理，5w字30个diffusion扩散模型方向，近百篇论文！

30个方向130篇！CVPR 2023最全AIGC论文 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2...

大数据 2024-04-07 人工智能

1670阅读

【Stable Diffusion】图片高清化+面部修复+一键抠图，一些你不知道的事儿

说到后期处理板块，大家第一印象就是图像放大，快速且高效。但是今天要讲的后期处理当中，肯定还有一些是你不知道的事儿。 # 放大算法首先是关于放大算法，如果大家用的都是秋叶大佬的整合包的话，算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...

大数据 2024-04-06 人工智能

1175阅读

社交媒体与AIGC：如何改变内容创作与推荐

1.背景介绍社交媒体平台已经成为现代人们交流、分享和获取信息的重要来源。随着人工智能(AI 和机器学习技术的发展，社交媒体平台也开始广泛地采用这些技术来改善内容创作和推荐。这篇文章将探讨如何将人工智能生成式(AIGC 技术与社交媒体平台结合，从...

生成式AI 2024-04-06 人工智能

1272阅读

DALL·E 2（内含扩散模型介绍）【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents

1官方对模型的介绍大家好，今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly，然后在年底的时候又推出了glide。...

大数据 2024-04-05 人工智能

1268阅读

文心一言指令词宝典之创作篇

作者：哈哥撩编程（视频号、抖音、公众号同名）新星计划·全栈领域优秀创作者博客专家·全国博客之星第四名超级个体·COC上海社区主理人特约讲师·谷歌亚马逊演讲嘉宾科技博主·极星会首批签约作者 ? 推荐专栏： ? 程序员：...

人工智能 2024-04-05 人工智能

1142阅读

文生图大模型三部曲：DDPM、LDM、SD 详细讲解！

1、引言跨模态大模型是指能够在不同感官模态(如视觉、语言、音频等之间进行信息转换的大规模语言模型。当前图文跨模态大模型主要有：文生图大模型：如 Stable Diffusion系列、DALL-E系列、Imagen等图文匹配大模型：如CLI...

生成式AI 2024-04-05 人工智能

2549阅读

AIGC——ComfyUI 安装与基础使用

简介 ComfyUI是一个基于节点流程的稳定扩散操作界面，通过流程实现了更加精准的工作流定制和完善的可复现性。每个模块都有特定的功能，我们可以通过调整模块连接来实现不同的出图效果。然而，节点式的工作流也提高了一定的使用门槛。同时，由于内部生成流程经过优...

AIGC 2024-04-04 人工智能

2538阅读

whisper、whisper.cpp、faster-whisper的比较

让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来，似乎在各个方面都发生了变化，例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...

人工智能 2024-04-04 人工智能

1396阅读

谷歌挖走OpenAI的大将！前开发者关系负责人官宣加盟

整整一个月，OpenAI前开发者关系负责人Logan Kilpatrick正式官宣加入谷歌。他将负责AI Studio产品，并为Gemini API提供支持。 Logan表示，未来还有很多工作要做，让谷歌成为开发人员使用AI进行开发的最佳场所。 L...

大数据 2024-04-03 人工智能

815阅读

Postsmrt官网体验入口 LinkedIn内容创作AI生成软件使用地址

Postsmrt是一款利用AI自动创建LinkedIn内容的工具，旨在帮助用户在LinkedIn上实现organic增长。它的主要功能包括：利用AI生成与目标受众相关、高参与度的LinkedIn帖子内容；根据用户设定的目标（如获取销售线索、预约会议等）生成...

AIGC 2024-04-03 人工智能

851阅读

AI绘画 | 如何利用SD垫图实现照片风格转换

“ 小红书上有很多用AI做卡通头像的，大概思路是你拍一张个人照片发给博主，博主利用midjourney的垫图功能转换成卡通形象，一张收取一定费用……” 看过之前文章的人都应该知道，midjourney是付费的软件，而且需要一定魔法上网能力。今天给大家...

人工智能 2024-04-02 人工智能

1361阅读

扩散模型攻克算法难题，AGI不远了！谷歌大脑找到迷宫最短路径

「扩散模型」也能攻克算法难题？图片一位博士研究人员做了一个有趣的实验，用「离散扩散」寻找用图像表示的迷宫中的最短路径。图片作者介绍，每个迷宫都是通过反复添加水平和垂直墙生成的。其中，起始点和目标点随机选取。从起点到目标点的最短路径中，随机采样...

AIGC 2024-04-02 人工智能

867阅读

免费论文写作生成器（ai写作生成器免费）

完成论文初稿后，通常需要寻求专家评审以获取专业的反馈和建议。然而，即便是对于经验丰富的教师来说，这也是一项颇具挑战性的任务。同学们，幸运的是，我们生活在有AI的世界，可以借助ChatGPT这样的人工智能工具来模拟专家评审的过程。通过分批次将...

AIGC 2024-04-01 人工智能

950阅读

stable-diffusion.cpp 一个文件解决stable diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo

stable-diffusion.cpp 一个文件解决stable-diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo 目录介绍效果 Text To Image Image To...

人工智能 2024-04-01 人工智能

883阅读

stable diffusion学习笔记——高清修复

ai画图中通常存在以下痛点：受限于本地设备的性能（主要是显卡显存），无法跑出分辨率较高的图片。生图的时候分辨率一调大就爆显存。即便显存足够。目前主流的模型大多基于SD1.0和SD1.5，这些模型在训练的时候通常使用小分辨率图片训练，在生成高分辨率图...

AIGC 2024-04-01 人工智能

1673阅读

Whisper.cpp: 一个轻量级、高效的C++事件系统

Whisper.cpp: 一个轻量级、高效的C++事件系统项目地址:https://gitcode.com/ggerganov/whisper.cpp 在当今的软件开发中，事件驱动模型已经成为构建复杂应用程序的核心部分。Whisper.cpp是一...

大数据 2024-04-01 人工智能

1294阅读

Stable Diffusion之核心基础知识和网络结构解析

Stable Diffusion核心基础知识和网络结构解析一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...

生成式AI 2024-03-31 人工智能

1351阅读

llama.cpp部署多模态视觉模型到应用实践

一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4，请根据自己系统选择版本。二、下载源码 git clone https://github.com/ggerganov/llam...

人工智能 2024-03-30 人工智能

2314阅读

AI绘画 | stable-diffusion-web-ui的基本操作

前言我们下载安装完成stable-diffusion-web-ui以后，下载对应风格的模型，就可以开始我们的绘画操作了。进行Ai绘画操作前，我们最好先弄清楚web ui界面上的参数按钮的含义。这样我们就能更轻松的绘画出我们想要stable-diffu...

AIGC 2024-03-30 人工智能

2697阅读

Stable Diffusion Webui 本地部署【踩坑记录】

1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具，通过它可以将开源项目仓库克隆到本地下载地址：Git - Downloading Package...

人工智能 2024-03-29 人工智能

941阅读

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

之前引爆了AI圈的Mamba架构，今天又推出了一版超强变体！人工智能独角兽AI21 Labs刚刚开源了Jamba，世界上第一个生产级的Mamba大模型！ Jamba在多项基准测试中表现亮眼，与目前最强的几个开源Transformer平起平坐。特别是...

大数据 2024-03-29 人工智能

931阅读

（给自己挖坑中）一些还比较有趣的AIGC开源项目和部署教程

文章目录一、开源项目二、部署情况三、问题总结一、开源项目 https://www.naviai.cn/ AI 导航站 | 收录了国内外2000+优质AI工具，人工智能工具和模型的介绍及链接 https://zhuanla...

大数据 2024-03-29 人工智能

1117阅读

元象大模型开源30款量化版本可更低成本部署

元象大模型开源了30款量化版本，支持 vLLM 和 llama.cpp 等主流框架的量化推理，无条件免费商用。对量化前后的模型能力、推理性能进行评估，以 XVERSE-13B-GPTQ-Int4量化版本为例，量化后模型权重压缩了72%，总吞吐提高了1.5...

大数据 2024-03-28 人工智能

818阅读

SORA 2.1 ——Stable diffusion技术解析+基于diffusion的视频生成技术介绍

本文是DataWhale开源项目Sora原理与技术实战的第二次打卡任务的第一节，主要是简单试用Stable diffusion技术在魔塔社区进行文生图实践。同一打卡任务的其他小节请参见个人主页。目录一.【AIGC简介——以文生图为例】 1.基于生...

AIGC 2024-03-27 人工智能

846阅读

【AI绘画】没有大显存？新人上手SD1.5模型推荐

SDXL有千般好，但是大显存却绕不开。更何况很多优秀的模型目前只有SD1.5版本的，今天就来介绍一些不同领域内好用的代表性的SD1.5模型，足够新人探索一段时间喽。(相关模型去C站搜标题找或者直接文末扫马领取目录好看到不真实的写实风：maj...

AIGC 2024-03-26 人工智能

1217阅读

AIGC实战——Transformer模型

AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结系列链接 0. 前言我们在 GPT (Generative Pre-trained Transfo...

AIGC 2024-03-26 人工智能

975阅读

突破性的百万级视频和语言世界模型：Large World Model~

本文经自动驾驶之心公众号授权转载，转载请联系出处。在探索如何让AI更好地理解世界方面，最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”，能够同时处理百万级长度的视频和语言序列，...

生成式AI 2024-03-26 人工智能

972阅读

stable diffusion webui升级bug问题解决思路(纯干货）

个人网站：https://tianfeng.space/ 文章目录一、前言二、个人方案 1.扼杀在萌芽中 A.解压后点击启动器运行依赖，然后点击A启动器 B.更新本体和扩展（全部到最新版本） C.把controlnet1.1放入sta...

人工智能 2024-03-24 人工智能

1862阅读

AI换脸视频制作app有哪些免费AI换脸软件在线下载使用地址入口

什么是AI换脸视频制作？ AI换脸视频制作是利用人工智能算法实现视频人脸替换的创新技术。通过先进的人脸识别和图像处理技术，用户可以将任意一个人的面部换到另一个视频中，生成逼真的换脸视频效果。 AI换脸技术原理 AI换脸视频制作主要基于深度学习技术中的生成...

生成式AI 2024-03-22 人工智能

3003阅读

CMU朱俊彦、Adobe新作：512x512图像推理，A100只用0.11秒

简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦，其团队在 ICCV 2021 会议上发表过一项类似的研究：仅仅使用一个或数个手绘草图，即可以自定义一个现成的 GA...

生成式AI 2024-03-21 人工智能

849阅读

一个开源免费的实时AI绘画软件Krita

Krita是由Krita插件+ComfyUI+LCM插件结合的一个实时可预览的AI绘画工具，是一款自由开源、免费的专业级绘画软件，Krita采用的是GNU GPL许可证确保它将一直保持自由开源的本色。一：搭建Krita创作平台 1、Krita客户...

人工智能 2024-03-21 人工智能

2722阅读

旗舰同款！小米Civi 4 Pro升级影像大脑3.0：搭载Xiaomi AISP

快科技3月21日消息，小米Civi 4 Pro今日正式发布，搭载原汁原味的徕卡专业三摄，配备光影猎人800定制专业传感器。据介绍，小米Civi 4 Pro还继承了旗舰机型的实力，搭载Xiaomi AISP。通过小米澎湃OS深入硬件层，重构技术管线，深入...

人工智能 2024-03-21 人工智能

859阅读

AIGC：让生成式AI成为自己的外脑

前言在数字化浪潮席卷全球的今天，人工智能（AI）已经渗透到了我们生活的方方面面。其中，生成式AI以其独特的魅力，正逐渐改变我们与世界的交互方式。AIGC（人工智能生成内容）作为生成式AI的重要应用之一，正成为越来越多人的“外脑”，助力我们更高效...

AIGC 2024-03-21 人工智能

1061阅读

Diffusion Transformer Family：关于Sora和Stable Diffusion 3你需要知道的一切

转自知乎：叫我Alonzo就好了前言背景——Sora和Stable Diffusion 3 近期，OpenAI和Stability两大AI巨头公司在同期分别发布了它们的新作品——Sora和Stable Diffusion 3。神奇的是，这...

大数据 2024-03-19 人工智能

1638阅读

为自动驾驶而生，Lightning NeRF：速度提升10倍

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性，加上驾驶场景中的视点受限，使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...

人工智能 2024-03-19 人工智能

826阅读

【AIGC】如何提高Prompt准确度

前言随着人工智能的迅猛进展，AIGC（通用人工智能聊天工具）已成为多个行业中不可或缺的自然语言处理技术。Prompt作为AIGC系统的一项关键功能，在工具的有效运作中发挥了举足轻重的作用。本篇文章将深入探讨Prompt与AIGC之间的紧密联系以及它们是...

人工智能 2024-03-19 人工智能

857阅读

小红书多模态团队建立新「扩散模型」：解码脑电波，高清还原人眼所见

近些年，研究人员们对探索大脑如何解读视觉信息，并试图还原出原始图像一直孜孜不倦。去年一篇被 CVPR 录用的论文，通过扩散模型重建视觉影像，给出了非常炸裂的效果—— AI 不光通过脑电波知道你看到了什么，并且帮你画了出来。第一行：人眼所见画面，第二...

人工智能 2024-03-19 人工智能

1309阅读

不只是高清放大！Magnific AI照片风格化功能上线

Magnific AI的照片风格化功能已经正式上线。这项全新的功能可以将你的任何照片转换成你所期望的任何风格。无论你想变换任何图像，都可以控制传输的样式数量和结构完整性，这为3D、视频游戏、室内设计、娱乐等领域提供了无限的用例。产品入口：https:/...

大数据 2024-03-19 人工智能

960阅读