生成模型第9页 - AIGC资讯

AI视野：通义千问发布Qwen1.5；背景分割开源模型RMBG v1.4来了；OpenAI 为 DALL-E3添加新水印；苹果图片项目MGIE上线试玩

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用通义千问团队发布...

AIGC 2024-02-07 人工智能

837阅读

抛弃编码器-解码器架构，用扩散模型做边缘检测效果更好，国防科大提出DiffusionEdge

现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构，以更好的提取多层次的特征，但这也限制了网络输出既准又细的边缘检测结果。针对这一问题，一篇 AAAI 2024 上的论文给出了新的解决方案。论文题目：DiffusionEd...

AIGC 2024-02-07 人工智能

955阅读

【读点论文】A Survey on Generative Diffusion Model，AIGC时代的新宠儿，从原理推导到工程应用，在视觉，自然语言，语音等领域大展拳脚

A Survey on Generative Diffusion Model Abstract 由于深度潜在表示，深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来，扩散模型以其强大的生成能力成...

生成式AI 2024-02-07 人工智能

1474阅读

实际案例：AIGC在艺术创作中的作用

1.背景介绍 1. 背景介绍随着人工智能技术的不断发展，AI生成模型已经成为艺术创作的一种重要手段。在这篇文章中，我们将探讨AIGC(AI-Generated Content 在艺术创作中的作用，并分析其在艺术领域的应用前景。 2. 核...

AIGC 2024-02-07 人工智能

2882阅读

AIGC实战——归一化流模型(Normalizing Flow Model)

AIGC实战——归一化流模型 0. 前言 1. 归一化流模型 1.1 归一化流模型基本原理 1.2 变量变换 1.3 雅可比行列式 1.4 变量变换方程 2. RealNVP 2.1 Two Moons 数据集 2.2 耦合层 2.3 通...

人工智能 2024-02-06 人工智能

1924阅读

【AIGC-图片生成视频系列-6】SSR-Encoder：用于主题驱动生成的通用编码器

目录一. 贡献概述二. 方法详解 a 训练阶段 b 推理生成阶段：三. 综合结果四. 注意力可视化五. 选择性主题驱动图像生成六. 人体图像生成七. 可推广到视频生成模型八. 论文九. 个人思考稳定扩散（S...

生成式AI 2024-02-06 人工智能

874阅读

Stable Video Diffusion 1.1 Image-to-Video官网体验入口 AI生成视频模型免费使用地址

Stable Video Diffusion 1.1 Image-to-Video是一款先进的扩散模型，通过将静止图像作为条件帧，生成相应的视频。该潜在扩散模型经过精心训练，能够从图像生成高质量的短视频片段。在 1024x576 分辨率下，该模型训练生成...

生成式AI 2024-02-05 人工智能

1040阅读

AI视野：通义千问推AI生成拜年视频；SVD1.1发布； AI对联网络走红；百度将举办Create AI开发者大会

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用通义千问上线AI...

大数据 2024-02-05 人工智能

804阅读

音频秒生全身虚拟人像，AI完美驱动面部肢体动作！UC伯克利Meta提出Audio2Photoreal

就在最近，Meta和UC伯克利联合提出了一种全新的虚拟人物形象生成的方法—— 直接根据音频生成全身人像，效果不仅逼真，还能模拟出原音频中包含的细节，比如手势、表情、情绪等等。图片论文地址：https://arxiv.org/abs/2401.0188...

人工智能 2024-02-05 人工智能

974阅读

SegMoE官网体验入口 AI图像生成框架免费使用地址

SegMoE是一个强大的框架，能够在几分钟内将稳定扩散模型动态组合成专家混合体，无需训练。该框架支持即时创建更大的模型，提供更多知识、更好的粘附性和更好的图像质量。受到 mergekit 的 mixtral 分支的启发，SegMoE 专为 Stable D...

生成式AI 2024-02-05 人工智能

756阅读

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗？｜ DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

随着科技飞速发展，CES（国际消费电子展）已然成为全球科技产业的风向标，每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会，不难发现其亮点纷呈，其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点，各大厂商纷纷展...

人工智能 2024-02-04 人工智能

1151阅读

AI视野：Hugging Face聊天助手上线；SVD的Web平台发放测试资格；AI模拟器“决战拜年之巅”走红；美图宣布2.85亿元收购站酷

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 Hugging F...

大数据 2024-02-04 人工智能

887阅读

【AI绘画】stable diffusion原理解读，通俗易懂，直接喂到你嘴里！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）文章目录一、前言（可跳过）二、stable diffusion 1.clip 2...

AIGC 2024-02-04 人工智能

1099阅读

人工智能大时代——AIGC综述

生成式AI分类模型按照输入输出的数据类型分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。...

生成式AI 2024-02-04 人工智能

1041阅读

Stable Diffusion保姆级安装教程

Stable Diffusion是一款强大的AI图像生成模型，被誉为最优秀的AI绘画工具之一，现在我们要与大家分享Stable Diffusion的本地部署教程，让你轻松体验！ 0、系统要求在开始之前，确保你的电脑硬件符合以下推荐配置： CPU：...

AIGC 2024-02-04 人工智能

1659阅读

登Nature子刊，滑铁卢大学团队评论「量子计算机+大语言模型」当下与未来

模拟当今量子计算设备的一个关键挑战，是学习和编码量子比特之间发生的复杂关联的能力。基于机器学习语言模型的新兴技术已经显示出学习量子态的独特能力。近日，加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《La...

AIGC 2024-02-04 人工智能

906阅读

陶哲轩看了都直呼内行！谷歌等用LLM自动证明定理拿顶会杰出论文，上下文越全证得越好

Transformer的技能树是越来越厉害了。来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校（UIUC）的研究人员发表了一篇论文，利用大语言模型自动生成定理的完整证明。论文地址：https://arxiv.org/pdf/2303.04910...

AIGC 2024-02-04 人工智能

961阅读

【AIGC-图片生成视频系列-3】AI视频随心而动：MotionCtrl的相机运动控制和物体运动控制

目录一. 项目简介二. 主要贡献三. 摘要四. 实现方法和管线五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...

AIGC 2024-02-04 人工智能

942阅读

智能家居:利用AIGC进行智能家居控制

1.背景介绍 1. 背景介绍智能家居已经成为现代生活中不可或缺的一部分，它利用了人工智能、互联网和自动化技术，使得家居设备能够更加智能化、高效化和安全化。在智能家居系统中，AIGC(人工智能生成模型技术的应用尤为重要，它可以帮助家居系统更...

人工智能 2024-02-03 人工智能

1064阅读

通过Stable Diffusion生成虚假的遥感影像

简介这两天玩了一下stable diffusion，是真的好玩！然后我在想遥感有没有相关的生成模型，找了一下，还真找到了（https://github.com/xiaoyuan1996/Stable-Diffusion-for-Remote-Se...

生成式AI 2024-02-03 人工智能

854阅读

快速入门ChatGPT和AIGC：底层原理、热门工具、行业现状【我们能做什么】

最近大家热议的ChatGPT和AI绘画工具的底层技术原理是什么？是如何发展到现在的？有哪些应用场景、热门工具？AIGC产业上下游有哪些公司？作为普通用户，我们还能接触哪些应用AI技术打造的商业解决方案？…… 我们查阅了AIGC相关相关的调研报告和各类资料...

AIGC 2024-02-03 人工智能

1363阅读

GPT的Dall E3绘画和midjourney绘画有什么区别，哪个更好用——沃卡AI已集成支持

AI绘画即指人工智能绘画，是一种计算机生成绘画的方式。是AIGC应用领域内的一大分支。 AI绘画主要分为两个部分，一个是对图像的分析与判断，即“学习”，一个是对图像的处理和还原，即“输出”。人工智能通过对数以万计的图像及绘画作品进行不断学习，如今已经...

大数据 2024-02-02 人工智能

931阅读

如何用Stable Diffusion生成高质量的图全网最全介绍！（附资料）

Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 提示词资料包（文末可获取） Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,...

生成式AI 2024-02-02 人工智能

2053阅读

谁能想到，一款3D建模AI工具成了Ins网红的视频创作利器

近期话题热度拉满的《幻兽帕鲁》AI抄袭瓜，想必各位一线冲浪玩家已经略有耳闻了。背后最大的争议之一在于，无经验的小团队快速开发出3D游戏大作，遥遥领先以往同类项目的生产力。多方争议之下，《幻兽帕鲁》AI抄袭瓜尚无定论。但3D内容制作确实正变得前所未有的...

生成式AI 2024-02-02 人工智能

1107阅读

Prompt 驱动架构设计：探索复杂 AIGC 应用的设计之道？

你是否曾经想过，当你在 Intellij IDEA 中输入一个段代码时，GitHub 是如何给你返回相关的结果的？其实，这背后的秘密就是围绕 Prompt 生成而构建的架构设计。 Prompt 是一个输入的文本段落或短语，用于引导 AI...

生成式AI 2024-02-02 人工智能

891阅读

AI视野：文心一言支持生成数字分身；Bard推出图片生成功能；亚马逊开发AI购物助手Rufus；苹果将推生成式AI功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用百度文心一言AP...

人工智能 2024-02-02 人工智能

783阅读

【扩散模型】万字长文全面理解与应用Stable Diffusion

万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...

AIGC 2024-02-02 人工智能

4027阅读

Stable Diffusion——外挂VAE模型

stablediffusion种的vae作用是什么? Stable Diffusion 是一种基于变分自编码器（VAE）的深度学习模型，其作用主要是用于文本生成图像。具体来说，VAE是一种生成模型，可以学习到数据的潜在表示空间，并将其用于生成...

AIGC 2024-02-01 人工智能

1305阅读

【思路合集】talking head generation+stable diffusion

1 以DiffusionVideoEditing为baseline：改进方向针对于自回归训练方式可能导致的漂移问题：训练时，在前一帧上引入小量的面部扭曲，模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。在像VoxCeleb或L...

人工智能 2024-02-01 人工智能

1035阅读

人类和AI的决策协作：决策问题的表述、解释和评价

在人工智能、数据可视化等领域，如何利用信息显示来辅助人类做出更好的决策，是一个重要的研究目标。什么是一个决策问题，以及如何设计一个能够有效评估人类决策的实验，没有一个明确的共识。在这篇文章中，我将为您解读一篇最新的论文，它提出了一个基于统计决策理论和信息...

人工智能 2024-02-01 人工智能

954阅读

Stable Diffusion（SD）核心基础知识——（文生图、图生图）

文章目录一、Stable Diffusion核心基础原理（一）Stable Diffusion模型工作流程（二）Stable Diffusion模型核心基础原理（三）Stable Diffusion的训练过程（四）其他主流生成式模型...

生成式AI 2024-02-01 人工智能

1723阅读

【AI绘图丨 Stable_diffusion 系列教程三】— 无需配置环境 | Colab直接运行Stable Diffusion web UI并从civitai中导入lora模型

目录一、Google Colab的基本介绍二、Google Colab 的使用 2.1 利用Google 浏览器搜索Google drive 2.2 注册一个Google 账号，点击转至账号登录 2.3 进入Google drive...

AIGC 2024-01-31 人工智能

1420阅读

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录 ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三） Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...

生成式AI 2024-01-31 人工智能

963阅读

Stable Diffusion学习

参考 Stable Diffusion原理详解_stable diffusion csdn-CSDN博客 Stable Diffusion是stability.ai开源的图像生成模型，可以说Stable Diffusion的发布将AI图像生成提高到了全新...

大数据 2024-01-31 人工智能

1003阅读

Code Llama 70B霸榜3连发，练习5个月击败GPT-4！小扎LeCun亲自官宣上新

今天，Meta正式发布了Code Llama 70B，作为Code Llama系列中规模最大，性能最强的版本，一举击败了GPT-4！目前，模型共有三个版本，均可免费用于研究和商业目的： CodeLlama - 70B：基础代码模型； CodeLlama...

AIGC 2024-01-31 人工智能

864阅读

Taiyi-Diffusion-XL体验入口中英文双语文生图AI模型开源工具在线使用地址

Taiyi-Diffusion-XL是一款开源的基于 Stable Diffusion 训练的双语文生图生成模型。该模型支持英文和中文的文本到图像生成，相比之前的中文文生图模型有了显著提升。Taiyi-Diffusion-XL 能够根据文本描述生成照片般逼...

生成式AI 2024-01-30 人工智能

940阅读

把图像视为外语，快手、北大多模态大模型媲美DALLE-3

当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展，能够理解和生成复杂的文本内容。但你是否想过，如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上，就可以轻松理解海量的图像与视频，并辅助创作图文并茂的内容。近期，来自快...

大数据 2024-01-30 人工智能

879阅读

ChatGPT vs 文心一言（AI助手全面比较）

随着人工智能的不断发展，ChatGPT（OpenAI）和文心一言都代表了当前先进的自然语言处理技术。它们在智能回复、语言准确性和知识库丰富度等方面都有各自的优势。在下面的比较中，我们将从多个角度探讨这两个AI助手，帮助你更好地选择适合你需求的工具。 1...

生成式AI 2024-01-30 人工智能

1028阅读

萤火跑模型 | 高性能 Stable Diffusion 助力高质量 AI 绘图

Stable Diffusion AI 绘画最近成功破圈，成了炙手可热的热门话题。DALLE，GLIDE，Stable Diffusion 等基于扩散机制的生成模型让 AI 作图发生质变，让人们看到了“AI...

人工智能 2024-01-30 人工智能

916阅读

重塑3D生成核心理论：VAST、港大、清华用「零」训练数据生成了3D模型

无需任何训练数据，只需对着模型描述一句话，如「一个做作业的香蕉人」：或是「一只戴着 VR 眼镜的猫」：就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此，还能对已有的 3D 模型进行精细化贴图。这是港大与清华大学联合 3D 生成明星...

AIGC 2024-01-29 人工智能

852阅读

ChatGPT和文心一言哪个好用？

#ChatGPT 和文心一言哪个更好用？# 在当今信息爆炸的时代，人们对于文本生成和创作工具的需求越来越高。在这个背景下，ChatGPT和文心一言作为备受瞩目的工具，各自拥有独特的功能和用途。在本文中，我们将深入探讨这两个工具的优势和适用场景，以帮助读者...

大数据 2024-01-29 人工智能

985阅读

RAG高阶技巧-如何实现窗口上下文检索

在本文中，我们将介绍一种提高RAG（Retrieval-Augmented Generation）模型检索效果的高阶技巧，即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题，然后介绍窗口上下文检索的原理和实现方法，最后通过一个实例展...

AIGC 2024-01-29 人工智能

1002阅读

AIGC笔记总结（一）：扩散模型简介

?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数...

人工智能 2024-01-29 人工智能

914阅读

AIGC时代-GPT-4和DALL·E 3的结合

在当今这个快速发展的数字时代，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从简单的自动化任务到复杂的决策制定，AI的应用范围日益扩大。而在这个广阔的领域中，有两个特别引人注目的名字：GPT-4和DALL·E 3。这两个AI系统在各自的领域内都取得...

生成式AI 2024-01-29 人工智能

965阅读

过去两周，六个最有可能改变AI进程的发布！

编译｜言征过去两周，新的人工智能更新不断涌现，异常疯狂。我们决定整理最近发布的六大框架和模型。 1、ActAnywhere：主题感知视频背景生成图片 Adobe Research和斯坦福大学推出了Act Anywhere，这是一种生成模型，解决了电...

人工智能 2024-01-29 人工智能

853阅读

AI绘画软件midjourney和Dall E3哪个更好用？——沃卡AI

AI绘画即指人工智能绘画，是一种计算机生成绘画的方式。是AIGC应用领域内的一大分支。 AI绘画主要分为两个部分，一个是对图像的分析与判断，即“学习”，一个是对图像的处理和还原，即“输出”。人工智能通过对数以万计的图像及绘画作品进行不断学习，如今已经...

大数据 2024-01-28 人工智能

1293阅读

一文教会你使用AI绘画利器Stable Diffusion！这可能是CSDN最全的AI绘画使用教程，建议收藏！

大家好，我是程序员晓晓随着 stable-diffusion 的开源，让更多人有机会直接参与到 AI 绘画的创作中，相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高，通常只能称作为"使用流程讲解"，但是通常没有对其原理和逻辑进行深入说明。...

AIGC 2024-01-28 人工智能

1926阅读

ChatGPT3.5、GPT4.0、DALL·E 3和Midjourney对话与绘画智能体验

MidTool（https://www.aimidtool.com/）是一个集成了多种先进人工智能技术的助手，它融合了ChatGPT3.5、GPT4.0、DALL·E 3和Midjourney等不同的智能服务，提供了一个多功能的体验。下面是这些技术的简要介...

人工智能 2024-01-27 人工智能

997阅读

如何使用AIGC进行语音识别和合成

1.背景介绍语音识别和合成是人工智能领域的重要技术，它们有助于实现自然语言与计算机之间的有效沟通。在这篇文章中，我们将探讨如何使用人工智能生成模型(AIGC 进行语音识别和合成。 1. 背景介绍语音识别是将声音转换为文本的过程，而语音...

AIGC 2024-01-27 人工智能

1221阅读

AI视野：ChatGPT模型大更新；阿里云发布多模态大模型；Runway视频生成输给Pixverse；百度推多模态模型UNIMO-G

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 ChatGPT模型...

AIGC 2024-01-26 人工智能

920阅读