生成模型第3页 - AIGC资讯

Stable Diffusion 秋叶整合包v4.7 ：解压即用，快速入门AI绘画

Stable Diffusion秋叶整合包，超简单一键安装Stable Diffusion，无任何使用门槛，完全免费使用，支持Nvdia全系列显卡，来自B站up@秋葉aaaki，近期发布了Stable Diffusion整合包v4版本，一键在本地部署Sta...

生成式AI 2024-07-19 人工智能

2009阅读

每日AIGC最新进展(45)：字节跳动开源大规模text-to-video数据集OpenVid-1M、浙江大学提出锚定条件控制视频生成GVDIFF、Meta AI研究院提出文生3D大模型3DGen

Diffusion Models专栏文章汇总：入门与实战 OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation https://nju-pcalab....

人工智能 2024-07-19 人工智能

1035阅读

每日AIGC最新进展(42)：首尔国立大学提出解耦运动建模视频插帧方法MoMo、维也纳工业大学提出减少3D高斯内存占用方法、哈索普拉特纳研究所提出改进 CLIP 中跨模式对齐的方法AlignCLIP

Diffusion Models专栏文章汇总：入门与实战 Disentangled Motion Modeling for Video Frame Interpolation 本文提出了一种新的视频帧插值(VFI 方法，名为MoMo，它通过解耦...

生成式AI 2024-07-19 人工智能

1075阅读

每日AIGC最新进展(33)：小米提出单步扩散模型SDXS、阿米蒂大学提出加速SD的统一模块LCM-LORA、国立台湾大学提出生成QR二维码的扩散模型

Diffusion Models专栏文章汇总：入门与实战 SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions 本文介绍了一种名为SDXS的新型实时一步潜在...

AIGC 2024-07-19 人工智能

885阅读

探索AI绘画的艺术！盘点全球8款顶尖AI绘画工具，开启您的创作之旅

AI绘画的艺术奥秘！ AI绘画艺术，是通过人工智能的强大力量实现的创作方式。它基于深度学习算法，从海量的艺术作品和图像中汲取灵感，进行分析和学习。接着，借助生成模型——例如著名的GAN（生成对抗网络）——AI能够根据用户的指导，创造出既新颖又独特的艺术作...

AIGC 2024-07-18 人工智能

1116阅读

【AIGC调研系列】AIGC赋能测试用例生成的案例

基于功能需求规格说明的测试用例自动生成方法研究表明，传统的测试用例生成方法存在一些局限性，如需要额外的建模成本和缺少测试输入数据等问题[2]。这为AIGC在测试用例生成中的应用提供了背景。AIGC技术，特别是像ChatGPT这样的模型，能够理解和生成自然语...

人工智能 2024-07-18 人工智能

1253阅读

AIGC各个应用场景下的模型选择

需要注意的是，下述模型可以在不同任务和领域中灵活应用，它们的归属也会根据模型的设计和主要应用领域而有所变化，并不绝对。自然语言处理模型模型层中自然语言理解(Natural LanguageUnderstanding，NLU 和自然语言生成(N...

生成式AI 2024-07-18 人工智能

997阅读

AI生成视频，究竟有多癫狂?

最近，各路视频生成AI放出的Demo让人眼花缭乱。“容嬷嬷喂紫薇吃香肠”“唐僧啃鸡腿、吃汉堡”“尔康失态”等“名场面”在各大短视频平台广为流传。 “刺激”的点在于，网友们无法预料一些经典的影视画面下一秒会衍生出什么剧情，也正因为如此，AI视频爆改在推出短短...

生成式AI 2024-07-18 人工智能

1128阅读

【AIGC-图片生成视频系列-7】MoonShot：实现多模态条件下的可控视频生成和编辑

目录一. 贡献概述二. 方法详解编辑三. Zero-Shot主题定制视频生成四. 文本到视频生成五. 直接使用图像ControlNet 六. 图像动画比较七. 视频编辑八. 针对视频生成中多模态 Cross-Attn的消融实...

人工智能 2024-07-16 人工智能

1170阅读

Diffusion【1】：SDSeg——基于Stable Diffusion的单步扩散分割！

文章目录前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...

大数据 2024-07-16 人工智能

1168阅读

ShowMeAI | 字节AIGC模型&工具大清单；AI解梦靠谱吗？AI MV制作手册；一文看懂MoE混合专家大模型；DeepSeek发布全球最强开源MoE模型

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ 1. 字节跳动生成式AI布局：卷到飞起的「App 工厂」这局也有点稳了？字节最近有点猛啊！出圈的AI产品越来越多，迭代速度肉眼可见的快，「App 工厂」...

人工智能 2024-07-15 人工智能

1135阅读

Stable Diffusion 3架构解析

在台湾举办的台北国际电脑展上，Stability AI CTO 兼联合 CEO Christian Laforte 与 AMD CEO 苏姿丰一起宣布文本到图像生成模型 Stable Diffusion 3 将于 6 月 12 日开源。一、扩散模型的...

人工智能 2024-07-14 人工智能

1373阅读

AIGC从入门到实战：安装权重文件和 LoRa 模型文件

1. 背景介绍 1.1 AIGC 的兴起与发展近年来，人工智能生成内容（AIGC）技术取得了显著的进步，其应用范围也日益广泛，涵盖了图像生成、文本创作、音频合成、视频制作等众多领域。AIGC 的兴起得益于深度学习技术的突破，特别是生成对抗网络（GAN...

AIGC 2024-07-14 人工智能

966阅读

如何“正确“使用Stable Diffusion？文本到图像扩散模型中记忆化实用分析（浙大）

论文链接：https://arxiv.org/pdf/2405.05846 它能被生成吗？文本到图像扩散模型中记忆化的实用分析过去几年见证了由扩散模型驱动的文本引导图像生成领域的重大进展。然而，已经显示出文本到图像扩散模型容易受到训练图像记忆的影响，引发...

人工智能 2024-07-13 人工智能

1105阅读

深入探索Stable Diffusion：从原理到应用的全面解析

目录一 Stable Diffusion的基本概念什么是Stable Diffusion？ Stable Diffusion与传统生成模型的区别二 Stable Diffusion的理论基础扩散过程的数学描述马尔可夫链蒙特卡罗方法（M...

生成式AI 2024-07-12 人工智能

1041阅读

Sora AIGC 介绍

Sora的概念介绍: 近年来，AI、大模型相关领域的发展可谓是一天一个脚印，一步一个台阶。从语音识别文字开始，再到chatgpt3、chatgpt4文字互动工具，以及midjourney等AI成图工具，再到现在的vison pro等VR交互设备和今天我们...

大数据 2024-07-12 人工智能

914阅读

Stable Diffusion：最全详细图解

Stable Diffusion，作为一种革命性的图像生成模型，自发布以来便因其卓越的生成质量和高效的计算性能而受到广泛关注。不同于以往的生成模型，Stable Diffusion在生成图像的过程中，采用了独特的扩散过程，结合深度学习技术，实现了从噪声到清...

人工智能 2024-07-10 人工智能

992阅读

70万人争先体验！视频生成新王者「可灵AI」又双叒升级了

难不成，AI 生成短剧时代真的要来了? 最近，各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻辑，层出不穷的人工智能创意难分高下，个个都要跟 Sora 试比高。这时候，突然有人偷偷先行一步，搞出了「电影级」的表现: 从...

生成式AI 2024-07-10 人工智能

937阅读

AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、可灵AI又放大招：上线Web端...

大数据 2024-07-08 人工智能

995阅读

千呼万唤的可灵网页版来了！基础模型重磅升级，新功能“炸场”WAIC

“这可能是本届WAIC上欢呼声最多的一场发布” 在刚刚闭幕的世界人工智能大会（WAIC）上，快手晒出了可灵发布一个月以来的成绩单: “超50万人申请，已开放给超30万用户使用，生成超700万条短视频。” 作为全球首个用户可用的真实影像级视频生成大模型，可灵...

生成式AI 2024-07-08 人工智能

881阅读

Stable Diffusion 3 开源发布可下载体验

本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型，其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。有关更多技术细节，请参阅研究论文。请注意：此...

人工智能 2024-07-06 人工智能

979阅读

AIGC：生成式模型简介

AIGC：生成式模型简介变分自编码器（VAE）生成对抗网络（GAN）自回归模型（Autoregressive Model）流模型（Flow Model）扩散模型（Diffusion Model）此博客将从原理、优点和缺点几...

大数据 2024-07-06 人工智能

1059阅读

AI视频创作一条龙！达摩院“寻光”平台炸场WAIC，突破可控编辑难题

AIGC时代，视频创作这事儿真的不一样了。就像这样，轻轻一圈，选定目标立刻变身单独图层，再丝滑嵌入不同的背景视频，场景变换so easy~ 想要调整一下镜头角度，交给AI，同样能一键完成: 还能一键消除、修改目标: 后期再也不用加班加到手抽筋（d...

大数据 2024-07-05 人工智能

826阅读

「创意无界，智领未来」：解锁AIGC技术的无限潜能与行业重塑力

文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深度...

大数据 2024-07-05 人工智能

912阅读

文献研读｜AIGC溯源场景及研究进展

前言：本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。相关文章：针对文生图模型的AIGC检测论文研读，参见此篇文章。如下图所示，在AIGC生成阶段，有4种溯源场景： 1）生成模型溯源训练数据 2）微调模型溯源预训练模型 3）AI...

生成式AI 2024-07-04 人工智能

1387阅读

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了? 一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情: 这场表演背后的...

生成式AI 2024-07-04 人工智能

1108阅读

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文！受大模型中的RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。在...

生成式AI 2024-07-04 人工智能

1008阅读

李彦宏大手笔布局AI短剧：百度数百万美元投资井英科技

快科技7月3日消息，CreativeFitting（井英科技）近日宣布完成由百度集团投资的数百万美元Pre-A 轮融资。据了解，井英科技一家专注于AIGC视频生成模型自主研发的公司，计划利用这笔资金进一步升级其AI视频模型和工具，加强内容生态系统的构建。...

大数据 2024-07-03 人工智能

729阅读

论文研读｜针对文生图模型的AIGC检测

前言：人工智能生成内容的鉴别（AIGC检测）算是当前的研究热点之一，本篇文章介绍几篇针对文生图模型的 AIGC 检测相关工作。相关文章：AIGC溯源相关研究详见此篇文章目录 1. Towards Universal Fake...

AIGC 2024-07-03 人工智能

1446阅读

每日AIGC最新进展(37)：达姆施塔特工业大学提出分布式协作扩散模型CollaFuse、卡耐基梅隆大学提出扩散模型简易一致性调优方法、俄罗斯Yandex提出可逆一致性蒸馏

Diffusion Models专栏文章汇总：入门与实战 CollaFuse: Collaborative Diffusion Models CollaFuse是一种创新的分布式协作扩散模型，旨在解决传统图像生成模型在数据可用性、计算需求和隐私方面...

人工智能 2024-07-02 人工智能

843阅读

AI绘图软件midjourney的底层模型是什么？

生成式模型Midjourney如何工作： Midjourney 的底层模型是一个大型语言模型 (LLM ，它已经在海量图像和文本数据集上进行了训练。能够生成既逼真又富有创意的图像。Midjourney 的一些优势包括：准确性、创造力、速度。 LLM...

人工智能 2024-07-02 人工智能

1301阅读

天才程序员周弈帆 | Stable Diffusion 解读（二）：论文精读

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（二）：论文精读【小小题外话】端午安康！在上一篇文章天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早...

大数据 2024-06-27 人工智能

1209阅读

Stable Diffusion 3 使用指南：安装与实例详解

Stable Diffusion 3 使用指南：安装与实例详解 Stable Diffusion 3（SD 3）终于来了！作为最新版本的图像生成模型，SD 3 在功能和性能上都有了显著提升。本文将带你深入了解 SD 3 的用法和安装指导，帮助你快速上手...

生成式AI 2024-06-27 人工智能

1053阅读

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代关键词：Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率原...

AIGC 2024-06-26 人工智能

911阅读

每日AIGC最新进展(29)：复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流

Diffusion Models专栏文章汇总：入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法，旨在通过人类反馈...

AIGC 2024-06-25 人工智能

885阅读

腾讯混元文生图大模型开源训练代码，发布LoRA与ControlNet插件

6月21日，腾讯混元文生图大模型（以下简称为混元 DiT 模型）宣布全面开源训练代码，同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。这意味着，全球的企业与个人开发者、创作者们，都可以基于混元 DiT 训练代...

生成式AI 2024-06-24 人工智能

856阅读

Stable Diffusion模型训练 — 前菜

图像生成模型原理简析你有没有好奇过，AI图像生成模型是怎么学会“绘画”的吗？人工智能（Artificial Iitelligence）这个概念是在1956年的达特矛斯会议上提出来的认为机器可以模仿人类的学习以及其他方面的智能，后世也将实现人工智能的方式...

AIGC 2024-06-24 人工智能

853阅读

大模型学习路线（9）——AIGC其它相关技术

前言：博主没力气写了，快被csdn榨干了，这个章节就推几篇系统化的还不错的文章吧......AIGC技术相关的demo可以在HuggingFace、Modelscope、PaddlePaddle等各大社区找到。 AIGC技术和应...

AIGC 2024-06-23 人工智能

1142阅读

苹果AI遇阻：Apple Intelligence无缘欧盟市场

快科技6月22日消息，苹果公司发布声明，因欧盟《数字市场法》带来的不确定性，欧盟用户今年无法获得Apple Intelligence、iPhone Mirroring和SharePlay Screen Sharing三大功能。其中Apple Intell...

AIGC 2024-06-23 人工智能

808阅读

SiliconCloud上新：GLM-4-9B，通用能力超越Llama 3

今天，智谱发布了第四代 GLM 系列开源模型：GLM-4-9B。 GLM-4-9B 系列模型包括：基础版本 GLM-4-9B（8K）、对话版本 GLM-4-9B-Chat（128K）、超长上下文版本 GLM-4-9B-Chat-1M（1M）和多...

AIGC 2024-06-23 人工智能

1141阅读

AI日报：前百度高管推AI搜索产品Genspark；Kimi内测上下文缓存功能；TikTok推AI全家桶Symphony；橙篇已支持10万字长文生成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、前百度高管景鲲创业AI搜索估值...

AIGC 2024-06-20 人工智能

999阅读

InsCode Stable Diffusion使用教程（非常详细）从零基础入门到精通，看完这一篇就够了_outpainting 模型下载

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7 深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙...

人工智能 2024-06-20 人工智能

1022阅读

雨云GPU云服务器搭建S搭建自己的AI绘画网站

雨云GPU云服务器搭建SD(Stable Diffusion 的教程，搭建自己的AI绘画网站，AIGC 2024年2月22日 · 阅读需 8 分钟雨云GPU云服务器搭建Stable Diffusion的教程，搭建自己的AI图片生成网站，AIGC...

大数据 2024-06-19 人工智能

886阅读

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

1398阅读

AI视频进入有声时代！谷歌发布视频生成音频技术，效果丝滑惊艳网友！

Runway前脚刚发布Gen-3Alpha，Google后脚就跟了个王炸。北京时间6月18日凌晨，Google Deepmind发布了视频生成音频（Video-to-Audio，V2A）技术的进展，可以为视频创建戏剧性的背景音乐，逼真的音效，甚至是人物...

AIGC 2024-06-19 人工智能

824阅读

【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。 * prompt 史诗...

AIGC 2024-06-19 人工智能

1429阅读

stable diffusion基本原理

stable diffusion基本原理 ChatGPT Stable Diffusion是一种用于图像生成和编辑的深度学习模型，其基本原理基于扩散模型（diffusion models）。扩散模型是一种生成模型，通过模拟数据从噪声到目标分布的过程...

AIGC 2024-06-18 人工智能

1238阅读

全国最具价值的AIGC培训免费课程

关于课程课程名称 AIGC 驱动的新质电商运营精英实战训练营课程价格 699元包含所有学习权益+所有兼职、实习、就业权益 + 中国软件行业协会监制的中国软件行业专业技术能力“AIGC提示词工程师”认证证书。课程价值线下两...

生成式AI 2024-06-17 人工智能

1491阅读

AIGC从入门到实战：落霞与孤鹜齐飞：AIGC 汹涌而来

作者：禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...

人工智能 2024-06-17 人工智能

968阅读

吴恩达老师开源翻译工作流Agent；阿里巴巴开源无需训练即可使用参考图像编辑图像的工具；Whisper Web 浏览器字幕生成

✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其主要步骤包括：使用大语...

AIGC 2024-06-16 人工智能

982阅读