高保真 - AIGC资讯

【扩散模型（八）】Stable Diffusion 3 diffusers 源码详解2 - DiT 与 MMDiT 相关代码（下）

系列文章目录【扩散模型（一）】中介绍了 Stable Diffusion 可以被理解为重建分支（reconstruction branch）和条件分支（condition branch）【扩散模型（二）】IP-Adapter 从条件分支的视角，快...

AIGC 2024-09-17 人工智能

1604阅读

深度剖析Google黑科技RB-Modulation：告别繁琐训练，拥抱无限创意生成和风格迁移！

给定单个参考图像，RB-Modulation提供了一个无需训练的即插即用解决方案，用于(a 风格化和(b 具有各种提示的内容样式组合，同时保持样本多样性和提示对齐。例如，给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ，RB...

人工智能 2024-09-05 人工智能

925阅读

CVPR`24 | 又快又好！渲染速度比ENeRF快30倍！4K4D:实时4K分辨率4D视图合成

文章链接：https://arxiv.org/pdf/2310.11448 git链接： https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近，一些动态视图合成方法在渲染质量方面...

生成式AI 2024-09-04 人工智能

1008阅读

AIGC从入门到实战：涌现：人工智能的应用

AIGC从入门到实战：涌现：人工智能的应用作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：AI生成内容、涌现现象、应用案例、技术挑战、未来展望 1. 背景介绍 1.1 问题...

生成式AI 2024-08-25 人工智能

892阅读

AI绘画大模型-StableDiffusion最强模型sd3（本地安装方法）

前言/introduction Stable Diffusion 3（简称SD3）是Stability AI最新推出的文本到图像生成模型。相比前代模型，SD3在生成质量、细节表现以及运行效率上有了显著提升，尤其在细腻的图像渲染和复杂...

人工智能 2024-08-23 人工智能

1837阅读

【三维重建】Pixel-GS:三维高斯泼溅的像素感知的梯度密度控制（去除浮点，提升精度）

项目：https://pixelgs.github.io/标题：Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting来源：香港大学；腾讯AI Lab...

人工智能 2024-08-22 人工智能

1937阅读

【亲测】如何注册使用Midjourney

原文链接：Midjourney 如何订阅注册及使用基础教程 1.Midjourney是什么 Midjourney是一个基于人工智能的图像生成工具，它可以根据文本提示创建图像。也就是说你告诉它你想要一个什么样的图片，把你的要求告诉它，它就能按照你给的...

人工智能 2024-08-18 人工智能

868阅读

【AIGC 】一篇文章，帮你了解什么是虚拟数字人？

1.数字人的三方面特征虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同，虚拟数字人依赖显示设备存在，我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。虚拟数字人宜具备以下三方面特征: 一是拥有人的外观，具有特...

人工智能 2024-08-12 人工智能

1247阅读

每日AIGC最新进展(53)：中科大提出物理模拟人物化身PICA、厦门大学提出音频驱动的头部视频编辑StyleGAN、上交提出蒙特卡洛逆向渲染3D对象方法

Diffusion Models专栏文章汇总：入门与实战 PICA: Physics-Integrated Clothed Avatar 本文介绍了PICA，一种新型的高保真可动人物化身表示方法，能够实现物理精确的动态模拟，尤其适用于宽松衣物。...

生成式AI 2024-08-04 人工智能

1052阅读

AI日报：阿里又推王炸级对口型项目EchoMimic；三星推Galaxy Ring智能戒指；高保真3D头像生成模型RodinHD

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、AI对口型项目EchoMimi...

AIGC 2024-07-11 人工智能

957阅读

AIGC生成论文汇总

1.1 无特定身份人物生成（Non-identity Generation） (1 变分自动编码器（Variational Auto-Encoder） 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...

大数据 2024-07-08 人工智能

948阅读

提高Stable Diffusion渲染速度的技巧，来学习一下

了解如何使用快速、简单的修复将渲染速度提高高达 50%。了解特定配置如何优化您的Stable Diffusion过程并提高 Nvidia显卡上的渲染效率。ai绘图渲染速度太慢怎么办？请继续阅读，了解如何实现这个三秒解决方案并最大限度地提高渲染速度，想要提高...

AIGC 2024-06-25 人工智能

1759阅读

霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为Hallo的研究火了，GitHub已揽星1k+。话不多说，来看更多效果: 不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独...

大数据 2024-06-18 人工智能

921阅读

Stable Diffusion及Fooocus图片放大方法(超分辨率)体会与比较

简单地聊一下图像超分辨率的几种手段与优劣。由SD或Fooocus等AIGC应用生成的图片一般分辨率（大小）都受到限制，基本是1024左右。为了将小图放大到4k，或8k，出现了很多图片放大的手段（这里强调以图像超分辨率为目的，要放大，也要合理地增加细节，...

AIGC 2024-06-14 人工智能

1353阅读

港科大最新！Vista：一种具有高保真度和多功能可控的世界模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...

人工智能 2024-06-04 人工智能

1055阅读

AI日报：ChatGPT推全能型版本ChatGPT Edu；快手上线文生图产品可图；阿里宝藏项目被Novita AI开源了；Midjourney将发布V6.5版本

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、ChatGPT Edu版本来啦...

人工智能 2024-05-31 人工智能

903阅读

CVPR 2024 | 风格迁移和人像生成汇总！扩散模型diffusion用于经典AIGC方向

风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而，...

生成式AI 2024-05-25 人工智能

1278阅读

CVPR 2024｜多模态场景感知，小红书高保真人体运动预测方法来了！

设想一下，你在家中准备起身，前往橱柜取东西。一个集成 SIF3D 技术的智能家居系统，已经预测出你的行动路线（路线通畅，避开桌椅障碍物）。当你接近橱柜时，系统已经理解了你的意图，柜门在你达到之前就已自动打开，无需手动操作。视频中，左边为 3D 场景...

AIGC 2024-05-22 人工智能

994阅读

UI设计必看！5个好用的AI设计工具提升应用设计、系统设计效率

AI技术在提升应用设计和系统设计效率方面发挥着越来越重要的作用。以下是一些被推荐的AI工具，它们可以帮助设计师和开发人员提高工作效率: Uizard 一款生成式AI设计工具，能够根据文本提示生成UI设计，支持从手绘草图生成高保真屏幕，并允许对现有设计进行逆...

人工智能 2024-05-10 人工智能

1117阅读

智者无畏！Vidda发布X Ultra系列AI电视和C2系列三色激光投影

5月8日，海信旗下年轻科技潮牌Vidda在北京正式发布新品AI电视和三色激光智能投影。“智者无畏”的主题展现了Vidda品牌对年轻人场景的全新探索和无惧无畏的精神面貌，而强大的产品阵容更是再一次诠释了质价比的定义。据Vidda副总经理郭琛介绍:2023年...

人工智能 2024-05-09 人工智能

849阅读

LeCun转发，AI让失语者重新说话！纽约大学发布全新「神经-语音」解码器

脑机接口（BCI）在科研和应用领域的进展在近期屡屡获得广泛的关注，大家通常都对脑机接口的应用前景有着广泛的畅享。比如，由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活，还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展，...

人工智能 2024-05-07 人工智能

861阅读

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

Sora刚发布后没多久，火眼金睛的网友们就发现了不少bug，比如模型对物理世界知之甚少，小狗在走路的时候，两条前腿就出现了交错问题，让人非常出戏。对于生成视频的真实感来说，物体的交互非常重要，但目前来说，合成真实3D物体在交互中的动态行为仍然非常困难。...

AIGC 2024-05-07 人工智能

867阅读

AI视频生成工具ID-Animator：可保持角色一致生成视频动画

近年来，生成具有指定身份的高保真人类视频引起了广泛关注。然而，现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法，可以在无需...

大数据 2024-04-25 人工智能

905阅读

SurMo官网体验入口 AI人体渲染动态建模工具使用地址

SurMo是一种新的动态人体渲染范式，通过联合建模时间运动动力学和人体外观，在一个统一的框架中实现高保真的人体渲染。该方法采用基于表面的三平面表示法高效编码人体运动，并设计了物理运动解码模块和4D外观解码模块，能够合成时变的人体外观效果，如衣服皱褶、运动阴...

大数据 2024-04-09 人工智能

944阅读

腾讯开源视频生成新工具，论文还没发先上代码的那种

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 先上代码再发论文，腾讯新开源文生视频工具火了。名为MuseV，主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。老规矩，先看...

人工智能 2024-04-03 人工智能

845阅读

MuseV官网体验入口虚拟人AI视频生成软件使用地址

MuseV是一个基于扩散模型的虚拟人视频生成框架，支持无限长度视频生成，采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型，支持Image2Video、Text2Image2Video、Video2Video等功能，兼容Stable Di...

AIGC 2024-04-02 人工智能

1056阅读

为自动驾驶而生，Lightning NeRF：速度提升10倍

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性，加上驾驶场景中的视点受限，使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...

人工智能 2024-03-19 人工智能

816阅读

Hotshot - ACT 1官网体验入口文生视频AI系统使用方法教程指南

Hotshot - ACT 1是一个由Hotshot Research开发的直接文本到视频合成系统，它能够生成高清晰度的视频，具有多种宽高比且无水印，提供引人入胜的用户体验。该系统通过使用大规模高分辨率文本视频语料库进行训练，以实现高保真度的空间对齐、时间...

AIGC 2024-03-13 人工智能

871阅读

徕卡影像之王小米科普14 Ultra首个AI大模型计算摄影

快科技3月13日消息，今年2月，徕卡影像之王小米14Ultra正式发布，这是小米有史以来最强悍的影像旗舰，不仅配备全新Summilux全明星四摄，还首次搭载AI大模型计算摄影平台Xiaomi AISP。 Xiaomi AISP是小米影像大脑的全新升级今日，...

人工智能 2024-03-13 人工智能

830阅读

CRM官网体验入口 AI图像处理3D建模神器免费在线使用地址

CRM是一个高保真的单图像到3D纹理网格的生成模型，它通过整合几何先验到网络设计中，能够从单个输入图像生成六个正交视图图像，然后利用卷积U-Net创建高分辨率的三平面（triplane）。CRM进一步使用Flexicubes作为几何表示，便于在纹理网格上进...

人工智能 2024-03-12 人工智能

887阅读

今日AI：字节发布SD神器ResAdapter；阿里推图生视频框架AtomoVideo；抖音推出全新AI社交产品“话炉”；小红书博主吐槽自家猫被AI换脸

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用字节发布ResAd...

生成式AI 2024-03-06 人工智能

810阅读

AtomoVideo官网体验入口 AI图像生成视频工具免费下载地址

AtomoVideo是一个新颖的高保真图像到视频（I2V）生成框架，可以从输入图像生成高保真视频。与现有工作相比，它实现了更好的运动强度和一致性，并且无需特定调整即可与各种个性化T2I模型兼容。点击前往AtomoVideo官网体验入口谁可以从Atom...

AIGC 2024-03-06 人工智能

1107阅读

小鬼当家音乐系统采集插件：数字时代的家庭音乐新体验

随着数字技术的不断革新和智能家居的日渐普及，人们的家居生活也在不断与时俱进，其中的变化之一便是家庭娱乐系统的升级。而音乐作为娱乐的重要组成部分，一直都是家居生活中不可或缺的元素。在这一背景下，“小鬼当家音乐系统采集插件”应运而生，为现代家庭带来了全新的音乐...

AIGC 2024-03-06 大数据

868阅读

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

最近，OpenAI 的视频生成模型 Sora 爆火，生成式 AI 模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的，生物体通过不同的渠道感知和交换信息，包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...

AIGC 2024-03-04 人工智能

785阅读

AI绘画专栏之Comfyui之AnimateDiffLCM更快效果更佳工作流分享

AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习，该项目提出了一种解耦的一致性学习策略，分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。那么关于两个...

人工智能 2024-02-23 人工智能

1301阅读

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩

耗费的计算资源仅为传统Stable Video Diffusion（SVD）模型的2/25！ AnimateLCM-SVD-xt发布，一改视频扩散模型进行重复去噪，既耗时又需大量计算的问题。先来看一波生成的动画效果。赛博朋克风轻松驾驭，男孩头戴耳机，...

大数据 2024-02-20 人工智能

916阅读

Sora模型体验入口 OpenAI文生视频软件工具app免费下载地址

Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频，涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练，将其分解为时空位置补丁，实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字...

AIGC 2024-02-16 人工智能

1002阅读

Sora官网体验入口 OpenAI最新文生视频模型免费在线使用地址

Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频，涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练，将其分解为时空位置补丁，实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字...

人工智能 2024-02-16 人工智能

1240阅读

AI新工具(20240203) 文心一言APP数字分身；HuggingChat Assistants等

文心一言APP数字分身-一键生成专属数字分身文心一言数字分身是一项新功能，用户只需一张照片和录制三句语音，就能创建一个专属的数字分身。这个数字分身还支持个性化定义名称、声音、MBTI性格等，用户可以选择是否公开自己的数字分身。这个功能的上线大大缩短...

AIGC 2024-02-10 人工智能

1259阅读

【读点论文】A Survey on Generative Diffusion Model，AIGC时代的新宠儿，从原理推导到工程应用，在视觉，自然语言，语音等领域大展拳脚

A Survey on Generative Diffusion Model Abstract 由于深度潜在表示，深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来，扩散模型以其强大的生成能力成...

生成式AI 2024-02-07 人工智能

1474阅读

【CV】稳定扩散模型（Stable Diffusion）

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自...

人工智能 2024-02-03 人工智能

1009阅读

数据为王！如何通过数据一步步构建高效的自动驾驶算法？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈，学术界和业界一致认为，克服瓶颈的关键在于以...

生成式AI 2024-02-02 人工智能

1069阅读

小红书开源「InstantID」效果炸裂，被Yann LeCun点赞，迅速蹿上Github热榜

最近，有一群来自小红书的 95 后神秘团队，自称 InstantX，搞了个大动作 —— 开源「InstantID」项目。 InstantID 凭借着高质量的图像生成能力，在开源界掀起了一股热潮：不仅获得了众多技术大佬的点赞，更是在 GitHub 热榜上迅...

人工智能 2024-02-01 人工智能

933阅读

【AIGC-文本/图片生成视频系列-9】MagicVideo-V2: 多阶段高美感视频生成

目录一. 项目概述与贡献二. 方法详解编辑三. 文本生成视频相关结果四. 与其他方法对比结果五. 个人感悟最近得益于扩散模型的快速发展，文本到视频（T2V）模型的激增。今天要介绍的是字节的MagicVideo-V2，一个新颖...

生成式AI 2024-01-30 人工智能

1223阅读

无缝衔接Stable Diffusion，一张照片几秒钟就能生成个性化图片-InstantID

最近一段时间基于扩散模型的图像处理方法遍地开花，接下来为大家介绍一种风格化图像的方法InstantID，可以通过仅有一张人脸照片，几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同，InstantID只需一张图像...

AIGC 2024-01-30 人工智能

1120阅读

UltrAvatar官网体验入口 AI生成逼真可动3D头像生成模型在线使用地址

UltrAvatar是一款逼真可动的3D头像生成模型，它采用先进的AI技术，可以生成高保真度、高质量的3D头像。UltrAvatar应用了Score Distillation Sampling (SDS loss和可微分渲染器以及文本条件来引导扩散模型生...

生成式AI 2024-01-23 人工智能

1010阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格: 仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，把...

生成式AI 2024-01-19 人工智能

837阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格：仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，...

生成式AI 2024-01-18 人工智能

862阅读

Yann LeCun发来肯定：腾讯人像照片生成可以随便玩了

这一次，Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你，一身古装在故宫门前打卡留念…… 就连本人也出来转发并喊话，「左下角这幅文艺复兴时期的画，是我的最爱。」性感女神寡姐身穿紫色巫师服注视着远方，还可...

生成式AI 2024-01-16 人工智能

761阅读

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞

大厂们在整活方面开始卷起来了！前脚字节阿里的工具火了，现在腾讯这个新照片生成应用PhotoMaker直接刷屏，瞧这阵仗…… 只需上传一张或以上照片，无需额外LoRA训练，就能快速可定制。任何人、任何风格，高保真那种。于是秒秒钟，LeCun化身钢铁侠...

AIGC 2024-01-16 人工智能

795阅读