-
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架!
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架! 原创 小源 数源AI 2024-01-29 20:19 浙江 数源AI 知识星球 数源AI论文推荐知识星球(每日最新论文及资...
-
聚观早报 | 理想L6正式发布;Meta发布Llama 3
聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 4月20日消息 理想L6正式发布 Meta发布Llama 3 比亚迪秦L内饰曝光 小米14 Ultra推送新版澎湃...
-
一文了解AI绘画两大鼻祖 Midjourney 和 Stable Diffusion的区别,超详细讲解小白入门必看教程!
大家好,我是画画的小强 要说AI绘画软件哪家强?有人说Midjoureny (MJ , 有人说Stable Diffuion(SD ,那他们到底有什么区别?应该选择哪款软件学习?今天带大家全面了解一下!文末可白嫖AI资料哦~ 一.使用费用对比...
-
AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos]
AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos] 论文地址:https://arxiv.org/abs/2207.110...
-
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 GitHub:http...
-
使用BERT的LLM提取摘要
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在当今快节奏的世界里,充斥着太多的信息,并且难以处理。人们越来越习惯于在更短的时间内接收更多的信息,当他们不得不阅读大量的文件或书籍时...
-
“真假难辨”!巧用NeRF生成的自动驾驶仿真数据
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的有前途的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式...
-
ai作画在线生成!这8个AI生图工具一定要知道。
过去的2023年被称作AI元年,随之而来的2024,被业内人士称之为AI应用元年,即随着大模型和各类AI应用的涌现速度放缓,人们关注的焦点也从产品层面(有哪些好用的AI应用),转移到AI如何更好地赋能实际业务的应用场景。 就大多数人的日常工作而言,最常见...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型
无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」: 或是「一只戴着 VR 眼镜的猫」: 就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此,还能对已有的 3D 模型进行精细化贴图。 这是港大与清华大学联合 3D 生成明星...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
史上最全midjourney关键词
最全midjourney关键词,篇幅太长,文章最后有可编辑版本获取链接 增强图片真实感、清晰度 unreal engine 虚幻引擎 ultra realistic 超真实 photography 摄影图片 detailed 细节...
-
杰克逊跳舞秒变3D机器人!阿里又出新活儿,视频任何人可替换
这究竟是怎么回事? 原来啊,阿里又整出新活儿—— MotionShop,能将视频中的人物角色替换成3D形象,同时又不改变其他场景和人物。 比如,打工仔小猪打太极。 看到这有人已经迫不及待了。目前已在ModelScope社区开放试玩。 还有人建议说在Hu...
-
开始弃用NeRF?为什么Gaussian Splatting在自动驾驶场景如此受欢迎?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 三维 Gaussian splatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经...
-
AI 时间是能编辑的,空间是可计算的 |N4 连麦对谈 AIGC
本期关键词:AIPC、生成式AI、ComfyUI、应用、场景、超级个体、算力、数据、组织模式、范式更新、AI 绘画 在数字化浪潮中,我们正处于各种范式更新的窗口期。AI 看似已经变得无所不能,可以预见的是,未来还可能会出现更强大的电脑设备和...
-
GauHuman开源:基于Gaussian Splatting,高质量3D人体快速重建和实时渲染框架
论文名称:GauHuman: Articulated Gaussian Splatting from Monocular Human Videos 论文下载地址:https://arxiv.org/abs/2312.02973 项目主页:https...
-
一部iPhone实时渲染300平房间,精度达厘米级别!谷歌最新研究证明NeRF没死
3D实时渲染大型场景,一台电脑,甚至一部手机就可以完成。 从家里的客厅到主卧,储物间,厨房,卫生间各个死角,都能逼真在电脑中完成渲染,如同拍摄实物视频一般。 而且,你还可以在一台iPhone上完成复杂场景渲染。 来自谷歌、谷歌DeepMind和图宾根...
-
【AI绘画】万字长文——(超详细)ControlNet的详细介绍&使用Stable Diffusion的艺术二维码完全生成攻略
目录 前言 一、名词解释 1-1、Stable Diffusion介绍 1-2、ControlNet介绍 1-2-1、ControlNet介绍&工作原理 1-2-2、ControlNet控制方法介绍 1-3、案例分析 1-3-1...
-
【AIGC风格prompt】风格类绘画风格的提示词技巧
风格类绘画风格的提示词展示 主题:首先需要确定绘画的主题,例如动物、自然景观、人物等。 描述:根据主题提供详细的描述,包括颜色、情感、场景等。 绘画细节:描述绘画中的细节,例如表情、纹理、光影等。 场景描述:提供更详细的场景描述,包括背景、环境、氛围等...
-
李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了
AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获取较为容易,因此从单目摄像头中渲染人体一直是研究的主要方式。Vid2Avatar、MonoHuman 和 NeuMan 等方法都取得了令人瞩目的成绩。尽管只有一个摄...
-
基于Stable Diffusion的2D游戏关卡生成【实战】
接下来的几篇文章将与常规主题有所不同(这是在从事通用机器人技术的职业中吸取的教训)。 相反,我决定利用我的一些新空闲时间 1 边做边学,并使用所有酷孩子都在谈论的一些很酷的新 ML。 推荐:用 NSDT设计器 快速搭建可编程3D场景。...
-
Midjourney从0开始使用笔记
前置条件:首先需要能访问外网的某个工具 1、注册社区账号:https://discord.com/register 2、注册并登陆,并通过邮箱验证成功。会提示你创建一个服务器,随便选一个创建完成 3、点击下方的探索更多服务器,并搜索Midjou...
-
Midjourney V6史诗级升级,网友惊呼太逼真!神图接连曝出,传今明两天上线
Midjourney V6,正在紧急RLHF中。上线倒计时,已经开始! 今天早上,Midjourney V6开启了第二次社区评价。用户需要做标注,标注200张送1小时时长。 网友们纷纷甩出神图,图片细节逼真,效果惊人:张张都是大片。 图片 图片 这次V...
-
逆天!真实可控、可拓展,自动驾驶仿真平台LightSim上新
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
NeuRAD: 用于自动驾驶的神经渲染(多数据集SOTA)
论文"NeuRAD: Neural Rendering for Autonomous Driving",来自Zenseact,Chalmers科技大学,Linkoping大学和Lund大学。 神经辐射场(NeRF)在自动驾驶(AD)社区中越来越受欢迎。最...
-
“懒人”设计师必备的AI绘画软件,轻松实现建筑设计闭环
最近这两个月AI设计席卷整个设计圈 现如今手头上没一两个AI工具 你都不好意思说自己是新时代设计师 目前主流的AI绘画软件有midjourney、Stable Diffusion 基本上都能自动打造超高质量的渲染图纸 但即便如此,仍有不少“懒人”...
-
AI绘图工具——Midjourney使用笔记
引言 本人非Midjourney大神,仅出于个人兴趣对相关技术做了粗浅尝试,此笔记仅代表个人理解,如有错误感谢指正 相关资源 Midjourney官方教学资料Midjourney官网discord官网B站学习资源推荐 账号注册 获取网络访...
-
一种新型的NeRF技术可以将视频转换成易于控制的3D模型
译者 | 布加迪 审校 | 重楼 由于人体运动的复杂性和外观在不同环境下的细微差异,由视频片段创建逼真的动画3D模型一直是计算机图形学领域面临的长期挑战。在过去,这个过程依赖成本高昂的劳动密集型技术,比如多摄像头装置和详细的手动建模,因而无法用于普通或...
-
设计神器Varys AI 专为专业室内设计师和建筑师打造
Varys AI是一款专为专业室内设计师和建筑师打造的人工智能工具。它采用先进的GPT技术,以提供全面的设计解决方案,涵盖室内渲染、楼层平面图生成和智能建议等多项功能。该工具以提高设计效率和业务绩效为目标,为用户提供即时、高质量的设计支持。 Varys A...
-
stable diffusion教程,详细版,包括解决各种问题
前提: 需要环境 git git下载地址Git - Downloading Package 直接装即可 python3.10.6 下载地址 Python Release Python 3.10.6 | Python.org 记得p...
-
谷歌Bard「破防」,用自然语言解开,提示注入引起数据泄漏风险
大型语言模型在生成文本时非常依赖提示词。这种攻击技术对于通过提示词学习模型而言可谓是「以彼之矛,攻己之盾」,是最强长项,同时也是难以防范的软肋。 提示词分为系统指令和用户给出的指令,在自然语言中,这两者难以区分。如果用户有意在输入提示词时,模仿系统指令,...
-
Stable Diffusion 准确绘制人物动作及手脚细节(需ControlNet扩展)
目前AI绘图还是比较像开盲盒,虽然能根据语义提供惊艳的图片,但是与设计师所构思的目标还是有一定距离。 那像我们这种没有绘画功底的程序员想要制作出心中的人物(尤其手脚)姿态,该怎样减少随机开盒的次数呢? 本文提供几种精确控制人物动作的方法。 安装及其问...
-
stable-diffusion-webui手动安装详细步骤(以及报错解决、踩坑)
文章目录 大话stable-diffusion-webui系列 AMD显卡请看这篇文章 前提 问题 环境 安装过程 升级CUDA驱动 安装CUDAToolKit 安装cuDNN 克隆项目地址 安装Pytorch 启动项目 题外话...
-
python爬虫1
1.1 网络爬虫概述 网络爬虫(又被称为网络蜘蛛、网络机器人,在某社区中经常被称为网页追逐者),可以按照指定的规则(网络爬虫的算法)自动浏览或抓取网络中的信息,通过 Python 可以很轻松地编写爬虫程序或者是脚本。 在学习爬虫时不仅需要了解爬虫的实...