-
Stable Diffusion:一文搞懂提示词
杰出的画作展现了艺术家们独特的想象力、生动的表达力和精湛的技艺。如今AI绘画工具似乎已解决了技艺的问题,创作出理想的画作似乎应该是一件轻而易举的事。 但是,AI绘画工具只是机器,如何让它正确地绘制出我们想要的画作呢?这就是本文要讲的内容 —— AI绘画中...
-
论文阅读-Transformer Layers as Painters
1. 摘要 尽管大语言模型现在已经被广泛的应用于各种任务,但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响,本文设计了一系列的实验。通过实验表明,预训练语言模型中的lower和final layers与中间层分布不一致,并且...
-
【愚公系列】《AIGC辅助软件开发》011-AI辅助编写技术文档:技术文档
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
OpenAI面临多个挑战:人才流失、竞争对手的紧追不舍
OpenAI,这家在人工智能领域具有重要影响力的公司,目前正面临一系列挑战,包括人才流失、财务压力和竞争对手的紧追不舍。自首席执行官Sam Altman去年被解雇又重新聘任以来,公司的人事动荡不断加剧。至今,OpenAI的11位联合创始人中只有3位仍然在职...
-
人类还在怕鬼,AI已经开始害怕自己了。
昨天中元节,我本来一直打算做一个关于中式恐怖的视频,来呼应一下这个节日氛围。 带着这个想法,我开始在网上搜寻灵感。 然而,我在B站上看到的一个视频彻底改变了我的计划。 这个视频,是这样的,来自B站UP主@明天的心声-,名字叫做:《随手拍的一张医院走廊的照片...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
Stable Diffusion【进阶篇】:Inpainting完整指南
大家好,我是安琪。 一. 一个Inpainting的基本示例 在图生图中通过如下设置生成图片。 大模型:Realistic Vision V5.1 正向提示词:full body, audrey hepburn, black hair,...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
多语言声音克隆,CosyVoice模型最强部署
CosyVoice是由阿里通义实验室开源的一款多语言语音理解模型,它主要聚焦于高质量的语音合成,能够生成自然且逼真的语音。 CosyVoice模型经过超过15万小时的数据训练,支持中文、英语、日语、粤语和韩语多种语言的合成,且在多语言语音生成、零样本语音...
-
【LLaMA-Factory】常见报错信息及解决方法整理
1.‘llamafactory-cli’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法: cd 你路径下的\LLaMA-Factor...
-
基于飞桨框架的稀疏计算使用指南
本文作者-是 Yu 欸,华科在读博士生,定期记录并分享所学知识,博客关注者5w+。本文将详细介绍如何在 PaddlePaddle 中利用稀疏计算应用稀疏 ResNet,涵盖稀疏数据格式的础知识、如何创建和操作稀疏张量,以及如何开发和训练稀疏神经网络模型。...
-
AI绘画Stable Diffusion:拒绝AI质感,轻松生成超逼真,超真实的皮肤质感人像!
大家好,我是程序员晓晓 今天给大家分享一下最近部分小伙伴私信问我的是否可以提供一下有真实皮肤质感的模型,以及聊一下关于皮肤质感的问题。 SD大模型发展至今,不得不说,很多大模型本身皮肤质感都很不错的,因为很多大模型都做了皮肤质感的优化训练。还有...
-
AI日报:阿里推多角色一致性框架UniPortrait;腾讯混元上线三款ControlNet插件;苹果研发桌面机器人;Claude推提示词缓存功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里团队推新框架UniPort...
-
【Datawhale AI夏令营第四期】魔搭-AIGC方向 Task01笔记
报名参加了和鲸的AI夏令营,出于任务要求,也出于我一贯的学习习惯,写篇笔记记录一下自己学习过程中遇到的困难,和积累的资源、经验等。 课程链接: https://space.bilibili.com/1069874770/channel/collect...
-
马斯克采访特朗普都说了啥?涉及电动汽车、AI人工智能等话题
在8月12日的直播对话中,特斯拉和SpaceX首席执行官埃隆·马斯克与美国前总统唐纳德·特朗普展开了一场深入的讨论。 两人在对话中达成了一些共识,尤其是在经济和通胀问题上。特朗普强调了这些问题是美国人最关心的,并提出将提供公司激励措施以吸引企业投资美国。...
-
当一家头部MCN决定做AIGC产品
一家擅长制造爆款的内容公司,最近推出了一款定位为“故事生成助手”的AI工具。 7月初,仅靠网友自来水传播,该产品在一周内新增用户过万。 在产品官网上,研发团队如此介绍道:“用AI快速生成连续、一致的角色与故事……帮助任何人零门槛创作故事影集。” 这款AI...
-
AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图
赛博照妖镜下,AI美女全变鬼。 来看它的牙。 把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清。 整体图片的颜色也正常,麦克风部分更是奇怪。 对比真实人类照片,则应该是这样的。 牙齿是清晰的,图片色块都是均匀一致的。 这个工具已经开放,人...
-
AIGC与知识图谱融合的前沿探索与应用实践
1. 背景介绍 1.1 AIGC的兴起与知识图谱的价值 近年来,人工智能生成内容(AIGC)技术取得了显著的进展,在文本、图像、音频、视频等领域展现出强大的创造能力。AIGC 的核心在于利用机器学习算法学习和模仿人类的创作过程,从而生成高质量、高创意的...
-
揭秘LoRA:利用深度学习原理在Stable Diffusion中打造完美图像生成的秘密武器
文章目录 引言 LoRA的原理 LoRA在角色生成中的应用 LoRA在风格生成中的应用 LoRA在概念生成中的应用 LoRA在服装生成中的应用 LoRA在物体生成中的应用 结论 引言 在生成式人工智能领域,图像生成模型如Sta...
-
AIGC如何助力企业内容营销升级
AIGC如何助力企业内容营销升级 引言:拥抱AIGC的新浪潮 AIGC解密:人工智能与创意的融合 定义AIGC:不仅仅是技术,更是创意伙伴 AIGC的工作原理:从算法到艺术 探讨AIGC在内容创作中的独特优势 内容创作加速器:AIGC在行动...
-
智谱AI刚刚把他们的Sora「清影」,正式开源了,我爱他们。
大半夜的,大洋对岸不卷,国内公司卷起来了。 我真的想睡觉,真的。 起因是我睡觉之前,在看Github的时候,无意间看到THUKEG这个号,更新了一个项目。 CogVideoX。 网址在此:https://github.com/THUDM/CogVideo...
-
每日AIGC最新进展(48):腾讯提出Rich-Contextual Conditional Diffusion Models、OPPO提出自动生成复杂字形海报模型、南京大学提出基于Mamba插帧模型
Diffusion Models专栏文章汇总:入门与实战 Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models...
-
Stable Diffusion教程:如何实现人脸一致
在AI绘画中,一直都有一个比较困难的问题,就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践,大家和我一起来看看吧。 一. 有哪些实现方式 方式1:固定Seed种子值。 固定Seed种子值出来的图片人物确实可以做到一致,但Seed种子值...
-
【Stable Diffusion】(基础篇五)—— 使用SD提升分辨率
使用SD提升分辨率 本系列博客笔记主要参考B站nenly同学的视频教程,传送门:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibil...
-
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架!
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架! 原创 小源 数源AI 2024-01-29 20:19 浙江 数源AI 知识星球 数源AI论文推荐知识星球(每日最新论文及资...
-
玩Stable Diffusion不可不知的5款真人模型!大佬都在用!(附模型包)
模型对于AI绘画起决定性作用,今天推荐5款超好用的Stable Diffusion模型。 这些模型都在市面上收获了各种好评,而且各具特色,能满足你对写实人像的各种要求。 1、MajicMIX realisric 麦橘写实 写实系的人像大模型,具有...
-
WD1.4标签器:Stable Diffusion的提示词反推神器
引言 在AI绘画领域,Stable Diffusion(SD)因其强大的生成能力而备受关注。然而,如何精准地控制和优化生成效果,常常是许多用户面临的问题。今天,我们将详细介绍一款实用的插件——WD1.4标签器,它可以帮助我们反推出图片背后的提示词,从而...
-
对标Sora!首个国产纯自研视频大模型Vidu全球上线:30秒生成
快科技8月1日消息,日前,由生数科技联合清华大学打造的Vidu视频大模型正式在全球上线(www.vidu.studio),这也是首个国产纯自研视频大模型。 据了解,Vidu目前开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1...
-
【扩散模型】LCM LoRA:一个通用的Stable Diffusion加速模块
潜在一致性模型:[2310.04378] Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference (arxiv.org 原文:Pape...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段。 后者不仅依赖昂贵的人工标...
-
AI绘画SD常用的优秀模型
目录 LoRA模型在AI绘画中的具体应用和效果如何? ControlNet模型在图像编辑和创作中的精细控制能力有哪些实际案例? Hypernetwork模型如何根据不同输入生成适合特定任务的网络结构? Civitai模型平台提供的高质量模型种类...
-
爆“卷”的AI视频,大厂向左,创企向右
“生成的人物一转身就变成老外,怎么解决呢?” “没有办法,10s中动作大的,人物一致性有问题,只能抽卡,多刷几个,选择一个变化不大的。” 在一个以Ruanway学院为主题的群中,不断有各种针对AI视频生成的问题产生,而群内有AI视频生成使用经验的,则也在积...
-
AIGC助力ResNet分类任务:跃升10个百分点
目录 AIGC?缓解数据稀缺问题❓ 论文研究的动机✏️ 作者是怎么做的❓ 实验配置? 实验结果? 结论✅ 实践? 要增强的裂缝图片 按照论文中的参数在stable-diffusionv1-5上进行textual inversion微调...
-
AI日报:iOS 18.1开发者测试版上线;Vidu视频生成模型上线;Gen-3 Alpha上线图生视频
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、苹果 iOS 18.1 开发者...
-
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
2024年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6史诗级更新,后有开源巨头 Stable Diffusion3独领风骚,而 DALL・E3背靠 ChatGPT 这棵...
-
【教程】AI绘画里程碑-Midjourney“人物一致性”来了,让你的绘本人物形象统一起来
被人们诟病的Midjourney人物不能一致性问题解决了。 你知道怎么操作了吗?是不是彻底解决了呢? 开来看看效果: 这一次更新的是测试版本,可能会出现生成的图和参考图不一致,但也是有里程碑意义,相信正式版本发布会好很多。 下面详细介绍...
-
每日AIGC最新进展(36):以色列Lightricks提出视频中眼镜擦除技术V-LASIK、史蒂文斯理工学院提出实时交互式数字头像框架RITA、清华大学提出神经残差扩散模型Neural-RDM
Diffusion Models专栏文章汇总:入门与实战 V-LASIK: Consistent Glasses-Removal from Videos Using Synthetic Data 本文介绍了一种名为V-LASIK的视频编辑技术,...
-
横店,到底相不相信AI?
横店,一个被竖屏短剧占领的地方,正在被AI分成两半。 一半是对AI兴趣缺缺的短剧制造者们。 在横店的各种拍摄招募信息中,周期为3~ 7 天的项目占去了大部分的版面,数不清的演员、导演、摄影师、化妆师组成了稳定的生产流水线,把扇巴掌、下跪、撒钞票这些程序化的...
-
抖音、快手的AI短剧还成不了新赛道
AI浪潮狂卷不已,就在这个七月,吹到了短剧行业。 少年李行舟为救母亲,独自征战汹涌大海,遇蠃鱼、战共工,得鲲鹏相助,拿到水神戟,劈开无望海,斩杀海底怪兽九婴,救下亲人。 图源:快手 这是一部以《山海经》为背景的少年历险玄幻短剧,不同以往的是,视觉画面、效...
-
Stable Diffusion——涂鸦幻变:稳态扩散下的艺术重生
目录 引言 操作过程 图片准备 创建蒙版 图生图优化 设置参数 细节调整 总结 引言 在深入体验了 Stable Diffusion 图生图的无限魅力之后,我们不禁为其强大的图像修复和细节丰富能力所折服。然而,在实际应用中,许...
-
一次性生成5个8秒视频,用AI做抖音短视频不是梦?
最近的AI视频赛道,在玩法上“卷”出了新高度。 有用户用它完善视频细节: 还有人用它创作了科幻大片: 甚至让马斯克微笑点头: 还有大鱼吃小鱼,实现普通摄像头难以拍摄的效果: 较强的灵活性和视频可控性,一下让人难以分辨虚实,而这些镜头都是靠爱诗科技的...
-
Midjourney 升级了!揭秘个性化微调功能:一篇文章带你深入了解
大家好,我是花生,这里是我们共同探索 AI 的平台~ 最近几个月,Midjourney 没有大规模更新,自从今年二、三月份推出风格参考(style reference)和角色参考(character reference)之后,直到昨天才发布了两项新内容:...
-
【技术追踪】SDSeg:医学图像的 Stable Diffusion 分割(MICCAI-2024)
这医学图像分割领域啊,终究还是被 Stable Diffusion 闯进去了~ SDSeg:第一个基于 Stable Diffusion 的 latent 扩散医学图像分割模型,在五个不同医学影像模态的基准数据集上超越了现有的最先进方法~ 论...
-
【愚公系列】软考高级-架构设计师 109-软件架构演化原则
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
半年过去,AI视频卷到哪儿了?
自从今年年初Sora露面后,国内国外都想用AI颠覆好莱坞,近期的AI视频圈更是十分热闹,产品一个接一个发布,都喊着要赶超Sora。 国外两家AI视频初创公司率先开打,旧金山人工智能科技公司Luma推出Dream Machine视频生成模型,并扔出堪称电影级...
-
【八股文】算法岗位八股文、深度学习、AIGC八股文面试经验(一)
1. 请解释一下Batch Normalization的原理及其在训练深度神经网络中的作用。 Batch Normalization(批归一化)是一种在训练深度神经网络时常用的技术,旨在提高训练速度、稳定性和性能。 2. 在图像预处理过程中,如何选择合适...
-
精通AI绘画角色一致性:前沿工具与方法全解析
AI绘画以其独特的创造力和无限的想象力,为艺术创作领域带来了革命性的变化。AI不仅能够辅助艺术家拓展创作边界,还能够独立生成令人惊叹的视觉作品,从而推动艺术表达的多样性和创新性。 AI绘画技术的深度应用,急需解决的是,是如何在不同的艺术作品中保持角色的一...
-
每日AIGC最新进展(30):阿卜杜拉国王大学提出旋转视角视频生成Vivid-ZOO、浙江大学提出4D场景编辑Instruct 4D-to-4D、西安交大提出3D重建大规模数据集OpenMateria
Diffusion Models专栏文章汇总:入门与实战 Vivid-ZOO: Multi-View Video Generation with Diffusion Model 本文提出了一种名为Vivid-ZOO的新型扩散模型,用于从文本...
-
AI生成视频,究竟有多癫狂?
最近,各路视频生成AI放出的Demo让人眼花缭乱。“容嬷嬷喂紫薇吃香肠”“唐僧啃鸡腿、吃汉堡”“尔康失态”等“名场面”在各大短视频平台广为流传。 “刺激”的点在于,网友们无法预料一些经典的影视画面下一秒会衍生出什么剧情,也正因为如此,AI视频爆改在推出短短...