-
Stable Diffusion训练方式比对
Textual Inversion、Hypernetwork、Dreambooth 和 LoRA 是四种不同的 Stable Diffusion 模型训练方法。它们都可以用来训练 Stable Diffusion 模型,但它们之间存在一些差异,我们可以通过...
-
Stable Diffusion原理说明
本文参考:深入浅出讲解Stable Diffusion原理,新手也能看明白 - 知乎 目录 1、Stable Diffusion能做什么? 2、扩散模型(Diffusion model) (1)前向扩散(Forward Diffusion)...
-
【人工智能绪论】一次性搞懂什么是AIGC!
🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏:深度学习_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 🏀 专栏持续更新中~~~✨ 目录 1. 前言 2. AIGC发展历程...
-
04:我用stable diffusion生成了自己骑摩托的照片
前言 在上一篇文章中,写了stable diffusion的扩散原理,其中讲到noise predictor可以将将text prompt和depth map作为条件控制来生成图片。而depth map是controlNet根据我们输入的图片生成的。...
-
AIGC从入门到实战:带上 AI 化身,开启全球大冒险,燃爆朋友圈
1. 背景介绍 1.1 问题的由来 在信息技术日新月异的今天,人工智能(AI)已经渗透到了我们生活的方方面面。它给我们带来了许多便利,也给我们带来了许多挑战。而在所有的挑战中,最大的一个就是如何将AI技术应用到实际问题中去。而人工智能游戏角色(AIGC...
-
保姆级 Stable Diffusion 教程,看完这篇就够了!
在美国科罗拉多州举办了一场新兴数字艺术家竞赛,一幅名为《太空歌剧院》的作品获得“数字艺术/数字修饰照片”类别的一等奖,神奇的是,该作品的作者并没有绘画基础,这幅画是他用 AI 生成的。 这让人们充分见识到AI 在绘画领域惊人的创造力,AI 作品不仅可...
-
AI绘画工具Stable Diffusion中的常用术语解析,一文搞懂关键术语,让你事半功倍!
对于很多初学者来说,会对Stable Diffusion中的很多术语感到困惑,当然你不是唯一的那个。 ===================================================== 在这篇文章中,我将会讲解几乎所有你在Sta...
-
提示词工程学的前世今生:Generative Pre-trained Transformer 到AIGC,再到Prompt Engineering
人工智能(Artificial intelligence,AI)的演进已然变革了我们对于技术的理解以及应用方式。自最初的规则系统直至当下的深度学习,AI 在众多领域均彰显出了极为巨大的潜力。当中,生成式预训练模型(Generative Pre-traine...
-
Datawhale AI夏令营第四期魔搭 AIGC task02
一、AI生图 1.1 AI生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 ...
-
【记录贴 | 持续更新】搜广推/aigc 面试题记录
目录 nlp/搜广推 transformer结构? 位置编码的作用? 解释 self-attention? attention中 /√(d_k 的作用是什么? 解释Multi-Head Attention? FeedForward的作用...
-
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。 能设计芯片的AI黑科技来了! 就在刚刚,谷歌DeepMind推出名为A...
-
AIGC时代算法工程师的面试秘籍(第二十二式2024.9.2-9.15) |【三年面试五年模拟】
写在前面 【三年面试五年模拟】旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试经验,力求让读者在获得心仪offer的同时,增强技术基本面。也欢迎大家提出宝贵的优化建议,一起交流学习💪 欢迎大家关注Rock...
-
智能创造的幕后推手:AIGC浪潮下看AI训练师如何塑造智能未来
文章目录 一、AIGC时代的算法与模型训练概览 二、算法与模型训练的关键环节 三、AI训练师的角色与职责 四、AI训练师的专业技能与素养 五、AIGC算法与模型训练的未来展望 《AI训练师手册:算法与模型训练从入门到精通》 亮点 内容简介 作...
-
Stable diffusion生图原理
简介 Stable diffusion 是一种基于扩散技术的深度学习模型,于2022年发布,是Stability AI公司推出的首要产品,它主要用于生成以文本描述为条件的详细图像,同时也可以进行补绘、外绘、重绘等任务,但原理都和文生图原理相似。 S...
-
【大模型】AutoDL部署AI绘图大模型Stable Diffusion使用详解
目录 一、前言 二、AI绘图大模型概述 2.1 AI绘图大模型介绍 2.2 AI绘图大模型特点 2.3 AI绘图大模型优势 三、主流的AI绘图大模型介绍 3.1 Midjourney 3.1.1 Midjourney介绍 3.1.2...
-
AIGC:让生成式AI成为自己的外脑_aigc 让生成式ai成为自己的外脑 pdf 下载
二、AIGC:内容创作的新革命 AIGC是生成式AI在内容创作领域的重要应用。它利用深度学习模型,从海量数据中学习并生成各种形式的内容,包括文本、图像、音频和视频等。AIGC的出现,极大地丰富了内容创作的手段和形式,为创作者提供了更多的灵感和可能性。...
-
24全网最全stable diffusion模型讲解!快来!!新手必收藏!!
前言 手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出...
-
【大模型理论篇】生成式模型算法原理深入浅出(涉及Stable Diffusion、生成对抗网络、高斯混合模型、隐马尔可夫模型、朴素贝叶斯等算法原理分析及生成式模型解释)
1. 背景介绍 随着大模型的推出,“生成式AI”这个名词一夜之间席卷大江南北。甚至很多人的概念里,“生成式AI”等同于人工智能。但事实上,人工智能(Artificial Intelligence 涵盖的范围要广的多,生成式AI只是其中的...
-
AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方...
-
AIGC实战——多模态模型Flamingo
AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用 小结 系列链接 0. 前言 我们已经学习了文...
-
速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读
文章目录 论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...
-
《文末福利:黑神话悟空豪华版》借助Stable Diffusion实现人物自我控制的AI艺术突破
文章目录 引言 人物生成 操作过程 图像调整步骤 二郎神 孙悟空 八戒 场景渲染 技术原理: 好易智算平台 引言 提示词:solo,red eyes,water,male focus,1boy,standing,furry...
-
AIGC的算力与云边协同及应用创新
1)AI的新时代,生成式AI技术重新塑造AI技术的开发及应用 AI的新时代:更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改变及突破,生成式AI实际上扩大了“内容”的含义,凡是可以数字化的内容形式均为生成对象,而非传统意义下媒体环境的内容。...
-
llama神经网络的结构,llama-3-8b.layers=32 llama-3-70b.layers=80; 2000汉字举例说明
AI大模型全套学习资料 “最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。 这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。 我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。 我意识到有很多经验和知识...
-
OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首
【新智元导读】OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenAI的研究副总裁也在此时跳出来表明:大型神经网络可能已经有了足够算力,表现出意识了。 OpenAI o1,在IQ测试中拿到...
-
探索和构建 LLaMA 3 架构:深入探究组件、编码和推理技术
Meta 正在加大在人工智能 (AI 竞赛中的力度,推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持,现已在所有 Meta 平台上可用。 以下是您需要了解的有关 Meta 最新大型语言模...
-
LLaMa系列模型详解(原理介绍、代码解读):LLaMa_llama模型
LLaMA详解 LLaMA(Large Language Model Meta AI)是由Meta(前身为Facebook)开发的一种大规模语言模型,旨在提高自然语言处理(NLP)任务的性能。LLaMA基于变换器(Transformer)架构,并经过大...
-
AIGC浅记,什么是GAN模型,它有什么优点和缺点,以及在人脸生成领域有哪些应用
提示:以下是本篇文章正文内容,下面案例可供参考 一、GAN模型是什么? GAN模型,即生成对抗网络(Generative Adversarial Networks),是一种深度学习模型,通过生成器和判别器之间的对抗训练来学习生成数据的分布。GAN模型...
-
BitNet B1.58——模型参数用三个值表示,精度优于 Llama
介绍 论文地址:https://github.com/microsoft/bitblas 源码地址:https://github.com/microsoft/bitblas 与大型语言模型(LLMs)相比,小型语言模型(SLMs)正逐渐成为人们关注的焦...
-
【全网最全】AIGC产品经理面试高频100题答案解析
【全网最全】AIGC产品经理面试高频100题答案解析 说明: 1)目前干货文档总字数9.57万,不管是模型基本功还是每个问题的答案都尽可能详尽; 2)重点给大家深度讲解了机器学习、深度学习、AIGC三个大方向的13个经典模型 3)每个模型从实现...
-
苹果史上第一台AI手机诞生,iPhone 16屠版热搜!中文版明年登场,3nm芯片封神
【新智元导读】刚刚结束的科技春晚上,iPhone16系列惊艳亮相。全新的AI功能,把私人体验拉满到极致。专门打造的A18和A18Pro芯片,将在新机中首发搭载。 就在刚刚,苹果真正意义上第一款原生AI手机,终于在千呼万唤中亮相了。 以全新的Apple In...
-
24年保姆级教程!关于Stable diffusion的各种模型,看这篇就可以了!
前言 在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多种模型后缀,模型之间也有很多种类型,如果是新手小白的话,在这一步就很容易被搞晕。而在本期文章,技术巫帮你系统梳理了SD的模型,相信不管是对于小白还是老手,都会有一定帮助! 一、从模型后...
-
书单 | 大模型的书那么多,如何快速选到适合自己的那一本?来,教你!
大模型的书这么多,该怎么选呢? 本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本! 大模型基础 大模型入门不可错过的一本书,就是这本大模型界的经典畅销书**《大规模语言模型》**!系统性强,内容适合初学者,如果你想知道如何构建一个大模型...
-
一文彻底搞懂 Fine-tuning - 超参数(Hyperparameter)
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。 《...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
从【人工智能】到【计算机视觉】,【深度学习】引领的未来科技创新与变革
前几天偶然发现了一个超棒的人工智能学习网站,内容通俗易懂,讲解风趣幽默,简直让人欲罢不能。忍不住分享给大家,点击这里立刻跳转,开启你的AI学习之旅吧! 前言 – 人工智能教程https://www.captainbed.cn/lzx 1. 引言...
-
一文搞懂AIGC
目录 AIGC的核心技术 AIGC的主要应用 AIGC的未来趋势与挑战 🎈边走、边悟🎈迟早会好 AIGC(AI-Generated Content,人工智能生成内容)是指利用人工智能技术自动生成各种类型的内容,包括文本、图像、音频、视频等...
-
混合专家模型(MoE)入门
模型规模是提升LLM大语言模型性能的关键因素,但也会增加计算成本。Mixture of Experts (MoE 架构通过分布式专家层和动态门控机制,有效降低了计算资源,使模型能够在扩展参数规模的同时保持高效的运行。 Mixtral of Exper...
-
deepmotion(动作捕捉与动画生成)
Deep Motion 是一种高级技术,主要用于捕捉和处理复杂的运动数据,特别是在计算机动画、虚拟现实、增强现实和游戏开发领域。通过深度学习和计算机视觉技术,Deep Motion 提供了精确的运动捕捉和逼真的动画生成功能。 精准的运动捕捉:无需昂贵...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
如何在复杂对话中准确识别每位说话人的声音?OpenAI Whisper系统带来新突破,尽管在面对重叠声音时仍需进一步优化。
在复杂对话中准确识别每位说话人的声音是一个挑战,尤其是在面对重叠声音的情况下。OpenAI的Whisper系统虽然在自动语音识别(ASR)方面取得了显著进展,但在处理重叠声音时仍需进一步优化。 Whisper系统通过利用大规模预训练模型和弱监督学习来提取...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
深入解读Midjourney的起源和发展历程
深入解读Midjourney的起源和发展历程 1.背景介绍 1.1 人工智能时代的到来 随着计算机技术和算力的不断提升,人工智能(AI 技术正在迅速发展,并逐渐渗透到我们生活的方方面面。在这个新兴的AI时代,各种创新应用层出不穷,其中一个备受瞩目的领...
-
CVPR`24 | 又快又好!渲染速度比ENeRF快30倍!4K4D:实时4K分辨率4D视图合成
文章链接:https://arxiv.org/pdf/2310.11448 git链接: https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近,一些动态视图合成方法在渲染质量方面...
-
普通人如何零基础进入AIGC大模型人形机器人赛道,自学攻略,应用转化项目案例
要进入人形机器人赛道,普通人需要了解和掌握一系列的技能和知识,包括机器人设计、编程、电子工程、机械工程以及团队合作和项目管理。以下是一个详细的指南,帮助你从零基础开始,逐步进入这个充满挑战和机遇的领域。 基础教育和技能培养 进入人形机器人领域,基础...
-
2500字长文|设计师视角解释AI绘画底层原理
hello,大家好,我是想象。 今天给大家带来的分享是如何通过设计师视角,用设计师语言帮助大家快速理解AI绘画的底层逻辑。 作为一名设计师,我也在很长一段时间不清楚AI绘画到底是怎么出图的,如果没有了解本质,只是了解大概,不理解里面各个参数后面的原理,...
-
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI sd-webui-deoldifyDeOldify for Stable Diffusion WebUI:This is an extension...
-
8G显存运行Llama 3.1 405B!
我正在接受挑战,在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB!这是 8GB VRAM 容量的 103 倍! 显然,8GB VRAM 无法容纳它。那么我们如何让它工作呢?...
-
Stable Diffusion的微调方法原理总结
目录 1、Textural Inversion(简易) 2、DreamBooth(完整) 3、LoRA(灵巧) 4、ControlNet(彻底) 5、其他 1、Textural Inversion(简易) 不改变网络结构...
-
ViT篇外:NVIDIA Llama-3.1-Minitron 4B
相关阅读: ViT:3 Compact Architecture MobileLLM:“苗条”的模型比较好! 大家也许会很好奇为什么在ViT章节插入了NVIDIA Llama-3.1-Minitron 4B,ViT因为应用场景的特殊性所以都寄...