-
【InsCode Stable Diffusion 美图活动一期】生成着玩
此为内容创作模板,请按照格式补充内容,在发布之前请将不必要的内容删除 一、 Stable Diffusion 模型在线使用地址: https://inscode.csdn.net/@inscode/Stable-Diffusion 二、模型相关版...
-
谷歌Bard入门指南
文章目录 谷歌Bard入门指南 一、简介 二、使用指南 三、中文化 3.1 中文提问 3.2 中文回答 四、Hello Game 五、亮点 谷歌Bard入门指南 一、简介 Bard 是一个大型语言模型,也称为对话式 A...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了! 有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。 以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1.0,实在是太给人惊喜了! 更令人震惊的是,作者表示,这是10...
-
【Stable Diffusion | AI 绘画】手把手教你体验--AI 生成唯美二次元
应用背景 AI 绘画是一种应用人工智能技术来生成数字艺术作品的创作方法。这个领域的发展让艺术家和设计师能够更加轻松地使用技术来实现创意和想象。AI绘画是数字艺术领域的一种热门话题,因为它可以让我们了解人工智能技术如何应用于创造性领域,并且可以让更多的人参...
-
口碑翻转,Pika 1.0试用效果折服一大票人,直呼「最佳视频生成器」
上个月底,一个名为 Pika 1.0 的视频生成 AI 模型在社交媒体上迅速流传开来,它能够生成和编辑各种风格的视频,比如 3D 动画、动漫、卡通和电影。 Pika 1.0 是一家初创公司 Pika Labs 推出的产品,这家公司于今年 4 月成立,目前...
-
自动驾驶大模型论文调研与简述
最近关于大模型(LLMs, VLM 与自动驾驶相关文献调研与汇总: 适合用于什么任务?答:目前基本上场景理解、轨迹预测、行为决策、运动规划、端到端控制都有在做。 大家都怎么做的? 对于规控任务,LLM型基本是调用+Prompt设计,集中在输入和输出设计...
-
强大到离谱!硬核解读Stable Diffusion(完整版)
原文链接: 硬核解读Stable Diffusion(完整版) 2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Stable Diffusion,下半年有OpenAI的文本对话大模型Ch...
-
python_turtle库丘比特之箭
python里面有一个库是可以绘画的,我们成为小海龟,turtle库,通过这个库我们可以绘画出很多样式的图像。 例如 接下来教大家一点函数。 from turtle import * # 导入turtle库 im...
-
干货分享:用ChatGPT调教批量出Midjourney咒语,出图效率Nice ,附资料。
如何调教ChatGPT让Midjourney出图效率更高 先看测试效果 调教经过 附资料 Prompts就是AI绘图的核心竞争力。 您是不是觉得用Midjourney生成的图不够完美? 又让ChatGPT去生成Prompt,然后...
-
Stable Diffusion本地部署
Stable Diffusion本地部署 一、环境准备 1. 良好的网络环境 2. 设备 二、安装Stable Diffusion 1 .clone Stable Diffusion 代码到本地 2. 安装python环境 三、测试效果...
-
DDPM详解 AI绘画
话说DDPM DDPM模型,全称Denoising Diffusion Probabilistic Model,可以说是现阶段diffusion模型的开山鼻祖。不同于前辈GAN、VAE和flow等模型,diffusion模型的整体思路是通过一种偏...
-
AI抠图使用指南:Stable Diffusion WebUI Rembg实用技巧
抠图是图像处理工具的一项必备能力,可以用在重绘、重组、更换背景等场景。最近我一直在探索 Stable Diffusion WebUI 的各项能力,那么 SD WebUI 的抠图能力表现如何呢?这篇文章就给大家分享一下。 安装插件 作为一个生成式AI,S...
-
开源大模型框架llama.cpp使用C++ api开发入门
llama.cpp是一个C++编写的轻量级开源类AIGC大模型框架,可以支持在消费级普通设备上本地部署运行大模型,以及作为依赖库集成的到应用程序中提供类GPT的功能。 以下基于llama.cpp的源码利用C++ api来开发实例demo演示加载本地模型文...
-
Stable Diffusion - StableDiffusion WebUI 软件升级与扩展兼容
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/134463035 目前,StableDiffusion WebUI 的...
-
Stable Diffusion - SDXL 模型测试与全身图像参数配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132085757 图像来源于 SDXL 模型,艺术风格是赛博...
-
Stable Diffusion:使用Lora用二十张图片训了一个简易版薇尔莉特头像生成器(不作商用,纯纯个人兴趣,狗头保命)
目录 一、系统环境 二、数据准备及预处理 三、使用Stable Diffusion获取图像信息 四、安装训练图形化界面 五、参数设置及训练过程 六、 效果测试 七、常见报错处理 一、系统环境 同上一篇博客,云平台:CPU 1核,G...
-
【腾讯云 HAI域探秘】借助高性能应用HAI——我也能使用【stable diffusion】制作高级视频封面了
目录 高性能应用服务HAI_GPU云服务器的申请与服务创建 官网地址:高性能应用服务HAI_GPU云服务器_腾讯云 通过高性能应用服务HAI——创建【stable diffusion】 WebUI效果: 服务器后台效果: stable-diff...
-
stable diffusion学习笔记【2023-10-2】
L1:界面 CFG Scale:提示词相关性 denoising:重绘幅度 L2:文生图 女性常用的负面词 nsfw,NSFW,(NSFW:2 ,legs apart, paintings, sketches, (worst quality...
-
文献阅读:LLaMA: Open and Efficient Foundation Language Models
文献阅读:LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...
-
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。 关注TechLead...
-
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了
目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。 看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...
-
CHATGPT学习midjourney提示词
Priming GPT-4 for Midjourney V5 1. Hello : Today we are gonna create Images with a Diffusion model. I am gonna feed you some in...
-
AI制作视频——mov2mov以及inpaint
背景 AI制作视频的几种思路 1.从零开始生成:清华的cogview,runway gen-1、gen-2,微软的女娲 这个思路,就是认为可以通过文字描述的方式把视频画面描述出来,通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...
-
百度商业AI 技术创新大赛赛道二:AIGC推理性能优化TOP10之经验分享
朋友们,AIGC性能优化大赛已经结束了,看新闻很多队员已经完成了答辩和领奖环节,我根据内幕人了解到,比赛的最终代码及结果是不会分享出来的,因为办比赛的目的就是吸引最优秀的代码然后给公司节省自己开发的成本,相当于外包出去了,应该是不会公开的。抱着技术共享及开...
-
基于文心一言的PPT自动生成
基于文心一言的PPT生成,AIStudio项目地址,快去fork运行吧 项目借鉴了autoppt, ppt两个项目。生成的PPT还没加入特效,有待改善,希望大佬们可以提出宝贵的建议。 一、生成PPT效果展示 注意,因为生成PPT时间较长,应...
-
LLaMA 的学习笔记
LLaMA 是一种用于自然语言处理的深度学习模型,它的全称是 Language Learning with Adaptive Multi-task Architecture。它的主要特点是能够根据不同的任务自适应地调整模型结构和参数,从而提高模型的泛化能力...
-
原神盲盒风格:AI绘画Stable Diffusion原神人物公仔实操:核心tag+lora模型汇总
本教程收集于:AIGC从入门到精通教程汇总 在这篇文章中,我们将深入探讨原神盲盒的艺术风格,以及如何运用AI绘画技术(Stable Diffusion)——来创造原神角色公仔。我们将通过实践操作让读者更好地理解这种技术,以及如何利用关键标签和Lora模型...
-
文心一言 VS 讯飞星火 VS chatgpt (34)-- 算法导论5.3 1题
一、Marceau 教授不同意引理 5.5 证明中使用的循环不变式。他对第1次送代之前循环不变式是否为真提出质疑。他的理由是,我们可以很容易宣称一个空数组不包含0排列。因此一个空的子数组包含一个0排列的概率应是 0,从而第 1次选代之前循环不变式无效。请...
-
Stable Diffusion - ControlNet 插件中扩展局部重绘 InpaintOnly + LaMa 算法与应用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131643131 LaMa: https://github.com...
-
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属...
-
AIGC Stable Diffusion WebUI windows安装指南
安装电脑配置要求: NVIDIA显卡 显存>=4G(越大越好) 安装需要软件: git python cuda stable-diffusion-webui 梯子(魔法上网) 安装步骤: git安装 下载地...
-
简单科普 AI AIGC AGI ChatGPT 分别是什么?
AI AI,全名 “Artificial Intelligence”,中文为人工智能。 它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 AIGC AIGC,全名 “AI Generated...
-
openai的whisper语音识别介绍
openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...
-
Try out Google Bard, Will Google Bard beat the ChatGPT?
Try out Google Bard, Will Google Bard beat the ChatGPT? Give a try on Google Bard Google has begun opening up the Google Bard(...
-
AIGC绘画:基于Stable Diffusion进行AI绘图
文章目录 AIGC深度学习模型绘画系统 stable diffusion简介 stable diffusion应用现状 在线网站 云端部署 本地部署Stable Diffusion AIGC深度学习模型绘画系统 stab...
-
每日学术速递1.30
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 更多Ai资讯: 今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...
-
基于Stable Diffusion的图像合成数据集
当前从文本输入生成合成图像的模型不仅能够生成非常逼真的照片,而且还能够处理大量不同的对象。 在论文“评估使用稳定扩散生成的合成图像数据集”中,我们使用“稳定扩散”模型来研究哪些对象和类型表现得如此逼真,以便后续图像分类正确地分配它们。 这使我们能够根据现实...
-
【多模态】4、Chinese CLIP | 专为中文图文匹配设计
文章目录 一、背景 二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸 三、效果 四、代码 4.1 推理 论文:Chinese CLIP: Contrastive Vision-Language Pr...
-
stable-diffusion领域prompt集合
有什么写实的stable diffusion模型? - 知乎试了试这个模型,感觉勉强,大佬们知道有没有更写实的模型?https://huggingface.co/CompVis/stable-diff…https://www.zhihu.com/quest...
-
[stable-diffusion-art] 指北-2 如何为sd提出好的prompt
https://stable-diffusion-art.com/how-to-come-up-with-good-prompts-for-ai-image-generation/https://stable-diffusion-art.com/how-t...
-
【GPT4】微软 GPT-4 测试报告(3)GPT4 的编程能力
欢迎关注【youcans的GPT学习笔记】原创作品,火热更新中微软 GPT-4 测试报告(1)总体介绍微软 GPT-4 测试报告(2)多模态与跨学科能力微软 GPT-4 测试报告(3)GPT4 的编程能力 【GPT4】微软 GPT-4 测试...
-
以Llama-2为例,在生成模型中使用自定义StoppingCriteria
以Llama-2为例,在生成模型中使用自定义StoppingCriteria 1. 前言 2. 场景介绍 3. 解决方法 4. 结语 1. 前言 在之前的文章中,介绍了使用transformers模块创建的模型,其generate...
-
Stable Diffusion如何生成高质量的图-prompt写法介绍
文章目录 Stable Diffusion 使用 尝试下效果 prompt的编写技巧 prompt 和 negative prompt Prompt格式 Prompt规则细节 优化 Guidance Scale 总结 Sta...
-
【A卡,Windows】stable diffusion webui下载安装避坑指南
观前提醒 本文内容都是本人亲身经历的,一个一个安装下载测试所感,当然如果你更想用傻瓜式集成包的,那还是跳过这篇文章吧。 当然我不推荐这篇文章的操作,因为我用了差不多1h才有一副图,有N卡,就用N卡,这只是无奈之举而已,方便那些像我一样暂时没有换机子打...
-
吴恩达AIGC《How Diffusion Models Work》笔记
1. Introduction Midjourney,Stable Diffusion,DALL-E等产品能够仅通过Prompt就能够生成图像。本课程将介绍这些应用背后算法的原理。 课程地址:https://learn.deeplearning...
-
新的生图模型DeepFloyd IF来了,可以拳打Stable Diffusion,脚踢Dall-E?
简介: Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型(cascaded pixel diffusion model),复现了...
-
尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询?
文章目录 尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询? Google Bard 的自我介绍 Google Bard 暂时不支持中文 Google Bard除了支持英语外,还支持日语 Goog...
-
ChatGPT 使用到的机器学习技术
作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中,我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。 机器学习技术的发展 要聊ChatGPT用到的机器学习技术,我们不得不回顾一下机器学...
-
2022年32篇最佳AI论文:DALL·E 2、Stable Diffusion、ChatGPT等入选
Mila在读博士Louis Bouchard总结的论文列表,总体比较靠谱。GitHub上还有很多论文的短视频和文字解读、代码链接等。 下面的列表我们添加了论文的主要贡献机构(有些机构虽然有贡献但排名较后有挂名嫌疑的,都被忽略不计了),似乎可以反映出各公司...