-
stable diffusion使用简明教程
controlNet模块使用 Enable选项启用,使用Openpose Edito中姿势生成需要将Openpose Editor指定为none状态。 上面骨骼图是通过Openpose Editor调整姿势然后send to txt2img...
-
Danswer 接入 Llama 2 模型 | 免费在 Google Colab 上托管 Llama 2 API
一、前言 前面在介绍本地部署免费开源的知识库方案时,已经简单介绍过 Danswer《Danswer 快速指南:不到15分钟打造您的企业级开源知识问答系统》,它支持即插即用不同的 LLM 模型,可以很方便的将本地知识文档通过不同的连接器接入到 Danswe...
-
《安富莱嵌入式周报》第307期:开源智能制冷板,Keil MDK6发布时间,编程助手Github Copilot X,Matlab2023,高品质电容式麦DIY
周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版:...
-
国内AI顶会CPAL论文录用结果放出!共计30篇Oral和60篇Spotlight
大家可能还记得,今年五月份公布的,将由国内大佬马毅和沈向洋牵头办的全新首届AI学术会议CPAL。 这里我们再介绍一下CPAL到底是个什么会,以防有的读者时间太久有遗忘—— CPAL(Conference on Parsimony and Learning...
-
量子计算OpenAI来了?前谷歌3人团队融资1亿元,打造AI算力芯片挑战物理极限
在生成式AI的时代,算力已经肉眼可见的成为了技术发展的天花板。 英伟达几乎是现在这个时代算力问题的唯一解。 三十年前,在那个Denny's餐厅里开会的英伟达创始团队,肯定想象不到,他们看好的计算方式,将某种程度决定30年后人类智能的上限。 而我们这个时代...
-
【多模态】15、MobileSAM | 首个专为移动端设计的更快的 SAM
文章目录 一、背景 二、方法 2.1 耦合蒸馏 2.2 从半蒸馏到解耦蒸馏 三、效果 论文:FASTER SEGMENT ANYTHING: TOWARDS LIGHTWEIGHT SAM FOR MOBILE APPLICA...
-
奥特曼宫斗戏新爆料:自己投芯片公司,让OpenAI签下3.6亿订购意向书
奥特曼又惹上事了。 一份订购意向书曝光,奥特曼任CEO期间,OpenAI承诺从一家初创公司订购芯片,金额高达5100万美元(约合人民币3.6亿元)。 关键问题在于,这家公司Rain AI是奥特曼自己参与投资的。 图片 两家公司总部都在旧金山,相距不到一公...
-
21Dak攻击:计算机顶会PLDI‘23 针对语义依附代码模型的对抗攻击方法:Destroyer篡改输入程序,Finder寻找关键特征,Merger关键特征注入【网安AIGC专题11.22】
Discrete Adversarial Attack to Models of Code 写在最前面 一些对关系抽取和事件抽取相关的启发和思考 摘要 总结与展望 课堂讨论 研究背景与意义 对抗攻击 针对代码模型的对抗攻击 Semanti...
-
DetZero:Waymo 3D检测榜单第一,媲美人工标注!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 本文提出了一套离线3D物体检测算法框架DetZero,通过在 Waymo 公开数据集上进行全面的研究和评估,DetZero可生成连续且完整的物体轨迹序列,并充分利用长时序点云特征显着提升感知结果的质...
-
Unity中Shader指令优化(编译后指令解析)
文章目录 前言 一、我们先创建一个简单的Shader 二、编译这个Shader,并且打开 1、编译后注意事项 2、编译平台 和 编译指令数 3、顶点着色器用到的信息 4、顶点着色器计算的核心部分 5、片元着色器用到的信息 6、片元着色器核心部...
-
Ubuntu 20.04 LTS x86_64 安装 stable-diffusion-webui
官网 Stable Diffusion官网 Stability AI 官方github GitHub - Stability-AI/stablediffusion: High-Resolution Image Synthesis with L...
-
Stable Diffusion stable-diffusion-webui ControlNet Lora
Stable Diffusion Stable Diffusion用来文字生成图片,ControlNet就是用来控制构图的,LoRA就是用来控制风格的 。 stable-diffusion-webui 国内加速官网: mirrors / A...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
为什么多数情况下GPT-3.5比LLaMA 2更便宜?
本文旨在为用户选择合适的开源或闭源语言模型提供指导,以便在不同任务需求下获得更高的性价比。 通过测试比较 LLaMA-2 和 GPT-3.5 的成本和时延,本文作者分别计算了二者的 1000 词元成本,证明在大多数情况下,选择 GPT...
-
探索AIGC人工智能(Midjourney篇)(四)
文章目录 Midjourney模特换装 Midjourney制作APP图标 Midjourney网页设计 Midjourney如何生成IP盲盒 Midjourney设计儿童节海报 Midjourney制作商用矢量插画 Midjou...
-
【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总
网安AIGC专题 写在最前面 一些碎碎念 课程简介 0、课程导论 1、应用 - 代码生成 2、应用 - 漏洞检测 3、应用 - 程序修复 4、应用 - 生成测试 5、应用 - 其他 6、模型介绍 7、模型增强 8、数据集 9、模型安全...
-
stable diffusion的api参数-附带插件使用
文章转自: stable diffusion的api参数-附带插件使用 | 夜空中最亮的星 img2img { "prompt": "(masterpiece, best quality,Refined, beautiful ,haru...
-
【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型
文章目录 一、背景 二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择 三、效果 四、思考 论文:Learning Transferabl...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
【腾讯云 HAI域探秘】——Stable Diffusion预装环境生成AIGC图片——必会技能【微调】
目录 Stable Diffusion基本使用方法 学术加速测试 配置中文插件 Prompt与Negative prompt 采样器说明 人像生成 水光效果 微调的使用 图像生成种子/seed使用 附加/Extra 微调实例测试 图...
-
Stable Diffusion - 配置 WebUI 升级至 v1.6.0 版本与 VirtualENV 环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132177882 图像基于 哥特风格 绘制,参考 哥特 (G...
-
Google Assistant 即将集成 Bard AI:用户可选择经典或 AI 增强版本
Google 正在为其移动设备上的 Assistant 集成新的 AI 功能,即将推出名为「Classic Assistant」的版本。 这一消息得到了 Android 深度研究者 AssembleDeBug 在 X 平台(通过 Android Poli...
-
2023年微软开源八个人工智能项目
作者 | Tsamia Ansari 策划 | 言征 自2001年软件巨头微软前首席执行官史蒂夫·鲍尔默对开源(尤其是Linux)发表尖刻言论以来,微软正在开源方面取得了长足的进步。继ChatGPT于去年年底发布了后,微软的整个2023年,大多数技术...
-
用diffuser代码方式打造Ai作画流水线(1)
背景: stablediffusion已经成为作画人的标配,通过sd的ps插件,或者通过SD webui就可以快速的构建出一套属于自己的Ai作画环境。这种可视化的界面确实方便也是更好艺术家个代码工程师协同合作的模式,可视化界面方便艺术家创造,需要...
-
微软ChatGPT的投资在AI上赚的是名声大起,又爆新品微软Copilot
微软宣布向ChatGPT开发者OpenAI追加投资数十亿美元,这也是人工智能领域史上规模最大的一笔投资。 微软公司周一公告称,这将是一项“多年、数十亿美元”的投资协议,下一阶段将专注于将各类工具推向市场。微软CEO纳德拉在公告中表示,“各行各业的...
-
【Stable Diffusion】ControlNet基本教程(一)
1.ControlNet是什么 ControlNet是Stable Diffusion用于图像风格迁移和控制的一款插件,作者是2021年才本科毕业,现在在斯坦福大学读博士一年级的中国学生张吕敏。ControlNet的出现代表着 AI 生成开始进入真正可控的...
-
ChatGPT 使用到的机器学习技术
作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中,我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。 机器学习技术的发展 要聊ChatGPT用到的机器学习技术,我们不得不回顾一下机器学...
-
2022年32篇最佳AI论文:DALL·E 2、Stable Diffusion、ChatGPT等入选
Mila在读博士Louis Bouchard总结的论文列表,总体比较靠谱。GitHub上还有很多论文的短视频和文字解读、代码链接等。 下面的列表我们添加了论文的主要贡献机构(有些机构虽然有贡献但排名较后有挂名嫌疑的,都被忽略不计了),似乎可以反映出各公司...
-
PyTorch团队重写「分割一切」模型,比原始实现快八倍
从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI 的训练、推理等,尤其是在使用 PyTorch 的情况下。 本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...
-
Stable Diffusion中人物生成相关的negative prompts
下面是常用的negative prompt,在使用stable Diffusion webui等工具生成时可以填入。 bad anatomy, bad proportions, blurry, cloned face, deformed, disfigur...
-
OpenAI 投资者考虑在首席执行官突然被解雇后对公司董事会采取法律行动
根据熟悉此事的消息人士周一向路透社透露,OpenAI 的一些投资者在董事会解除 CEO Sam Altman 的职务并可能引发大量员工离职后,正在探索对公司董事会采取法律行动的可能性。 消息人士称,这些投资者正在与法律顾问合作研究他们的选项。目前尚不清楚...
-
Omniverse Replicator环境配置和使用说明
Omniverse Replicator使用说明 本教程将介绍Omniverse Replicator的环境配置和使用说明, 参加Sky Hackathon的同学可以参考本教程来合成训练数据集. 文章目录 Omniverse Repl...
-
真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像
最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是,扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片,因...
-
Stable Diffusion - API和微服务开发
Stable Diffusion 是一种尖端的开源工具,用于从文本生成图像。 Stable Diffusion Web UI 通过 API 和交互式 UI 打开了许多这些功能。 我们将首先介绍如何使用此 API,然后设置一个示例,将其用作隐私保护微服务以从...
-
探索AIGC人工智能(Midjourney篇)(三)
文章目录 Midjourney出图如何转高清图 Midjourney生成3D质感图标 Midjourney生成微信表情包 MJ设置Niji5漫画模式 Midjourney探索美食摄影的奇妙之旅 Midjourney蛋糕创意设计 M...
-
Stable Diffusion 准确绘制人物动作及手脚细节(需ControlNet扩展)
目前AI绘图还是比较像开盲盒,虽然能根据语义提供惊艳的图片,但是与设计师所构思的目标还是有一定距离。 那像我们这种没有绘画功底的程序员想要制作出心中的人物(尤其手脚)姿态,该怎样减少随机开盒的次数呢? 本文提供几种精确控制人物动作的方法。 安装及其问...
-
可与H100一战,微软首款5纳米自研芯片震撼发布!Copilot引爆办公全家桶,Bing Chat改名
微软深夜炸场,万物皆可Copilot! Bing Chat,从此更名Copilot。 登录微软账号,就可以在Copilot专属网站上免费使用GPT-4、DALL·E 3。 图片 OpenAI的全新王牌爆款——自定义GPT,也被塞进Copilot宇宙,变身...
-
Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成
原文链接: Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成 High-Resolution Image Synthesis with Latent Diffusion Models...
-
WordArt Designer:基于ChatGPT的智能艺术字生成框架
WordArt Designer是一款基于gpt-3.5turbo的艺术字生成框架,旨在通过四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo,将用户的抽象概念转化为具体的设计。LLM引擎由gpt-3.5turbo驱动,解释用户输...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
英伟达的节奏,越来越可怕了。 就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200! 较前任霸主H100,H200的性能直接提升了60%到90%。 不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更...
-
Stable Diffusion - 扩展插件 (Extensions) 功能的配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131576762 Prompt: (masterpiece,...
-
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。 这种类型的方法已经在监督学习领域得到了广泛的研究和应用,特别是在分类问题上,像RandomForest这样非常成功的算法。通常应用一...
-
Stable-Diffusion|入门怎么下载与使用civitai网站的模型(二)
C站:https://civitai.com/ 文章目录 1 样图 2 实现 2.1 下载主模型并放到正确文件夹中 2.2 找到prompt 2.3 生成 2.4 Lora使用 3 一些有趣的项目 3.1 胶片风格Lora 3...
-
Stable Diffusion+ControlNet+Lora 指导AI+艺术设计的WebUI全流程使用教程
目录 一. 背景知识 1.1 Stable Diffusion背景知识 1.1.1 安装stable-diffusion-webui 1.2 ControlNet 背景知识 二. 使用方法 2.1 环境配置 2.2 运行WebUI 三....
-
Altman亲手复刻「Grok」,背刺马斯克!定制GPT正式开放,最全第三方市场已出
经过ChatGPT大范围宕机后,Altman今天突然宣布,开发者大会上的所有产品更新,所有PLUS用户都上手用了。 图片 对此,有人已经花了整个下午的时间去玩了。 图片 GPTs全面上线,Altman嘲讽马斯克Grok 搞笑的是,Altman自己发了一个...
-
LoRa模型训练教程(炼丹,Stable Diffusion)
1. lora介绍(Low Rank Adaption) 何为LoRA?LoRA并不是扩散模型专有的技术,而是从隔壁语言模型(LLM)迁移过来的,旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖,比如最近新出...
-
stable diffusion API 调用,超级详细代码示例和说明
本文主要介绍 stable diffusion API 调用,准确来说是对 stable diffusion webui 的 API 调用。接口文档可以查看: http://sd-webui.test.cn/docs 这里的 sd-webui...
-
手把手带你用Python和文心一言搭建《AI看图写诗》网页项目(附上完整项目源码)
今年年初,ChatGPT的火爆在全球掀起AI大模型的开发热潮,国内外的科技公司纷纷加入“百模大战”行列。百度在率先发布了国内第一款人工智能大语言模型“文心一言”后,又推出了文心千帆大模型平台,帮助企业和开发者加速大模型应用落地。 而最近百度创始人、董事长...
-
MoE:LLM终身学习的可能性
性质 说明 知识记忆(knowledge retention) √ LLM预训练后,具备世界知识,小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。 前向迁移(forward...