-
用扩散模型监督NeRF,清华文生3D新方法成新SOTA
用文字合成3D图形的AI模型,又有了新的SOTA! 近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 无论是不同视角间的一致性,还是与提示词的匹配度,都比此前大幅提升。 图片 文生3D是3D AIGC的热点研究内容,得到了学术界和工...
-
ubuntu16.04安装语音识别whisper及whisper-ctranslate2工具(填坑篇)
环境:系统ubuntu16.04,显卡是NVIDIA Quadro RTX5000 目标:安装语音识别工具whipser/whipser-ctranslate2 因之前有过几次在linux和windows上有过部署whisper经验和...
-
字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对
最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。 但相比自然语言数据,机器人数据是十分稀缺的。而且机器...
-
堪比Midjourney!上百种风格AI写真丝滑生成,这个开源项目能颠覆照相馆吗?
概览简介 FaceChain 是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版,可以生成超乎想象空间的个人写真作品。 更有意思的...
-
AI作画工具 stable-diffusion-webui 本地部署 多种模型 可生成NSFW
最近,人工智能绘画非常受欢迎。在本文中,我使用了一台带有N卡的电脑,安装了stable-diffusion-webui前端并替换了默认的模型。这样就可以生成高质量的二次元图像,并且可以不受限制地生成图片(在线版通常会阻止NSFW内容的生成)。 所需资...
-
一份保姆级的Stable Diffusion部署教程,开启你的炼丹之路 | 京东云技术团队
市面上有很多可以被用于AI绘画的应用,例如DALL-E、Midjourney、NovelAI等,他们的大部分都依托云端服务器运行,一部分还需要支付会员费用来购买更多出图的额度。在2022年8月,一款叫做Stable Diffusion的应用,通过算法迭代将...
-
国产AI绘画海克斯科技——爱作画AIGC开放平台
继AI写作之后,AI绘画技术在今年彻底火了。 去年年底,CLIP模型 和 Diffusion模型 的完美结合,很好地跨过了AI绘画的技术门槛,让AI绘画效果实现质的飞跃,直接达到可商业落地的效果,这一重大技术突破也让AI绘图火出了圈。 国外,谷歌、微软...
-
【AIGC】图片生成的原理与应用
前言 近两年 AI 发展非常迅速,其中的 AI 绘画也越来越火爆,AI 绘画在很多应用领域有巨大的潜力,AI 甚至能模仿各种著名艺术家的风格进行绘画。 目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...
-
stable diffusion安装踩坑之clip安装、git报错
clip本地安装环境链接问题 本节主要记录一下在windows安装stable diffusion时,clip脚本安装不上,本地安装时如何链接到当前库的问题 首先,在脚本安装clip不成功时,脚本会输出一个commend指令,复制到浏览器就可以很快...
-
在autodl算力云上部署Stable Diffusion
这里写自定义目录标题 如何在算力云上部署Stable Diffusion 零、基础环境 一、初始准备,用户权限的设置 1.创建非root管理员用户并改主目录为数据盘 2.删除lock锁 3.更改这两个目录权限 4.改python的用户权限...
-
【Lora模型训练过程报错】Error no kernel image is available for execution on the device at line
错误现象 在使用 sd-script训练自己的Lora模型时,可能会出现“Error no kernel image is available for execution on the device at line 167 ”的错误: steps:...
-
【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎,针对 ClickHouse 提出5个问题,并给出参考答案。
【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎,针对 ClickHouse 提出5个问题,并给出参考答案。 3000字。 目录...
-
AI绘画SD插件ControlNet模型解析
ControlNet控制网 功能型: IP2P : 环境背景天气修改, 以及单独修改人物, make it xxx 。 Tile分块重采样:忽略细节,并添加新的细节。 Inpaint局部重绘: 修改局部时, 更能懂得输入的提示词元素。...
-
谷歌推出 Google AI SDK,简化在安卓应用中集成高性能模型 Gemini Pro
12 月 26 日消息,谷歌近日推出了全新的 Google AI SDK,旨在简化 Android 应用集成其高性能的 Gemini Pro 模型。借助该 SDK,开发人员无需构建和管理自己的后端基础架构。 据谷歌介绍,Gemini Pro 是其功能...
-
AIGC - 入门向量空间模型
文章目录 向量和向量空间 向量的运算 什么是向量空间? 向量空间的几个重要概念 向量之间的距离 曼哈顿距离(Manhattan Distance) 欧氏距离(Euclidean Distance) 切比雪夫距离(Chebyshev Dist...
-
AI绘画:SDXL1.0正式版+2款软件+多种在线体验方式!
万众期待的最强开源AI模型SDXL1.0终于开源了! SDXL1.0 是什么? 简单来说,它是目前最强大的开源AI绘画模型,开源当然也意味着免费。单纯从模型的角度来看,肯定比SD1.5,SD2.x这种强很多。 如果你要寻找...
-
基于whisper模型的在线添加视频字幕网站(持续更新)
1.什么是whisper Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whi...
-
安装stable-diffusion-webui踩坑经历
软件下载在b站up秋葉aaaki up很贴心有一个整合包可以直接运行。 在github下载的原始版本sd-webui ,下载过程遇到clip包安装失败,参考了这两个文章可以解决 打开stable diffusion webui时,提示缺少cl...
-
maui 调用文心一言开发的聊天APP 3
主要是对代码进行了优化 上一个版本写死了帐号跟密码 ,这一个帐本有户可以直接设置 对相关的key以及secret如果设置错时,在聊天中也会返回提示。 注册帐号时同时也设置了key及secrete 升级到了net.8.0 导出APK,上一个版本是导出a...
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: 图片 无论是中英文的大段文字: 图片 还是包含了公式的文档图片...
-
LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention
Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...
-
LLama Factory 安装部署实操记录(二)
1. 项目地址 GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM E...
-
“私密离线聊天新体验!llama-gpt聊天机器人:极速、安全、搭载Llama 2,尽享Code Llama支持!”
“私密离线聊天新体验!llama-gpt聊天机器人:极速、安全、搭载Llama 2,尽享Code Llama支持!” 一个自托管的、离线的、类似chatgpt的聊天机器人。由美洲驼提供动力。100%私密,没有数据离开您的设备。 Demo http...
-
大火的AIGC是什么?能用到工作中哪些地方?
一.AIGC是什么? AIGC(即Artificial Intelligence Generated Content),中文译为人工智能生成内容。简单来说,就是以前本来需要人类用思考和创造力才能完成的工作,现在可以利用人工智能技术来替代我们完成。 在...
-
AI绘画中CLIP文本-图像预训练模型
介绍 OpenAI 在 2021 年提出了 CLIP(Contrastive Language–Image Pretraining)算法,这是一个先进的机器学习模型,旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...
-
Ubuntu 22.04安装英特尔显卡驱动玩转AIGC
作者:英特尔网路与边缘计算事业部开发者关系经理 李翊玮 本文将介绍如何使用EIV 用5行指令在快速搭建含英特尔显卡及OpenVINO的AI开发环境, 并简洁说明如何使用OpenVINO 及英特尔显卡优化文生图模型Stable Diffusion 的速度。...
-
昆仑万维或将引领国内 AIGC 技术发展
AIGC 发展历程 如果说 2021 年是元宇宙元年,那么 2022 年绝对可以称作 AIGC 元年。自从 Accomplice 于 2021 年 10 月推出 Disco Diffusion 以来,AIGC 受到了前所未有的关注,相关产品和技术更是以...
-
stable-diffusion安装和简单测试
参考:https://github.com/CompVis/stable-diffusion理解DALL·E 2, Stable Diffusion和 Midjourney的工作原理Latent Diffusion Models论文解读【生成式AI】淺談圖...
-
window安装Stable-Diffusion-WebUI详细教程
直接上效果图,这是通过stable diffusion webui 利用古风模型生成的图片,实在是太好看了!!! 看了这些图,有没有心痒痒的?今天就来带大家入个门!先把软件搞起来 ! 【前言】 Stable Diffusion是2022年发布的深度学...
-
【stable-diffusion使用扩展+插件和模型资源(下)】
插件模型魔法图片等资源:https://tianfeng.space/1240.html 书接上文:(上) 插件推荐 1.lobe theme lobe theme是一款主题插件,直接可以在扩展安装 界面进行了重新布局,做了一些优化,...
-
Install Stable Diffusion WebUI on Ubuntu 22.04.2 LTS
1. Environment OS:Ubuntu 22.04 LTS Kernel:5.15.0-60-generic CPU: Intel(R Xeon(R Gold 6278C CPU @ 2.60GHz, 8vCPUs GPU: 1 * N...
-
Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU,适配无GPU的场景)
一、模型简介 原子大模型Atom由Llama中文社区和原子回声联合打造,在中文大模型评测榜单C-Eval中位居前十(8月21日评测提交时间)。 Atom系列模型包含Atom-7B和Atom-...
-
LLMs-入门二:基于google云端Colab部署Llama 2
LLMs-入门二:基于google云端Colab部署Llama 2 1、访问网址 2、基础概念 3、选择最适合您的 Colab 方案 4、基于Colab部署开源模型Llama 2 1)在Colab上安装huggingface套件 2)申请调用...
-
StableDiffusion产生随机种子(seed)并复制到剪贴板中
随着人工智能AI的兴起,现在AI画图已经风靡全球,其中StableDiffusion以开源、可以本地部署(免费白嫖)引起了包括本人在内的打工人的兴趣。 但是每次文生图时,种子(seed)都是随机的,如果手气好,遇见个满意...
-
Stable Diffusion攻略集(Stable Diffusion官方文档、kaggle notebook、webui资源帖)
文章目录 第一部分 一、 Features:Textual Inversion(文本反转) 1.1 Textual Inversion 简介 1.1.1 摘要 1.1.2 算法 1.1.3 模型效果 1.2 Textual Invers...
-
简单的NovelAI绘画方法
玩法很简单,有电脑就行,但是比较吃配置。我小白都能画出来,你也可以。 文章目录 需求 界面参数 排除词 tag tag排序 图片生成 基本tag 人物形象tag 人物细节tag 按以上tag生成的图片 更多tag排序与使用技巧...
-
【Stable Diffusion/NovelAI Diffusion的AMD GPU加速推理探索】
测试机子配置: 1:AMD RX6600(显存8g +i5 12600KF 16g内存 (台式机 2:RTX 3070 laptop(显存8g +i7 10870H 32g内存 (HP暗夜精灵笔记本 两台电脑平均性能差不多,当然N卡肯定更好一点 这边...
-
基于MindSpore的llama微调在OpenI平台上运行
基于MindSpore的llama微调在OpenI平台上运行 克隆预训练模型 克隆chatglm-6b代码仓,下载分布式的模型文件 git lfs install git clone https://huggingface.co/openlm-...
-
百度文心一言文心千帆大模型 ERNIE-Bot-turbo调用示例(golang版本)
百度的文心一言推出来也有一段时间了,但是接口部分一直没有公开,需要进行申请 最近,有朋友提供了文心千帆大模型的api权限,拿到了必须的参数,现在就来测试一下 下面是使用golang封装的文心千帆 ERNIE-Bot-turbo模型的调用示例...
-
2023-12-17 AIGC-AnimateDiff详细安装和使用教程
AnimateDiff专用模型下载 AnimateDiff有其自身专门的运动模型mm_sd_v15_v2.ckpt 和 专属的镜头运动lora,需要放置在对应的位置。 stablediffusion位置: 运动模型放在stable-diffusio...
-
controlnet1.1模型和预处理器功能详解(各预处理器出稿对比及对应模型说明)
ControlNet 1.1 与 ControlNet 1.0 具有完全相同的体系结构,ControlNet 1.1 包括所有以前的模型,具有改进的稳健性和结果质量,且增加并细化了多个模型。 命名规范 项目名+版本号+标识+基础模型版本+功能...
-
只需一张图片、一句动作指令,Animate124轻松生成3D视频
近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术领域引发了广泛关注。回顾过去一年,我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步,逐渐融入单视角图像,进而发展到整合...
-
Github Copilot 开始收费了, 帮你列出些替代的插件
今天打开 VSCode,弹出了Github Copilot 开始收费的通知 可以免费用到 8 月 22 日,每月 70 元还是有些小贵。 这里给大家推荐一些替代品: Kite https://www.kite.com/ TabNinehttp...
-
我的大模型观:我眼中的LLM
文章目录 大模型是有智能的。 也许,大模型是一场骗局? 从头训练or微调 我想象中的大模型架构 大厂的大模型 中小厂和个人开发该何去何从? 今年,大模型火的一塌糊涂。最近几个月paper with code上,前几名的论文几乎都是生成模...
-
【AI大模型】Google Bard (PaLM2) 大模型写代码能力实测: LSM Tree, DAG Scheduler, AI大模型加持自然语言零代码平台设计(福利O:文末附PaLM2访问链接)
禅与计算机程序设计艺术评测结论:当前AI大模型写代码能力当之无愧的 No.1. Google Bard (PaLM2 文章目录 禅与计算机程序设计艺术评测结论:当前AI大模型写代码能力当之无愧的 No.1. Google Bard...
-
《ai绘画》最全stable diffusion安装教程 所有软件+所有指令
安装cuda,win键搜索nvidia Control Panel,打开软件 点击软件左下角系统信息 查看自己的cuda版本 打开网站,根据自己的版本选择cuda下载 网站 https://developer.n...
-
Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言
1.摘要 我们提出了一个多模态框架Video-LLaMA1,它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作,补充线性最小二乘法只处理视觉或听觉信号...
-
【黄啊码】StableDiffusion教程从入门到搬砖
上节课教大家怎么免费使用GPU资源,今天就正式带大家进入stable diffusion的教程,废话不多说,开干: 目录 正面提示词: 我们来学习关于权重的知识点: 权重语法: 分割符 组合符 连接符 分布交替渲染 负面提示词: 最后在提供一部分常用的提...
-
Midjourney之logo设计(建议收藏)
目录 宠物诊所的logo设计 常见的Logo类型 图形logo: 字母LOGO APP LOGO 进阶技巧 设置艺术家风格 去掉不需要的元素 ChatGPT + Midjourney设计logo 聊天(国产):文心一言通义千问 绘图(...
-
【踩坑笔记】从零开始部署安装Stable Diffusion 2 WebUI
一、材料准备 一台带GPU的电脑,系统Ubuntu20.2 Xshell和Xftp,用于连接云主机,传输文件 我用的是阿里云ECS,型号ecs.gn6i-c4g1.xlarge(4 vCPU 15 GiB 1 * NVIDIA T4)。推荐挂一个N...