-
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属...
-
Llama-Factory的baichuan2微调
Llama-Factory:https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。 默认模块应作...
-
Docker AIGC等大模型深度学习环境搭建(完整详细版)
本文是《Python从零开始进行AIGC大模型训练与推理》(https://blog.csdn.net/suiyingy/article/details/130169592)专栏的一部分,所述方法和步骤基本上是通用的,不局限于AIGC大模型深度学习环境。...
-
【Python】ChatAnywhere,ChatGPT API实现的简易版copilot,能够在word、wps、office中写文档使用,任意软件内可用
Chat-Anywhere 在任意软件内使用快捷键补全选中文本,word和wps中都可以方便的使用, 特性 在任意软件内使用 编写文档的好助手 演示动图 选中文本作为上下文提示,按下快捷键Ctrl+Alt+\激活补全,开始后将会自...
-
stable diffusion的微调和lora微调代码版本
目前业界主流的sd训练基本都是基于diffusers和ldm的,这是huggingface的训练库,后者是stability ai在compvis等机构的基础上完善的,我目前工作上推理一般采用webui架构,训练采用diffusers,因此需要把webui...
-
decapoda-research/llama-7b-hf 的踩坑记录
使用transformers加载decapoda-research/llama-7b-hf的踩坑记录。 ValueError: Tokenizer class LLaMATokenizer does not exist or is not curre...
-
stable diffusion 安装教程
stable diffusion安装教程 环境准备 硬件要求 安装软件 Python 安装 安装git 安装cuda工具 安装工具包 模型下载 生成图片 成果展示 环境准备 硬件要求 1.需要拥有NVIDIA显卡...
-
【Python】部署stable diffusion的踩坑分享(Couldn‘t clone Stable Diffusion+stderr显示乱码)
问题描述 在部署stable diffusion时,进行到运行webui-user.bat环节时出现 主要困难点在于错误流(stderr)显示为乱码,无法判断错误原因 以及网上找不到对应解决方案 解决方法 1、首先解决乱码问题 win11...
-
Stable Diffusion作图
使用stable diffusion作图 1安装stable diffusion(Windows) 前置环境git、python10(低于此版本会导致部分py模块无法导入) 1.1 下载 stable diffusion webui (通过...
-
AI网红月入8万,只用PS即可打造
月入八万的网红美女,短短几个月就在ins上获得了超过15万粉丝。 还有些名人向她发送了私信,甚至500万粉丝的知名演员,也向她发出了约会邀请…… 这位粉红色长发的美女名叫Aitana,是一名25岁、来自巴塞罗那、性格外向的健身爱好者。 日常生活、穿搭展...
-
AIGC数据库工具-阿里开源Chat2DB
前言 今天无意间发现了一个AIGC数据库工具,chat2DB,重点!!!阿里开源,其设计产品的思想给了我很多灵感,故记录一下,并分享给大家。 概述: Chat2DB 是一款有开源免费的多数据库客户端工具,支持windows、mac本地安装,也支持...
-
通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用
来自 Meta 的 Llama 2 基础模型现已在 Amazon SageMaker JumpStart 中提供。我们可以通过使用 Amazon SageMaker JumpStart 快速部署 Llama 2 模型,并且结合开源 UI 工具...
-
GitHub Copilot for Business 正式发布,重新定义开发生产力
AI 时代代码再也无需程序员亲自编写 给一段自然语言的需求 或者一小段代码做示意 GitHub Copilot 作为 AI 结对程序员 可以直接从中提取上下文 即时对单独行乃至整个函数提出建议开发生产力直接拉满 而现在,它来了「GitHub Cop...
-
使用openai-whisper 语音转文字
前言: 最近由于ChatGPT 的大热,AI 应用领域再次进入大众的视线,今天介绍一款AI应用whisper 可以较为准确的将人声转换为文字(支持多国语言) 一、安装 安装有两种方式pip 和源码编译安装,这里介绍pip安装方式...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
AIGC Stable Diffusion WebUI windows安装指南
安装电脑配置要求: NVIDIA显卡 显存>=4G(越大越好) 安装需要软件: git python cuda stable-diffusion-webui 梯子(魔法上网) 安装步骤: git安装 下载地...
-
Mac book M1/M2 安装 stable diffusion流程(SD)
一、 创建虚拟环境 由于后期炼丹的时候需要很多图片资源,因此如果你的硬盘空间和我一样不是很多的话,我建议你也将环境安装在外接移动硬盘上。 我们在创建虚拟环境时可以使用如下命令来指定虚拟环境安装的位置,同时我们还指定了 Python 的版本。 安装m...
-
Stable Diffusion WebUI 各操作系统安装教程
最近几天在 2 台 Mac、2 台 PC、一台云无 GPU 的 Linux 安装了 Stable Diffusion WebUI,这里记录下如何安装,以及一些注意点和坑。 以下内容针对 Windows(N 卡)、MacOS(m 系列芯片)、Linux(U...
-
Stable Diffusion Web-UI 安装指南
Stable DIffusion 是 Stability.AI 开源的 text-to-image 模型,目前类似产品有 Midjourney 以及 OpenAI 的 DELL-2 ;从AI绘画效果上来说,Midjourney 目前公认是最好的;但从模型的...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本
最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。 一、...
-
安装stable-diffusion-webui时一直卡在Installling gfpgan的界面
前言 出现这个问题的原因是,安装gfpgan涉及到国外的仓库,就算科学上网以后,在终端里面还是访问不到这个国外仓库,解决办法就只有手动安装,遇到一些pip安装不了的包都可以尝试去github上找到对应的包仓库进行手动安装。 解决办法:手动安装gfpg...
-
GitHub Copilot 快速入门
GitHub Copilot 是 AI 结对程序员。 可以使用 GitHub Copilot 在编辑器中获取整行或整个函数的建议。 1. 简介 让我们首先了解一些关于 GitHub Copilot 的内容。 这是 GitHub 和 OpenAI 的合作...
-
安装stable-diffusion时gfpgan安装失败
错误代码如下: Installing gfpgan Traceback (most recent call last : File "launch.py", line 380, in <module> prepare_enviro...
-
【城南】如何识别AI生成图?视觉AIGC伪造检测技术综述
图片无法加载可参考阅读:知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...
-
stable diffusion安装问题求教!
最后的webui-user.bat执行的过程真的是痛苦而漫长,网上什么破教程,问题一个接一个,解决一个就跳出另一个! 现在卡在这里了! 求教!如何解决。 Traceback (most recent call last : File "D:\SD...
-
Redis内存空间预估与内存优化策略:保障数据安全与性能的架构实践AIGC/AI绘画/chatGPT/SD/MJ
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间 资源分享 「java、pytho...
-
C#使用whisper.net实现语音识别(语音转文本)
目录 介绍 效果 输出信息 项目 代码 下载 介绍 github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simpl...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架...
-
谷歌和微软联手培养AI未来:推出面向初学者的入门课程
近期,谷歌和微软联手推动人工智能(AI)领域的军备竞赛迈向教育行业,分别发布了针对初学者的AI入门课程。这标志着人工智能不仅仅是科技领域的竞争,也成为培养下一代科学家、思想家和AI领袖的教育重点。 首先,谷歌携手Raspberry Pi基金会推出了名为「E...
-
DALLE2论文解读及实现(一)
DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...
-
AI绘画|免费开源!一键部署的AI绘画工具Fooocus
一、项目介绍 (一 Fooocus:探索创意的图像生成软件。 该项目发布仅仅一周便在Github上收获了超过6k的star!! 其爆火的背后和Fooocus的三个特点分不开: 发扬了Stable Diffusion的开源精神...
-
IDEA提出ToG思维图谱 大模型性能提升214%!
近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG ,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...
-
AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
???AI新鲜事 微软Azure AI新增40种大模型 微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处...
-
谷歌:LLM找不到推理错误,但能纠正它
今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。 那么,LLM 能否判断出自己的推理存在错误?最近,剑桥大学和...
-
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
2D 扩散模型极大地简化了图像内容的创作流程,2D 设计行业也因此发生了变革。近来,扩散模型已扩展到 3D 创作领域,减少了应用程序(如 VR、AR、机器人技术和游戏等)中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型,生成具有评分蒸馏采样(S...
-
第二课-一键安装SD-Stable Diffusion 教程
前言 看完这篇文章并跟着操作,就可以在本地开始 SD 绘图了。 理论上来说,这篇课程结束,想要画什么图都可以画了。 启动器介绍 SD 是开源的,可以在 github 上找到。但直接下载源码安装,非常费劲,而且因为国内外差异,就是我这样的秃头程序员...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框...
-
中文版LLaMA:Chinese-LLaMA-Alpaca
GitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 以ChatGPT、GP...
-
LLaMA-Factory可视化界面微调chatglm2;LoRA训练微调模型 简单案例
参考:https://github.com/huggingface/peft https://github.com/hiyouga/LLaMA-Factory 1、LLaMA-Factory可视化界面微调chatglm2 类似工具还有流萤,注意是做中...
-
AI(二):初体验(Cursor、Copilot、Bito、Notion、ChatExcel、Gamma、Tome、ChatPDF、AI-Video、SD、ChatGPTAPI、Midjourney)
Cursor Cursor官网下载:https://www.cursor.so/ && https://github.com/getcursor/cursor Cursor.so是一款基于GPT的代码生成工具,它可以帮助开发者快速生成...
-
【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型
文章目录 一、背景 二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择 三、效果 四、思考 论文:Learning Transferabl...
-
〔002〕Stable Diffusion 之 简单汉化和双语汉化 篇
✨ 目录 ▷ 汉化预览 ▷ 下载插件方法一 ▷ 下载插件方法二 ▷ 下载插件方法三 ▷ 简单汉化 ▷ 双语汉化 ▷ 汉化预览 在上一篇文章中,我们安装好了 Stable Diffusion 开源 AI 绘画工具 但是整...
-
StableDiffusion实用插件推荐- Image Browsing介绍
插件介绍 ImageBrower不仅是一个图像浏览器,也是一个强大的图像管理器。精确的图像搜索与多选择操作相结合,大大提高了效率。支持独立运行,无需sd - web。 上面是这款插件的官方的介绍,我主要还是使用他的图片管理功能,感觉非常方...
-
(三)SadTalker 让stable diffusion 人物可以说话
功能说明 github 项目SadTalker 可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频(抖音常见的数字...
-
openai的whisper语音识别介绍
openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...
-
Stable-Diffusion-WebUI从代码下载到使用技巧
一、写在前面 本文用于对AI绘画感兴趣但无计算机编程基础的人,包含本人安装和使用过程中的心得,可供新学者参考。 心理准备: 电脑性能越高越好,最好有高端显卡,如30系以上。低端显卡也可以,速度和质量感人就是; 会要求下载一些软件、模型,涉及环境变...
-
Stable Diffusion 用2D图片制作3D动态壁纸
如果想让我们的2D图片动起来可以使用stable-diffusion-webui-depthmap-script插件在SD中进行加工让图片动起来。 这是一个可以从单个图像创建深度图,现在也可以生成3D立体图像对的插件,无论是并排还是浮雕。生成的结果可在3...
-
在GPU云服务器中部署Stable Diffusion web UI
在GPU云服务器中部署Stable Diffusion web UI 1. 前言 2. 关于云服务器的选择 3. 关于机器的选择 4. 部署Stable Diffusion Python和CUDA 检查pip源 下载Stable Diffus...
-
炸裂!本地部署,轻松切换多个 AI 模型
周末一直在耍 AI 本地部署个人知识库,基本都是基于 OpenAI 的开放接口进行封装,亦或者你本地部署自己部署一个小模型。 感觉这两个要求对小白玩家都太高了,一个要求有科学上网能力,一个要求你电脑带高端显卡能够本地部署。 今天给大家带来一个炸裂产品gp...
-
Stable Diffusion + EbSynth + ControlNet 解决生成视频闪烁
一、安装 1.1、安装ffmpeg 下载地址: 解压,配置环境变量 E:\AI\ffmpeg\bin 检查是否安装成功 1.2、安装SD的 EbSynth 插件 插件地址 https://github.com/s9roll7/ebsynth_...