-
huggingface学习|用dreambooth和lora对stable diffusion模型进行微调
目录 用dreambooth对stable-diffusion-v1-5模型进行微调 (一)模型下载和环境配置 (二)数据集准备 (三)模型微调 (四)运行微调后的模型 用lora对stable-diffusion-v1-5模型进行微调...
-
Move AI推全新Move API 可轻松实现2D转3D
Move AI近日推出了全新的Move API,该API可以轻松从2D视频中捕捉生成3D运动数据。用户只需使用单一相机即可捕捉人物动作,操作简单,只需上传视频文件即可完成整个过程。Move API自动将视频转换为3D人类运动数据,并提供即时预览,支持导出多...
-
使用openai-whisper实现语音转文字
使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
python绑定的相关项目 官方未提供python的封装绑定,直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...
-
干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章
前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。 当时还有网友表示,这2小时课程的含金量,相当于大学4年。 就在这几天,Karpathy又萌生了一个新的想法: 那便是,将2小时13分钟的「从头开始构建GPT分词器」的视频...
-
Mac本地部署大模型体验AIGC能力
介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型,而这些大模型由于规模庞大、结构复杂,往往包含了数十亿至数千亿的参数。这些模型在训练阶段,一般需要使用高效能的GPU集群训练数十天时间,在推理阶段,一般...
-
20240202在WIN10下部署faster-whisper
20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件,可以通过技术手段上外网!^_ 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2...
-
Stable Diffusion webui安装详细教程
上一篇文章介绍了sd主流的ui,相信大家已经有所了解,下面为大家介绍sd-webui的安装详细教程 文章目录 一、 安装包说明 二、对电脑的要求 三、安装文件介绍 四、安装步骤 五、电脑问题与云主机 六、界面简要说明及通用反向提示词...
-
《Stable Diffusion WebUI折腾实录》在Windows完成安装, 从社区下载热门模型,批量生成小姐姐图片
环境 操作系统: Windows11 显卡: RTX2060 6GB 显存 安装Python 下载 Python3.10.6 https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64...
-
保姆级amd显卡win11搭建stable diffusion教程,GPU运算,而不是CPU运算!!!
1.安装Git 2.安装python python版本一定要是3.10.6 如果是其他版本,请卸载后再重新安装此版本 3.git代理配置 此步骤主要是解决拉github源码慢的问题,如果有vpn客户端的同学,记得要单独再配置下git的代理配置...
-
AIGC ChatGPT4完成业务需求SQL学习
源表如下: 例如现在需要显示每个岗位中工资排名前10位的员工信息,并显示排名应该要怎么做呢? Prompt: 有一个某公司职员表,表名为Bank_emp,empno为员工编号,ename为员工姓名,JOB为员工岗位,sal为工资,dept为部门,...
-
Karpathy离职OpenAI,首发2小时AI大课!从头开始构建GPT分词器
离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer(分词器)」。 其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。 这个项目是minbpe——专为...
-
Stable Diffusion WebUI 踩坑记录
文章目录 install Homebrew install python 3.10 clone stable diffusion web 设置 pip 国内源 install 如果 torch 安装有问题可以这样安装 Install GFPG...
-
[AIGC 大数据基础]hive浅谈
在当今大数据时代,随着数据量的不断增大,如何高效地处理和分析海量数据已经成为一个重要的挑战。为了满足这一需求,Hive应运而生。 Hive作为一个基于Hadoop的数据仓库基础设施,为用户提供了类SQL的查询语言和丰富的功能,使得处理大规模数据变得更...
-
ChatGPT发癫已读乱回,网友:“高速运转的机械”AI版?
就在所有目光集中到Sora的时候,ChatGPT开始演我上班状态—— 疯了! 症状包括但不限于:多语言无规律猛地切换、反复自我纠正、一句话叨叨叨叨叨叨半天。 甚至仿佛是ChatGPT得了失语症,有些回答每一句都是带情绪的词不达意。 总之,主打的就是一个已...
-
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer(分词器)」。 图片 其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。 图片 这个项目是minbpe...
-
【AI绘画】Stable Diffusion 保姆级教程,必收藏!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 2022年绝对是人工智能爆发的元年,前有 stability.ai 开源 Stable Diffusion 模型,后...
-
3秒实现无痛基于Stable Diffusion WebUI安装ComfyUI!无需重复安装环境!无需重复下载模型!安装教程
标题略有夸张哈哈哈哈,但想表达的是,相较于直接下载或者通过秋叶包更新而,接下来这一套方案确实很简单,而且能够 大大节省磁盘空间,和下载时间。 这篇教程不需要你有: 代码基础。都是复制粘贴就完事。 魔法。 这篇教程默认你已经有: 1. 本地能够正...
-
Karpathy新视频又火了:从头构建GPT Tokenizer
技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。 这不,前脚新项目刚上线,后脚全新的教学视频又给大伙整出来了: 这次,是手把手教咱构建一个GPT Tokenizer(分词器),还是熟悉的时长(足足2小时13分钟)。 Ps. 上次讲课还是俩月前的...
-
看完就会!手把手入门开源AI绘图Stable Diffusion
AIGC现如今可谓是如日中天,AI绘画算是其中最火的了。现在的AI绘图工具也是百家争鸣,不管是网页端,APP端,还是小程序端,都能看到各种各样的AI绘图工具,他们多是需要你发送关键词或绘图命令到他们的服务器,然后由服务器渲染完成之后返图给你,所以一定会占用...
-
BentoML:如何使用 JuiceFS 加速大模型加载
BentoML 是一个开源的大语言模型(LLM) AI 应用的开发框架和部署工具,致力于为开发者提供最简单的构建大语言模型 AI 应用的能力,其开源产品已经支持全球数千家企业和组织的核心 AI 应用。 当 BentoML 在 Serverless 环...
-
Java ChatGPT和文心一言是两个不同的工具,它们有着不同的用途和功能
Java ChatGPT和文心一言是两个不同的工具,它们有着不同的用途和功能。 Java ChatGPT:ChatGPT是由OpenAI开发的自然语言处理模型,可以进行对话生成。它基于深度学习技术,通过训练大量的数据来理解用户输入并生成相应的回答。Ja...
-
AIGC:腾讯云服务器快速部署stable-diffusion环境,使用ChilloutMix模型进行画图
文章目录 @[toc] 背景 一. **购买服务器** 二. **前置配置** 三. **部署webui,完成配置** 四. **其他探索** 其他 背景 前两天在某公众号的软文刷到了AI绘画领域最新的ChilloutM...
-
从入门到精通:AI绘画与修图实战指南
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 在这篇文章中,我们将深入探讨如何利用Photoshop和Firefly等工具进行AI绘画...
-
基于LLaMA-Factory的微调记录
文章目录 数据模型准备 基于网页的简单微调 基于网页的简单评测 基于网页的简单聊天 基于网页的模型合并 微调问题测试与解决 问题测试 模板修改 强化训练 持续训练 单数据集训练 微调总结 LLaMA-Factory是一个非常好用的无代...
-
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...
-
【AIGC】Stable Diffusion的常见错误
Stable Diffusion 在使用过程中可能会遇到各种各样的错误。以下是一些常见的错误以及可能的解决方案: 模型加载错误:可能出现模型文件损坏或缺失的情况。解决方案包括重新下载模型文件,确保文件完整并放置在正确的位置。 依赖项错误:Stable...
-
用python实现调用百度文心一言
要使用Python调用百度文心一言,你需要使用百度提供的API。具体步骤如下: 前往百度AI开放平台官网,注册并创建一个应用。在创建应用时,你需要填写相关信息,并选择你要使用的API服务。 在创建应用后,你会获得一个API密钥。这个密钥是用来验证你的应...
-
魅族停止传统手机新项目,换跑AI;周鸿祎:Sora打不败TikTok;宝马承认发生数据泄露事件;Sora视频被曝多处失误 | T资讯
一、商业圈 1.宝马确认发生数据泄露事件 :宝马云存储服务器配置错误 据外媒 TechCrunch 近日报道,汽车巨头宝马的云存储服务器发生配置错误事件,导致私钥和内部数据等敏感信息暴露。 此次暴露的数据包括宝马在中国、欧洲和美国的云服务私钥,以及宝马生...
-
离开OpenAI的大神卡帕西「开课了」:新项目日增千星,还是熟悉的min代码风
大神Karpathy从OpenAI离职,原本扬言要大休一周。 图片 但转眼,新项目就已上线GitHub,日增上千星的那种。 图片 还是熟悉的卡式配方: 74行Python代码搞定大模型标记化(tokenization)中常用的BPE(Byte Pair...
-
Sora不懂物理世界,翻车神图全网爆笑!LeCun马斯克DeepMind大佬激辩世界模型
大火的Sora,让许多动画、影视行业的人大为恐慌。 不过,今天网上广为流传的这张图,让大家倒是放心了不少。 可以看到,在这个视频中,玻璃杯碎裂的方式十分诡异—— 它被抬到半空中时,桌子上就忽然出现了一滩平整的红色玻璃,随后玻璃杯被摔到桌子上,和这滩玻璃融...
-
有道ai写作,突破免费限制,无限制使用
预览效果 文末提供源码包及apk下载地址 有道ai写作python版 import hashlib import time import json import ssl import base64 import uuid from urlli...
-
Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。 本文的将提供利用AI语音...
-
如何系统的自学Python?通义千问、讯飞星火、文心一言及ChatGPT的回答
如何系统的自学Python?来看看通义千问、讯飞星火、文心一言及ChatGPT的回答. 第一个是马老师的通义千问 系统地自学Python是一个循序渐进的过程,从基础语法到实践项目,再到专业领域的深入学习。下面是一个详细的步骤指南: 了解Pyt...
-
使用LlamaIndex和ChatGPT的无代码检索增强生成(RAG)
检索增强生成(RAG 是使用大型语言模型(LLM 的关键工具。RAG使LLM能够将外部文档合并到它们的响应中,从而更紧密地与用户需求保持一致。这个功能在传统上使用LLM犹豫不决的领域尤其有益,尤其是在事实很重要的时候。 自从ChatGPT和类似的LLM推...
-
如何免费访问和使用Gemini API?
Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本,获得几乎完美的答案。 我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各种Python API函数,包括文本生成和图像理解。 Gemini A...
-
学习AI画画
AI画画学习 利用算法进行画画,通过文本或者以图生图等形式生成相应的图像。之前在云端服务器Linux部署过一遍,这里总结一下相关的过程。 常见AI绘画软件使用方式 方式 优势 不足 1 在线版 直接打开浏览器注册即可使用,非常方便 大部...
-
近期关于AIGC方面的学习笔记和思路整理
LLM 对于LLM,我现在重点关注在这几个方面: 开源且可私有化部署的代码生成模型: 因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...
-
关于LLaMA Tokenizer的一些坑...
使用LLaMA Tokenizer对 jsonl 文件进行分词,并将分词结果保存到 txt 文件中,分词代码如下: import jsonlines import sentencepiece as spm from tqdm import tqdm j...
-
Stable Diffusion的 webui 如何在Windows上使用 AMD GPU显卡?
根据Stable Diffusion官方说明 webui 是不支持AMD GPU显卡的,所以在国内如果想省点事情要玩Stable Diffusion (SD 推荐用黄教主的英伟达显卡NVIDIA GPU,可以省心不少。 AMD显卡得用 webui-di...
-
扩展说明: 指令微调 Llama 2
这篇博客是一篇来自 Meta AI,关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集,有了它,我们则可以使用自己的指令来微调 Llama 2 基础模型。 目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是,模型如此...
-
20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll
20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll 2024/2/2 10:48 https://blog.csdn.net/feinifi/article/details/132548556...
-
无 N卡 Stable Diffusion WebUI 安装过程记录
目录 前提 过程 准备 Git 初始化 权重文件 模型文件 文件配置(2024-02-15 12:42 更新) 运行 [notice] pip 更新 无 tb-nightly 包 无 xformers 模块 多处爆红 ERROR...
-
一图揽尽全球LLM崛起之路;LLM概念速查清单;DALL·E提示词红宝书·在线版;fast.ai新课带你从零实现Stable Diffusion | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? LLM 崛起之路:全球大语言模型「规模增长」可视化交互图 https://informationisbeautiful.net/visual...
-
什么是预训练Pre-training—— AIGC必备知识点,您get了吗?
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 随着人工智能(AI 不断重塑我们的世界,其发展的一个关键方面已经成为现代机器学习模型的支柱:预训练。在本篇文章中,我们将探讨预训练的概...
-
基于Python实现Midjourney集成到(个人/公司)平台中
目前Midjourney没有对外开放Api,想体验他们的服务只能在discord中进入他们的频道进行体验或者把他们的机器人拉入自己创建的服务器中;而且现在免费的也用不了了,想使用就得订阅。本教程使用midjourney-api这个开源项目,搭建Midjou...
-
图像生成与修复:AI绘画的新时代
1.背景介绍 图像生成与修复是一种非常重要的计算机视觉任务,它可以帮助我们创建新的图像,并修复损坏或不完整的图像。随着人工智能技术的发展,图像生成与修复的能力也在不断提高,使得AI绘画成为了一个热门的研究领域。 在本文中,我们将讨论图像生成与...
-
使用Kohya_ss训练Stable Diffusion Lora
Stable Diffusion模型微调方法 Stable Diffusion主要有 4 种方式:Dreambooth, LoRA, Textual Inversion, Hypernetworks。 Textual Inversion (也称为 Em...
-
基本概念:什么是ChatGPT和AIGC?
1.背景介绍 1. 背景介绍 自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge,深度学习技术开始引以为奎。随着算法的不断发展和优化,深度学习技术已经应用...
-
本地部署 Stable Diffusion(Mac 系统)
在 Mac 系统本地部署 Stable Diffusion 与在 Windows 系统下本地部署的方法本质上是差不多的。 一、安装 Homebrew Homebrew 是一个流行的 macOS (或 Linux)软件包管理器,用于自动下载、编...