-
用Conda配置 Stable Diffusion WebUI 1.9.4
用Conda配置 Stable Diffusion WebUI 1.9.4 本文主要讲解: 如何用Conda搭建Stable Diffusion WebUI 1.9.4环境,用Conda的方式安装,不需要单独去安装Cuda了。 1. 安装minic...
-
LLama-Factory使用教程
本文是github项目llama-factory的使用教程 注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。 新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yam...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
AI绘画工具Stable Diffusion webui进行汉化的精简说明
工具汉化说明 不废话,汉化以插件形式安装,安装方式是一样的,但是启用的方式以2022年为界,分为旧版方式和新版方式两种。 汉化插件为 stable-diffusion-webui-localization-zh_CN 新版主分支目前为Anne,此分支由...
-
Linux系统上部署Whisper。
Whisper是一个开源的自动语音识别(ASR)模型,最初由OpenAI发布。要在本地Linux系统上部署Whisper,你可以按照以下步骤进行: 1. 创建虚拟环境 为了避免依赖冲突,建议在虚拟环境中进行部署。创建并激活一个新的虚拟环境: 如果不...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调
文章目录 模型及数据: 模型下载 数据 LLaMA-Factory启动 拉取代码 启动webui 模型训练 数据导入 数据预览 设置模型路径 配置参数及参数的保存 开始训练 过程观察 加载模型、对话 模型导出、再次加载...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 ?点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
秋叶大佬24年最新的Stable Diffusion整合包V4.8来了~
要说今年绘画圈最大的新秀 那妥妥的就Stable Diffution V4升级版无需安装**,直接解压就能用** *(在此要感谢秋葉aaaki大佬的分享!*) 比之前推送的更加智能、快速和简单 有多简单呢?这么说吧 之前的版本需要初中生级别...
-
AIGC实战:LLaMA2打造中文写作利器——数据准备与模型训练全攻略
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2...
-
生成式人工智能(AIGC)在软件开发领域的变革与挑战
AI是在帮助开发者还是取代他们? 在软件开发领域,生成式人工智能(AIGC)正在显著改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试,AI工具正在成为开发者的得力助手。然而,这也引发了对开发者职业前景和技能需求变化的讨论。AI究竟是在帮助...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
Unsloth 微调 Llama 3
本文参考:https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自:https://blog.csdn.net/qq_38628046/article/det...
-
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
自Mixtral以来,大家对混合专家模型(Mixture-of-Experts,MoE)的关注越来越高。然而从零训练MoE模型的成本极大,需要耗费海量的计算资源。为此,我们探索了一种基于参数复用的MoE快速构建方法。 该方法首先将LLaMA...
-
llama_index,一个超强的 Python 库!
更多资料获取 ? 个人网站:ipengtao.com 大家好,今天为大家分享一个超强的 Python 库 - llama_index。 Github地址:https://github.com/run-llama/llama_index 在信息...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
AI绘画Stable Diffusion【人物三视图】:角色三视图的制作教程
大家好,我是程序员晓晓 关于三视图的制作,很早之前就有些小伙伴留言如何实现,当时只是给了大家制作的实现思路,最近又有些小伙伴提到了这个问题,今天我们就详细讨论一下这个问题,看一下最常见三视图的制作有哪些实现方式。话不多说,我们开整。 一. 实现方式一:...
-
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。 杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。 她在...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
AI大模型原理(通俗易懂版)——AIGC
传送门:AI大模型原理(通俗易懂版)-CSDN博客 AIGC 说起近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。 这些AI生...
-
搜集了18个宝藏技术周刊,涵盖前端、产品、UX、AIGC、独立开发、科技(偷偷收藏)
前端技术迭代速度很快,并不是每个人都有时间跟进社区的变化,但是了解下前端最新趋势、前沿知识对技能成长是很有帮助的,只有持续输入,才能更好输出。因此松桑打算搜集有价值的前端周刊,希望大家能从周刊中能够扩展视野、获取灵感。 但是在搜集过程中发现了很多宝藏周刊...
-
hunyuandit_pytorch AIGC 以文生图模型
HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...
-
【奶奶看了都会了】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程
1.作品图 2.准备工作 目前网上能搜到的stable-diffusion-webui的安装教程都是Window和Mac M1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel 芯片的Mac本,看着别人生成美女图片只能眼...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
【SD教程】超详细AI绘画提示词语法讲解!
AI绘画提示词如何写?对于入门的小伙伴来说这是一个大问题,提示词写的好,才能有高质量的作品,那今天小元老师给大家详细讲解一下,建议点赞收藏! 一、SD提示词基础 AI绘画提示词基本规则 1、提示词(prompt)由多个词缀构成。 提示词分为正向提示...
-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...
-
【AI绘画教程】Stable Diffusion 1.5 vs 2
在本文中,我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因,但如果您想直接了解实际差异,您可以跳下否定提示部分。让我们开始吧! Stable Diffusion 2.1 发布与1.5相比,2.1旨...
-
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于SD的方法缺乏对图片结构的保持,所以本...
-
微调神器LLaMA-Factory官方保姆级教程来了,从环境搭建到模型训练评估全覆盖
编者注:之前一直用firefly做微调,最近切换到LLaMA-Factory,发现不但简单易用,而且非常全面,有点相见恨晚的感觉。使用过程中我主要参考2个文档,一个是github上的官方中文文档: https://github.com/hiyouga/L...
-
Stable Diffusion【真人模型】:人脸特美的人像摄影大模型wuhaXL_realisticMixV3.0
今天和大家分享一个基于SDXL的真人大模型:wuhaXL_realisticMix。该模型无需使用LORA**就能生成的特别漂亮的人脸,虽然有时候人脸有些假,但是生成的人脸确实非常漂亮。 该模型底模融合了WhiteXL_realisticMix,训练素材...
-
stable diffusion中dreambooth模型训练
stable diffusion中dreambooth模型训练 简介 一、参考材料 二、运行备注 模型训练步骤 一、连接服务器 二、虚拟环境配置 简介 一、参考材料 1、Github项目网址 2、huggingface...
-
测试:ollama加载羊驼版本llama-3中文大模型
找了一个晚上各种模型,像极了当初找各种操作系统的镜像,雨林木风,深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文,而且回复的很慢,所以我是在ollama上搜索"chinese"找到了这个羊驼版本的, ollama run lgkt/llama3-...
-
LoRA6~Stable Diffusion
这里说LoRA 在 Stable Diffusion 中的三种应用 LoRA 是当今深度学习领域中常见的技术。对于 SD,LoRA 则是能够编辑单幅图片、调整整体画风,或者是通过修改训练目标来实现更强大的功能。LoRA 的原理非常简单,它其实就是用两个参...
-
图生视频,Stable Diffusion WebUI Forge内置SVD了!
在 Stable Diffusion WebUI Forge 版本中内置了一个SVD插件,也就是 Stable Video Diffusion(稳定视频扩散),之前我介绍过这个工具的使用方法:图片生成视频(独立部署SVD 但是当时还不能集成到Stabl...
-
【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读
写在前面的话: 今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界,其中 25 个角色由 GPT 和自定义代码控制,并在arxiv上提交了论文版本,引起了对AIGC+游戏的广泛讨论; 8月,该项目在GitHub上正式开源...
-
手把手教你在autodl上部署llama模型
文章目录 一、注册AutoDL账号、租用GPU 二、创建conda环境 三、下载llama模型 四、启动模型 一、注册AutoDL账号、租用GPU 进入 AutoDL官网链接 注册账号,需要先充点钱,如下创建新实例。 随便选...
-
Stable Diffusion【Pony模型】:C站广受欢迎的底层大模型
大家好,我是安琪 Stable Diffusion,一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。而Pony模型,作为Stable Diffusion的底层大模型,更是备受C站用户的喜爱。本文将...
-
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。 GPT-4o不仅错了还很自信。 刚出炉的Llama-3.1405B,倒是能在验证中发现问题并改正。 比较离谱的是Clau...
-
【真人模型】Stable Diffusion:人脸特美的人像摄影大模型
大家好我是安琪! AI绘画的出现,将会带来新一轮的历史变革,具有无限的能力和潜力。如同200年前摄影技术发明时的情景一样,我们再度面临“绘画是什么”这样的问题。 今天和大家分享一个基于SDXL的真人大模型:wuhaXL_realisticMix。该模型...
-
AI绘画教程:Stable Diffusion中如何安装使用不同的模型?
Stable Diffusion是开源的,有点像安卓;midjourney则是封闭的,有点像苹果。两者功能都很强大。但是对于Stable Diffusion来说,要发挥强大的功能,首先得像安卓那样做好配置,安装好各种功能的app。Stable Diffus...
-
【AI绘画系列】分享5个让你艺术细胞炸裂的SD资源
大家好,最近我疯狂研究AI绘画,AI绘画有一种魔力,一坐下就完全不知道时间的流逝(饭都不知道按时吃了),修仙走火入魔了? 目前AI绘画领域最火的就是MJ和SD,社群众说纷纭。各有所长。建议两者都学习一下,然后找到最适合自己的用法。 AI绘画系列将是一系...
-
【一文开启StableDiffusion】最火AIGC绘画工具SD阿里云部署指南(含踩坑经验)
Midjonery使用简单,效果出色,不过需要付费。本文将介绍完全开源的另一款产品StableDiffusion,它的社区目前非常活跃,各种插件和微调模型都非常多,而且它无需付费注册,没有速度、网络限制,非常推荐一试。 目前主流AI绘画产品: 产...
-
使用LLaMA-Factory微调大模型
使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...
-
Stable Diffusion模型越大越好吗?快来拯救你的内存和磁盘
如果你经常使用 Stable Diffusion 绘图,是否注意到很多大模型文件的大小各有不同,有2G的、4G的、还有8G的,这些模型占用了大量的磁盘空间,特别是租用云服务器的有限免费空间;有些模型的作者或者使用者会说模型文件越大越好,越大出图越精细,真的...
-
Meta的Llama-3.1-405B遭泄漏,可下载,性能超GPT-4o!
7月23日凌晨,有人爆料,Meta的Llama3.1-405B评测数据遭遇泄漏,明天可能会发布Llama3系列中最大的参数模型,同时还会发布一个Llama3.1-70B版本。 这也是在3.0版本基础之上进行了功能迭代,即便是70B的基础模型的性能也超过了G...
-
python系列&deep_study系列:找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言
找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言 找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言 音视频转录 字幕翻译 Whisper 进阶命令 task language model 幻听参数...
-
苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。 推出7B模型,不仅效果与Llama38B相当,而且一次性开源了全部训练过程和资源。 要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评: 而苹果这次竟然来真的!! 就连NLP...
-
【05】LLaMA-Factory微调大模型——初尝微调模型
上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据,为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段,构建法律垂直应用大模型。 一、硬件依赖 LLaMA-Factory框架对硬件和软件的...
-
Llama也能做图像生成?文生图模型已开源
导读 基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型,证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成?文生图模型已开源...