-
安装和微调大模型(基于LLaMA-Factory)2-补充资料
安装代码 https://github.com/echonoshy/cgft-llm/blob/master/llama-factory/README.md https://github.com/hiyouga/LLaMA-Factory/tree/m...
-
Stable Diffusion教程:如何实现人脸一致
在AI绘画中,一直都有一个比较困难的问题,就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践,大家和我一起来看看吧。 一. 有哪些实现方式 方式1:固定Seed种子值。 固定Seed种子值出来的图片人物确实可以做到一致,但Seed种子值...
-
小白的OS Copilot 产品测评
背景 通过群友介绍才知OS Copilot 。不想错过任何优秀的AI产品。随着互联网的发展和时代的进步,要紧跟时代,了解市面上的优秀的AI科技产品。 OS Copilot 产品体验评测 1)您的角色是什么?开发、运维、学生?如果使用OS Copilo...
-
部署LLaMA-Factory及微调大模型测试
安装过程 安装依赖 按照GitHub上介绍的过程安装即可GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMshttps://github.com/hiyouga...
-
Win环境下Ollama+OpenWebUI本地部署llama教程
本文将简单介绍如何在Windows环境下通过Ollama本地部署大语言模型(LLM),并通过OpenWebUI实现访问。 一、准备工作 1. 系统要求 操作系统:Windows 10 或更新版本 内存:16GB 以上 GPU:性能和显存足够,如RT...
-
直接生成GIF动态图片,让你生成的小姐姐动起来。Stable Diffusion AnimateDiff插件安装及使用教程
大家好我是安琪!!!今天要给大家介绍一个可以在Stable diffusion中快速生成不闪烁动画的插件,叫AnimateDiff。 AnimateDiff是目前Stable diffusion中效果比较好的文本生视频插件之一,它可以与其他插件结合使...
-
VScode使用Github Copilot插件时出现read ECONNREST问题的解决方法
文章目录 read ECONNREST 查看是否仍是 Copilot 会员 查看控制台输出 网络连接问题 浏览器设置问题 笔者的话 read ECONNREST 最近使用 Copilot 时一直出现 read ECONNREST...
-
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个t...
-
Ubuntu部署Stable Diffusion WebUI应用
本文主要讲述Ubuntu部署Stable Diffusion WebUI应用的部署教程,及在部署过程中可能遇到的问题及解决方法。 1. 部署教程 本次安装教程使用的系统配置是: CPU :10核,内存:220GB GPU :L20,...
-
AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例
参考: https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus 代码环境安装: git clone https://github.com/Kwai-Kolors/Kolors cd Kolor...
-
Llama 3 图片理解能力微调(XTuner+LLaVA 版)实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 环境、模型、数据准备 conda create -n llama3 python=3....
-
安装llama_factory
第一版: nvidia-smi git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory/ llamafactory-cli train examples/tr...
-
导出 Whisper 模型到 ONNX
前言 在语音识别领域,Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型,导出为 ONNX 格式是一个有效的途径。ONNX(Open Neural Network Exchange)是一个开放格式...
-
部署stable-diffusion时遇到RuntimeError: Couldn‘t clone Stable Diffusion XL.问题
错误信息如下: venv "E:\AI\stable-diffusion-webui-master\venv\Scripts\Python.exe" fatal: ambiguous argument 'HEAD': unknown revision o...
-
LLaMA-Factory:手把手教你从零微调大模型!
引言 随着人工智能技术的飞速发展,大型语言模型(LLM)在自然语言处理(NLP)领域扮演着越来越重要的角色。然而,预训练的模型往往需要针对特定任务进行微调,以提高其在特定领域的性能。LLaMA-Factory作为一个高效、易用的微调工具,为广大开发者提...
-
AI绘画 快手发布 Kolors 新模型,效果太赞了堪比SD3!ComfyUI 基础工作流,支持中文提示词,中文文字效果超棒!
大家好,我是程序员晓晓 这两天,快手新出的AI绘画 Kolors模型惊艳亮相,我实测了一下,效果简直比SD3.0开源的模型更强,没想到现在的国产AI也能做到这个地步了。接下来就让我们实测一下 Kolors模型 的效果。 工作流环境准备 注意:该教程...
-
媲美Midjourney-v6,Kolors最新文生图模型部署
Kolors模型是由快手团队开发的大型文本到图像生成模型,专门用于将文本描述转换成高质量的图像。 Kolors模型支持中英文双语输入,生成效果与Midjourney-v6相媲美,能够处理长达256个字符的文本输入,具备生成中英文文字的能力。 Kolor...
-
山大软院创新实训之大模型篇(二)——Llama Factory微调Qwen实践
山大软院创新实训之大模型篇(二)——Llama Factory微调Qwen实践 LLaMA Factory 是一个用于微调和部署 LLaMA (Large Language Model Applications 模型的框架。它旨在简化大语言模型的使用...
-
GitHub Models申请地址入口 GitHubAI模型服务使用方法详细教程指南
GitHub Models 是什么? GitHub Models是GitHub推出的新一代AI模型服务,旨在帮助开发者成为AI工程师。它将行业领先的大型和小型语言模型直接集成到GitHub平台,让超过 1 亿用户能够直接在GitHub上访问和使用这些模型。...
-
大模型llama.cp编译
一、大模型部署工具 llama.cpp 二、使用 llama.cpp 量化模型 2.1 克隆llama.cp 项目地址: https://github.com/ggerganov/llama.cpp 一般配置SSH KEY,然后采用SSH...
-
SenseVoice 实测,阿里开源语音大模型,识别效果和效率优于 Whisper,居然还能检测掌声、笑声!5分钟带你部署体验
前段时间,带着大家捏了一个对话机器人:手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇) 其中语音识别(ASR)方案,采用的是阿里开源的 FunASR,这刚不久,阿里又开源了一个更强的音频基础模型,该模型具有如下能力: 语音识别...
-
使用go-llama.cpp 运行 yi-01-6b大模型,使用本地CPU运行,速度挺快的
1,视频地址 2,关于llama.cpp 项目 https://github.com/ggerganov/llama.cpp LaMA.cpp 项目是开发者 Georgi Gerganov 基于 Meta 释出的 LLaMA 模型(简易 Pyth...
-
llama大模型提前停止策略,实现工具调用——以Llama3为例
在大模型的generate过程中为了实现工具调用功能,模型输出到了指定的token需要执行工具的时候,需要模型的generate停止。model.generate( 的参考链接:https://github.com/huggingface/transfor...
-
用Conda配置 Stable Diffusion WebUI 1.9.4
用Conda配置 Stable Diffusion WebUI 1.9.4 本文主要讲解: 如何用Conda搭建Stable Diffusion WebUI 1.9.4环境,用Conda的方式安装,不需要单独去安装Cuda了。 1. 安装minic...
-
LLama-Factory使用教程
本文是github项目llama-factory的使用教程 注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。 新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yam...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
AI绘画工具Stable Diffusion webui进行汉化的精简说明
工具汉化说明 不废话,汉化以插件形式安装,安装方式是一样的,但是启用的方式以2022年为界,分为旧版方式和新版方式两种。 汉化插件为 stable-diffusion-webui-localization-zh_CN 新版主分支目前为Anne,此分支由...
-
Linux系统上部署Whisper。
Whisper是一个开源的自动语音识别(ASR)模型,最初由OpenAI发布。要在本地Linux系统上部署Whisper,你可以按照以下步骤进行: 1. 创建虚拟环境 为了避免依赖冲突,建议在虚拟环境中进行部署。创建并激活一个新的虚拟环境: 如果不...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调
文章目录 模型及数据: 模型下载 数据 LLaMA-Factory启动 拉取代码 启动webui 模型训练 数据导入 数据预览 设置模型路径 配置参数及参数的保存 开始训练 过程观察 加载模型、对话 模型导出、再次加载...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
秋叶大佬24年最新的Stable Diffusion整合包V4.8来了~
要说今年绘画圈最大的新秀 那妥妥的就Stable Diffution V4升级版无需安装**,直接解压就能用** *(在此要感谢秋葉aaaki大佬的分享!*) 比之前推送的更加智能、快速和简单 有多简单呢?这么说吧 之前的版本需要初中生级别...
-
AIGC实战:LLaMA2打造中文写作利器——数据准备与模型训练全攻略
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2...
-
生成式人工智能(AIGC)在软件开发领域的变革与挑战
AI是在帮助开发者还是取代他们? 在软件开发领域,生成式人工智能(AIGC)正在显著改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试,AI工具正在成为开发者的得力助手。然而,这也引发了对开发者职业前景和技能需求变化的讨论。AI究竟是在帮助...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
Unsloth 微调 Llama 3
本文参考:https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自:https://blog.csdn.net/qq_38628046/article/det...
-
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
自Mixtral以来,大家对混合专家模型(Mixture-of-Experts,MoE)的关注越来越高。然而从零训练MoE模型的成本极大,需要耗费海量的计算资源。为此,我们探索了一种基于参数复用的MoE快速构建方法。 该方法首先将LLaMA...
-
llama_index,一个超强的 Python 库!
更多资料获取 📚 个人网站:ipengtao.com 大家好,今天为大家分享一个超强的 Python 库 - llama_index。 Github地址:https://github.com/run-llama/llama_index 在信息...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
AI绘画Stable Diffusion【人物三视图】:角色三视图的制作教程
大家好,我是程序员晓晓 关于三视图的制作,很早之前就有些小伙伴留言如何实现,当时只是给了大家制作的实现思路,最近又有些小伙伴提到了这个问题,今天我们就详细讨论一下这个问题,看一下最常见三视图的制作有哪些实现方式。话不多说,我们开整。 一. 实现方式一:...
-
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。 杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。 她在...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
AI大模型原理(通俗易懂版)——AIGC
传送门:AI大模型原理(通俗易懂版)-CSDN博客 AIGC 说起近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。 这些AI生...
-
搜集了18个宝藏技术周刊,涵盖前端、产品、UX、AIGC、独立开发、科技(偷偷收藏)
前端技术迭代速度很快,并不是每个人都有时间跟进社区的变化,但是了解下前端最新趋势、前沿知识对技能成长是很有帮助的,只有持续输入,才能更好输出。因此松桑打算搜集有价值的前端周刊,希望大家能从周刊中能够扩展视野、获取灵感。 但是在搜集过程中发现了很多宝藏周刊...
-
hunyuandit_pytorch AIGC 以文生图模型
HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...
-
【奶奶看了都会了】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程
1.作品图 2.准备工作 目前网上能搜到的stable-diffusion-webui的安装教程都是Window和Mac M1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel 芯片的Mac本,看着别人生成美女图片只能眼...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
【SD教程】超详细AI绘画提示词语法讲解!
AI绘画提示词如何写?对于入门的小伙伴来说这是一个大问题,提示词写的好,才能有高质量的作品,那今天小元老师给大家详细讲解一下,建议点赞收藏! 一、SD提示词基础 AI绘画提示词基本规则 1、提示词(prompt)由多个词缀构成。 提示词分为正向提示...
-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...