-
LLaMA-Factory 让大模型微调变得更简单!!
背景 如果只需要构建一份任务相关的数据,就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作, 那么必将大大减轻微调工作量。 今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...
-
【AI绘画教程】Flux.1工作流整合包准备好了,快来挑战Flux.1的创作极限!
F5 AI社区提供了工作流、提示词、一键整合包,有兴趣的来挑战一下! 提示词: Create a bustling marketplace in a fantastical floating city. Layer 1 (Background : D...
-
使用 Ollama、Llama 3.1 和 Milvus 实现Function Calling 功能
将函数调用(Function Calling)与 LLM 相结合能够扩展您的 AI 应用的能力。通过将您的大语言模型(LLM)与用户定义的 Function 或 API 集成,您可以搭建高效的应用,解决实际问题。 本文将介绍如何将 L...
-
24年8月最新 Stable Diffusion整合包v4.9(下载地址在文末)!三分钟入门AI绘画
安装和部署Stable Diffusion整合包v4.9(下载地址在文末)~致敬秋葉大佬 介绍如何安装和部署Stable Diffusion。我使用的是秋葉aaaki的整合包 电脑配置 安装和部署Stable Diffusion的电脑配置要求如...
-
ComfyUI插件:ComfyUI layer style 节点(一)
前言: 学习ComfyUI是一场持久战,而ComfyUI layer style 是一组专为图片设计制作且集成了Photoshop功能的强大节点。该节点几乎将PhotoShop的全部功能迁移到ComfyUI,诸如提供仿照Adobe Photoshop的图...
-
11、LLaMA-Factory自定义数据集微调
1、数据集定义 针对实际的微调需求,使用专门针对业务垂直领域的私有数据进行大模型微调才是我们需要做的。因此,我们需要探讨如何在LLaMA-Factory项目及上述创建的微调流程中引入自定义数据集进行微调。**对于LLaMA-Factory项目,目前...
-
【扩散模型(八)】Stable Diffusion 3 diffusers 源码详解2 - DiT 与 MMDiT 相关代码(下)
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
开源项目openai-whisper-talk使用指南
开源项目openai-whisper-talk使用指南 openai-whisper-talkopenai-whisper-talk is a sample voice conversation application powered by OpenA...
-
提升硬盘性能的方法
提升硬盘性能的方法多种多样,以下是一些常见的策略: 1. 选用高性能的硬件设备 固态硬盘(SSD):相比于传统的机械硬盘(HDD),SSD具有更快的读写速度和更低的延迟。将操作系统和常用应用程序安装在SSD上可以显著提高系统响应速度和运行效率。...
-
AI绘画:将您的照片变成素描风格!ComfyUI 的简易工作流指南
前言 将您的照片变成素描风格!ComfyUI 的简易工作流指南 想要将照片快速转换为素描风格?借助 ComfyUI,你可以轻松实现这一目标。今天,我将分享一个简单的工作流,帮助你快速将照片变为素描效果,同时提供一些实用的小贴士,助你获得最佳的图像质量...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
Stable-Diffusion1.5
SD1.5权重:https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main SDXL权重:https://huggingface.co/stabilityai/stable-diffus...
-
OpenAI大逃亡,AGI安全团队半数出走!奥特曼:攘外必先安内
尽管不断招兵买马,依旧挡不住OpenAI的安全团队「集体出走」。半数员工已离职、公司处在风口浪尖,奥特曼却在此时选择对内部员工展开安全监控。 今年5月发布会后,安全团队负责人Ilya Sutskever和Jan Leike曾前后脚在推特上官宣离职。 加入...
-
使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例
偶然看到一篇很短代码就能实现llama function call的文章。 秉着学习加分项的原则,进行了实验测试。这里给出案例和全部改写后的代码。 将 LLM 与函数调用相结合,就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具(例如用...
-
如何本地搭建Whisper语音识别模型
如何本地搭建Whisper语音识别模型 如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介 本地搭建的意义和应用场景 应用场景包括但不限于: 2. 环境准备 系统要求 Python环境安装 依赖库安装 3. 安...
-
Stable Diffusion的微调方法原理总结
目录 1、Textural Inversion(简易) 2、DreamBooth(完整) 3、LoRA(灵巧) 4、ControlNet(彻底) 5、其他 1、Textural Inversion(简易) 不改变网络结构...
-
【AutoencoderKL】基于stable-diffusion-v1.4的vae对图像重构
模型地址:https://huggingface.co/CompVis/stable-diffusion-v1-4/tree/main/vae 主要参考:Using-Stable-Diffusion-VAE-to-encode-satellite-imag...
-
解锁黑科技!百度AppBuilder助你秒变开发者,轻松实现文心一言
在数字化浪潮席卷全球的今天,人工智能(AI)和大模型技术正以前所未有的速度改变着我们的世界。从自然语言处理到图像识别,从智能推荐到自动化决策,大模型以其强大的数据处理能力和学习能力,正成为推动科技创新的核心动力。 然而,对于许多开发者而言,如何高效、便捷...
-
ComfyUI中的sam模型国内下载方法
was-node-suite-comfyui这个节点安装的时候,有它内部的config配置文件,里面其实给了一些下载地址,配置文件里是这么写的: "sam_model_vith_url": "https://dl.fbaipublicfiles.com/...
-
本地部署 Llama-3-EvoVLM-JP-v2
本地部署 Llama-3-EvoVLM-JP-v2 0. 引言 1. 关于 Llama-3-EvoVLM-JP-v2 2. 本地部署 2-0. 克隆代码 2-1. 安装依赖模块 2-2. 创建 Web UI 2-3.启动 Web UI 2-4...
-
AI机器人本地免费部署(部署Llama 3.1详细教程)
昨日,Meta公司发布了人工智能模型——Llama 3.1。 那么Llama 3.1 405B的效果怎么样?我们来对比一张图,横向对比一下GPT-4。 可以看出,Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。...
-
AI模仿人类已经out了,现在人类模仿AI才是流量密码
人类对AI的应用已然到next level了。 前不久用AI修复老照片火爆全网,许多网友用可灵、即梦等AI工具让老照片重新“动”了起来,跨越时空的影像令人动容。 抖音#AI修复老照片#话题下的视频播放量超1.3亿,我们看到过去的黑白照片变得栩栩如生,那些美...
-
在亚马逊云科技上部署Llama大模型并开发负责任的AI生活智能助手
项目简介: 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技上利用SageMaker...
-
【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型 在线 / 离线 使用 )
文章目录 一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 2、Ollama 软件下载安装 3、Llama3 模型下载 二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用 2、Llama...
-
AIGC-ToonCrafter: Generative Cartoon Interpolation-CVPR2024
论文:https://arxiv.org/pdf/2405.17933 代码:https://doubiiu.github.io/projects/ToonCrafter 给定首尾帧,生成逼真生动的动画,动画插值生成 MOTIVATION T...
-
【04】LLaMA-Factory微调大模型——数据准备
在上文【03】LLaMA-Factory微调大模型——多模型部署中完成了Qwen2、GLM-4、LLaMA3-8B-Chinese-Chat三个模型的部署,本文则进行数据准备,为后续的微调模型提供高质量、格式规范的数据支撑。 一、数据格式 LLaMA-...
-
阿里开源新模型:超GPT-4o,数学能力全球第一!
阿里巴巴开源了最新数学模型Qwen2-Math,一共有基础和指令微调两种版本,包括1.5B、7B和72B三种参数。 根据阿里在主流数学基准测试显示,Qwen2-Math-72B指令微调版本的性能超过了GPT-4o、Cloude-3.5-Sonnet、Gem...
-
stable diffusion中的UNet2DConditionModel代码解读
UNet2DConditionModel总体结构图片来自于 https://zhuanlan.zhihu.com/p/635204519 stable diffusion 运行unet部分的代码。 noise_pred = self.unet(...
-
LLamafactory用作Formatter的方法Qwen/lib/python3.12/abc.py
Qwen/lib/python3.12/abc.py class abstractstaticmethod(staticmethod : """A decorator indicating abstract staticmethods....
-
Midjourney提示词-动物系列-16
A husky with the shape of tiger stripes on its body.UHD,4k render --ar 9:16 --s 5000 --testp --upbeta --upbeta Tiny cute and...
-
用LoRA微调 Llama 2:定制大型语言模型进行问答
Fine-tune Llama 2 with LoRA: Customizing a large language model for question-answering — ROCm Blogs (amd.com 在这篇博客中,我们将展示如何在AM...
-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...
-
每日AIGC最新进展(46):上海AI Lab发布多模态大模型InternLM-XComposer-2.5、阿里发布视频生成大模型EasyAnimate-V3、快手发布人像模型LivePortrait
Diffusion Models专栏文章汇总:入门与实战 InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input...
-
【AIGC绘画】Midjourney关键词分享(三):构图/视角关键词
前言 Midjourney构图和视角关键词的作用在于帮助我们在创作过程中更好地规划和实现视觉作品。 一、Midjourney构图和视角关键词的作用 1. 构图技巧 (Composition Techniques 引导视觉焦...
-
天才程序员周弈帆 | Stable Diffusion 解读(四):Diffusers实现源码解读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(四):Diffusers实现源码解读 接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源...
-
Llama-factory源码详细解读
微调 采用逐行调试的方法,细节来看SFT代码 AutoModelForCausalLM...
-
传知代码-Llama 2:开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)
代码以及视频讲解 本文所涉及所有资源均在传知代码平台可获取 本文概述 本文首先会介绍一下Llama2大模型,然后会使用一个公开的中文法律判决数据集(部分)进行Llama2提示学习的分类实战。 论文主要内容 这篇文章介绍了Llama 2,这是...
-
Midjourney画图关键词-最详细的拍摄视角关键词
在Midjourney画图中,拍摄视角关键词可以指导AI从特定的角度来构建画面,每种视角都能带来不同的视觉效果和感受。以下是一些常见的拍摄视角及其效果的解释: 1. **鸟瞰视角(Bird's-eye View)**:从高处向下看,像鸟儿飞翔在空中一样。...
-
掌握Midjourney视觉艺术的关键提示词指南
在数字艺术的海洋中,Midjourney以其独特的图像生成能力脱颖而出,为艺术家和创意工作者提供了前所未有的创造自由。要真正掌握这一工具,理解并有效使用各种提示词至关重要。本文将深入探索Midjourney中的“风格关键词”、“场景关键词”、“视觉关键词”...
-
Stable Diffusion XL网络结构-超详细原创
强烈推荐先看本人的这篇 Stable Diffusion1.5网络结构-超详细原创-CSDN博客 1 Unet 1.1 详细整体结构 1.2 缩小版整体结构 以生成图像1024x1024为例,与SD1.5的3个CrossAttnDownBlo...
-
stable diffusion 1.x 模型训练概述
本文主要介绍sd发展的第一阶段版本的模型架构和一些微调训练方法,后续版本SDXL,LCM 版本再写文章继续介绍 SD 1.x 版本模型结构 autoencoder(VAE :encoder将图像压缩到latent空间,而decoder将latent解码...
-
【AIGC】HF-Mirror 使用说明(MacOS 版)
今天这篇文章主要是记录 HF-Mirror 的使用过程,官网上提供了 Linux 和 Windows 的使用方式。本人作为 MacOS 用户也将自己的使用办法记录一下,希望能够帮助到其他人。 HF-Mirror 是什么? HF-Mirror 是大神...
-
AIGC工具使用指南与测评报告
目录 AIGC工具使用指南与测评报告 1. 引言 2. AIGC使用指南 2.1 安装和设置 2.2 与AIGC进行对话 2.3 提高对话质量 3. 测评报告 4. 结论 AIGC工具使用指南与测评报告 1. 引言 AIGC(A...
-
每日AIGC最新进展(27):用于视频生成的ControlNets Ctrl-Adapter、无缝循环视频生成LoopAnimate、高分辨率大型视觉-语言模型InternLM-XComposer2
Diffusion Models专栏文章汇总:入门与实战 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusio...
-
AIGC笔记--Stable Diffusion源码剖析之UNetModel
1--前言 以论文《High-Resolution Image Synthesis with Latent Diffusion Models》 开源的项目为例,剖析Stable Diffusion经典组成部分,巩固学习加深印象。...
-
Midjourney绘画风格关键词总结
我们初次使用AI绘图时,可能会对如何使用关键词营造画面感到迷茫,很多参数需要在提示词中设置,尤其多小白来说不是很好友。所以,掌握一些简单的语法和技巧很重要,下面我们将根据不同的风格列举常用的高质量关键词。 1. 风格关键词 Ink style ...
-
Midjourney 关键词与案例整理
常用关键词 风格 说明 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyo-e 浮世绘 Japanese comics/manga 日本漫画风格 s...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...