-
AI日报:百度发布一见视觉大模型v4.5;Adobe支持用AI做动画设计;Familia.AI推“复活亲人”软件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度智能云一见视觉大模型v4....
-
24最新Stable Diffusion Lora模型训练详细教程!
前言 1. 介绍 通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自...
-
Datawhale X 魔搭 AI夏令营 第四期-AIGC方向Task2笔记
baseline的流程图 Baseline代码 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch-...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task3笔记
在task2中,已经借助AI工具对AIGC生图的代码进行精读。在本章中则更加关注于了解Lora微调的基本原理以及文生图的工作流平台工具ComfyUI的使用。 task2链接:Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task...
-
用 LoRA 微调 Stable Diffusion:拆开炼丹炉,动手实现你的第一次 AI 绘画
总得拆开炼丹炉看看是什么样的。这篇文章将带你从代码层面一步步实现 AI 文本生成图像(Text-to-Image)中的 LoRA 微调过程,你将: 了解 Trigger Words(触发词)到底是什么,以及它们如何影响生成结果。 掌握 LoRA 微调...
-
在矩池云使用 Llama-3.2-11B-Vision 详细指南
Llama 3.2-Vision是Meta开发的一系列多模态大型语言模型(LLMs),包含11B和90B两种规模的预训练和指令调整模型。 这些模型专门优化用于视觉识别、图像推理、字幕生成和回答有关图像的一般问题。Llama 3.2-Vision模型在常见...
-
LLaMA-Factory 让大模型微调变得更简单!!
背景 如果只需要构建一份任务相关的数据,就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作, 那么必将大大减轻微调工作量。 今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...
-
llama-factory实战: 基于qwen2.5-7b 手把手实战 自定义数据集清洗 微调
基于qwen2.5 手把手实战 自定义数据集 微调(llama-factory) 准备工作 1.数据集准备(例:民法典.txt) 2.服务器准备(阿里云 DSW 白嫖) 3.环境配置 pip 升级 模型下载 微调助手 4.数据集处理 脚...
-
Whisper JAX:闪电般快速的语音识别框架
Whisper JAX:闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...
-
【AIGC】ChatGPT提示词解析:如何打造个人IP、CSDN爆款技术文案与高效教案设计
博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言 💯打造个人IP爆款文案 提示词 使用方法 💯CSDN爆款技术文案 提示词 使用方法 💯高效教案设计 提示词 使用方...
-
腾讯HunyuanDit代码解析
注意:本文仅供自己记录学习过程使用。 训练 全参训练过程 输入图像用VAE编码得到输入的x_start(1,4,128,128 ;文本的两个特征:bert的encoder feature(1,77,1024 和T5 的feature(1,256...
-
【AI绘画】comfyUI抠图工作流,用免费打败收费,实现素材自由
大家好,我是爱绘画的彤姐。 近段时间AI非常的火。目前有很多软件已经拥抱了AI,加入了AI的一些功能。像AI绘画的功能,基本上是每个大厂的软件产品都会配备。但是呢,这些功能都是要付费的。而且是按月收费或者是按年收费。整体算下来十分的不划算。所以我尝试用s...
-
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions
创新点: VQ-VAE 👉 Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...
-
在 windows 上部署使用 Whisper 教程
在 Windows 上部署 OpenAI Whisper:详细教程 OpenAI Whisper 是一个功能强大的多语言语音识别模型,能够处理多种音频格式并生成高质量的字幕文件。本文将详细介绍如何在 Windows 系统上部署 Whisper,利用 G...
-
ERROR: Failed to build installable wheels for some pyproject.toml based projects (llama-cpp-python)
Building wheels for collected packages: llama-cpp-python Building wheel for llama-cpp-python (pyproject.toml ... error erro...
-
Datawhale训练营AIGC方向 第二期
Datawhale训练营AIGC方向 第二期 AI生图模型 概念 AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task3笔记
#目录# 一、ComfyUI安装及实践 (一)什么是ComfyUI (二)ComfyUI核心模块 (三)ComfyUI图片生成流程 ...
-
【AI绘画】零基础入门ComfyUI(三)目录和插件
大家好,我是写编程的木木。 在上一期的探索中,我们一起走进了快手可图的奇妙世界,并通过一组提示词生成了不错的图片,粗略体验了它独特的操作。许多朋友可能对其中文件夹的作用感到好奇。今天,我们将深入探讨ComfyUI的目录结构和插件体系,并推荐几款值得一试的...
-
【记录贴 | 持续更新】搜广推/aigc 面试题记录
目录 nlp/搜广推 transformer结构? 位置编码的作用? 解释 self-attention? attention中 /√(d_k 的作用是什么? 解释Multi-Head Attention? FeedForward的作用...
-
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。 能设计芯片的AI黑科技来了! 就在刚刚,谷歌DeepMind推出名为A...
-
ComfyUI-UltraEdit插件部署在服务器
本过程使用的是阿里云ESC服务器,实例规格为ecs.gn7i-c8g1.2xlarge,autodl的4090也可以,但3080会爆显存 1.从github上安装最简洁的comfyui,可以减少模型占用的内存(可删掉自带的manage ,安装地址:Git...
-
<Project-3 Video2SubTitle> Python coding Flask应用:从视频中,提取对白,生成独立的字幕文件 浏览器页面交互 调用cuda, Whisper模型
原因: 在网上看到一个视频没有字幕。 记者问小泉纯一郎 (前日本首相 ,我只是好奇,想知道Y说的是什么。 上面这个帖子里的视频:https://x.com/i/status/1834489208398115295 视频没有字幕,那就自己做...
-
【一文读懂】Whisper 语音识别
Whisper 语音识别 Whisper 是由 OpenAI 开发的一款先进的语音识别模型,它能够将语音转换为文本。Whisper 是一个端到端的深度学习模型,具有多语言和多任务的能力,可以用于多种语音处理任务,包括语音转文本(transcription...
-
N46Whisper 项目使用教程
N46Whisper 项目使用教程 N46Whisper Whisper based Japanese subtitle generator 项目地址: https://gitcode.com/gh_mirrors/n4/N46Whisper...
-
用TensorRT-LLM进行LLama的推理和部署
Deploy an AI Coding Assistant with NVIDIA TensorRT-LLM and NVIDIA Triton | NVIDIA Technical BlogQuick Start Guide — tensorrt_llm...
-
LLaMA-Factory源码分析
搭建远程容器调试环境 docker-compose部署 使用LLaMA-Factory源码中的docker/docker-cuda下的Dockerfile和docker-compose.yml构建镜像,启动其服务。Dockerfile使用官方默认,只需...
-
【Datawhale X 魔搭AI夏令营】AIGC方向 Task 1+2
目录 写在前面 Task 1 赛题解读——可图Kolors-LoRA风格故事挑战赛 文生图 文生图基础知识 提示词 LoRA ComfyUI 参考图控制 Task 2 前沿探索:了解AI生图技术的能力和局限 Deepfake 必要...
-
llama网络结构及源码
目录 模型初始化 config lm_head transformer wte h rms_1/rms_2 attn c_attn c_proj 线性层mlp ln_f rope_cache mask_cache kv_cac...
-
【AIGC】ChatGPT提示词助力高效文献处理、公文撰写、会议纪要与视频总结
博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言 💯高效英文文献阅读 提示词 使用方法 💯高效公文写作 提示词 使用方法 💯高效会议纪要 提示词 使用方法 💯高效...
-
Datawhale X 魔搭 AI夏令营--AIGC Task3
Datawhale X 魔搭 AI夏令营–AIGC Task3 文章目录 Datawhale X 魔搭 AI夏令营--AIGC Task3 ComfyUI 实践 Lora微调 ComfyUI 目前主流GUI有三种:使用...
-
[1305]whisper(音转文)使用教程
文章目录 实时录制音频并转录 faster-whisper使用教程 github:https://github.com/openai/whisper https://gitcode.com/gh_mirrors/whisp/whisp...
-
Lawyer LLaMA(中文法律大模型本地部署)
Lawyer LLaMA(中文法律大模型本地部署 1.模型选择(lawyer-llama-13b-v2) 2.运行环境 1.建议使用Python 3.8及以上版本。 2.主要依赖库如下: transformers >=...
-
11、LLaMA-Factory自定义数据集微调
1、数据集定义 针对实际的微调需求,使用专门针对业务垂直领域的私有数据进行大模型微调才是我们需要做的。因此,我们需要探讨如何在LLaMA-Factory项目及上述创建的微调流程中引入自定义数据集进行微调。**对于LLaMA-Factory项目,目前...
-
【笔记】扩散模型(七):Latent Diffusion Models(Stable Diffusion)论文解读与代码实现
论文链接:High-Resolution Image Synthesis with Latent Diffusion Models 官方实现:CompVis/latent-diffusion、CompVis/stable-diffusion 这一...
-
详聊LLaMa技术细节:LLaMA大模型是如何炼成的?
本文介绍来自 Meta AI 的 LLaMa 模型,类似于 OPT,也是一种完全开源的大语言模型。LLaMa 的参数量级从 7B 到 65B 大小不等,是在数万亿个 token 上面训练得到。值得一提的是,LLaMa 虽然只使用公共的数据集,依然取得了强悍...
-
【HuggingFace Transformers】LlamaModel源码解析
LlamaModel源码解析 1. LlamaModel 介绍 2. LlamaModel类 源码解析 3. 4维因果注意力掩码生成 1. LlamaModel 介绍 LlamaModel 是一个基于 Transformer 架构...
-
PyTorch-LLaMA 项目使用教程
PyTorch-LLaMA 项目使用教程 pytorch-llama LLaMA 2 implemented from scratch in PyTorch 项目地址: https://gitcode.com/gh_mirrors/py/pyt...
-
AI绘画:手把手教你在MacBook安装上ComfyUI!
前言 今天带来的是MacBook上部署ComfyUI的教程。Windows版本同理,更加简单,就不做赘述了。 0****1 【什么是ComfyUI】 进入安装部署正题前,我们先看看ComfyUI是什么,安装它有什么好处,它和SD(Stable D...
-
LongLLaMA 项目使用教程
LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...
-
如何微调 Llama 3 进行序列分类?
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集: 《大模...
-
使用LLaMA-Factory进行模型微调(LLama3-8B-instruct)
1.使用环境 Linux -Ubuntu20.04 RTX3090 24GB, LORA+sft 训练微调 2. 下载项目,虚拟环境创建及安装: git clone https://github.com/hiyouga/LLaMA-Factor...
-
VAE(Variational auto-encoder)
1.VAE(Variational auto-encoder) 笔记来源及推荐文章: 1.变分自编码器(一):原来是这么一回事 2.变分自编码器(二):从贝叶斯观点出发 3.变分自编码器(三):这样做为什么能成? 4.变分自编码器(四):一步到位的聚类...
-
手把手带你了解和实践扩充 LLaMA 大语言模型的 tokenizer 模型(实现中文token过程)
目前,大语言模型呈爆发式的增长,其中,基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好,接下来本文将讲解如何去扩充vocab里面的词以对中文进行token化。 一般的,目前比较主流的是使用sentencepiece训练中...
-
用Transformers库运行Llama-3.1-Minitron-4B
我的笔记本来自8年前的旧时代,勉强能运行8B模型,于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型,通过结构化权重剪枝和知识提炼技术优化而成的...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task2
小白学习笔记,如有错误请各位大佬指正 一、AI生图背景介绍 1.AICG领域介绍 AIGC(Artificial Intelligence Generated Content)领域涉及使用人工智能技术生成各种类型的内容,包括文本、图像、...
-
OpenBayes 教程上新 | FLUX ComfyUI 现已上线 ,让 SD 和 Midjourney 颤抖的文生图黑马!
横空出世的黑马 FLUX ,以其强大的图像生成能力,让 Stable Diffusion 和 Midjourney 这 2 个「昔日顶流」倍感压力。 FLUX 与 Stable Diffusion 渊源颇深,其研发公司 Black Forest Labs...
-
使用 SAX 在 TPU v5e 上部署和提供 Llama 2 模型
创建 TPU 以下步骤展示了如何创建用于您的模型的 TPU 虚拟机。 创建环境变量: export PROJECT_ID=PROJECT_ID export ACCELERATOR_TYPE=ACCELERATOR_TYPE...
-
《文末福利:黑神话悟空豪华版》借助Stable Diffusion实现人物自我控制的AI艺术突破
文章目录 引言 人物生成 操作过程 图像调整步骤 二郎神 孙悟空 八戒 场景渲染 技术原理: 好易智算平台 引言 提示词:solo,red eyes,water,male focus,1boy,standing,furry...
-
AI智能体研发-模型篇(一):大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用
一、引言 贫富差距的产生是信息差,技术贫富差距的产生亦如此。如果可以自我发现或者在别人的指导下发现优秀的开源项目,学习或工作效率真的可以事半功倍。 今天力荐的项目是LLaMA-Factory,我在去年8月份就开始使用这个项目进行模型部署和微调训练(fi...
-
【LLM大模型】使用QLoRa微调Llama 2
本篇文章将介绍使用PEFT库和QLoRa方法对Llama 27b预训练模型进行微调。我们将使用自定义数据集来构建情感分析模型。只有可以对数据进行微调我们才可以将这种大模型进行符合我们数据集的定制化。 一些前置的知识 如果熟悉Google Cola...