-
DatawhaleX魔搭-AI夏令营AIGC-task2
一、了解AI生图技术 1,为什么了解生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 应用广泛...
-
心理健康问答系统-AIGC大模型-小程序制作
制作一个心理健康问答系统的小程序,涉及到多个环节和技术领域。这里将从需求分析、技术选型、开发流程、API调用等方面进行详细说明。 一、需求分析与规划 在开始任何项目之前,首先需要明确的是你的小程序想要解决什么样的问题,提供哪些功能给用户。对于心理健康...
-
llamafactory-llama3微调中文数据集
一、定义 https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 基准模型测试 opencompass 离线测评 数据准备 微调训练 合并 测试 人工审核对比 二、实现 基准模型测试...
-
AIGC重塑营销与广告行业
AIGC 重塑营销与广告行业 一、典型面试题和算法编程题 1. 如何评估广告投放效果? 题目: 描述一种评估广告投放效果的方法。 答案: 广告投放效果评估通常可以从以下几个方面进行: 点击率(Click-Through Rate, CTR):...
-
新手必看!目前最强的AI绘画5款 Flux 实用基础工作流(附资源包)
大家好,我是程序员晓晓 之前为大家梳理了 Flux 开源模型的一些简单用法,今天我们继续了解一些 Flux 基础工作流,如图生图、高清放大、局部重绘等相关用法。最强AI绘画大模型 Flux【基础篇】:ComfyUI Flux.1工作流的本地部署安装教程...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task03笔记
在task02中,我们对baseline有了深度了解,我们学会了用AI工具来帮助我们学习。另外,我们制作了话剧连环画。 我们今天的任务是了解微调的基本原理,然后我们会对微调的各种参数有一个更加清楚的了解,来实现一个更好的效果,并且在这个Task中会给大家...
-
最强AI绘画大模型 Flux【基础篇】:ComfyUI Flux.1工作流的本地部署安装教程
大家好,我是程序员晓晓 上个月AI绘画界发生了一件大事,那就是前StabilityAI(也就是StableDIffusion的母公司)员工组成的新团队发布了目前为止AI绘画最强的大模型——Flux.1模型。 今天我们来分享一下如何在本地部署ComfyU...
-
【AIGC】ComfyUI 入门教程(3):图生图工作流|AI 生成图片
前言 对 AIGC 技术感兴趣,加个关注,保持联系: ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作...
-
24最新Stable Diffusion 本地部署,超详细教程(手动+自动+整合包三种方式)总有一种适合你!
前言 一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence Generated Content)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至...
-
使用llama-factory和llama.cpp微调量化Qwen2
使用llama-factory和llama.cpp微调量化Qwen2 准备数据集 微调 测试 合并 使用llama.cpp量化 准备数据集 1.选定数据集的格式 2.将处理好的数据集上传到/data 文件夹下面,并修改datase...
-
Python 爬虫入门: 常见的爬虫库及相关工具
Python 爬虫入门: 常见的爬虫库及相关工具 前言 1. 爬虫框架 1.1 Scrapy 1.2 Scrapy-Redis 2. 解析 XML 和 HTML 文档 2.1 BeautifulSoup 2.2 lxml 2.3 Par...
-
llama.cpp本地部署大模型
llama.cpp 是一个C++库,用于简化LLM推理的设置,它使得在本地机器上运行大模型(GGUF格式)成为可能。 官网:https://github.com/ggerganov/llama.cpp 模型库: https://huggingface...
-
LLaMA-Factory仓基础功能架构及NPU/GPU环境实战演练
LLaMA-Factory 基础篇 LLaMA-Factory简介 LLaMA-Factory是一个开源的大规模语言模型微调框架,设计用于简化大模型的训练过程。它提供了一个统一的平台,支持多种大模型的微调,包括LLaMA、BLOOM、Mist...
-
AI 音频/文本对话机器人:Whisper+Edge TTS+OpenAI API构建语音与文本交互系统(简易版)
文章目录 前言 思路: 环境配置 代码 1. 加载Whisper模型 2. 使用Whisper语音转文本 3. 使用OpenAI API生成文本进行智能问答 4. 实现文本转语音功能 5. 合并音频文件 6. 构建Gradio界面 注意 总...
-
欺诈文本分类检测(十一):LLamaFactory多卡微调
1. 引言 前文训练时都做了一定的编码工作,其实有一些框架可以支持我们零代码微调,LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台,有如下特性: 支持常见的模型种类:LLaMA、Mixtral-MoE、Qwen、B...
-
AI终于会画手了!AI绘画最强开源工具FLUX测试与安装
大家好,我是SD教程菌 此前发布的Stable Diffusion 3模型,因为过度审核,导致人体结构的生成能力“退步”,被喷得不轻。 现在一款优秀的平替出现了,那就是黑森林实验室的FLUX模型,该团队由Stability AI前核心成员组成。FLUX...
-
python 使用文心一言大模型API
0 背景 生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。 AIGC对于人类社会、人工智能的意义是里程碑式的。短期来看AIGC改变了基础的生产力工...
-
AI绘画:让STABLE DIFFUISON ComfyUI 在 Blender 里面飞(把AI绘画整合到blender的方法)
前言 了解过Blender的朋友一定都知道B站UP主“只剩一瓶辣椒酱”,他在blender界就是和秋叶大佬一样的存在,属于祖师级别的人物。最近,他和幻之境开发小组联合开发的一款基于 STABLE DIFFUISON ComfyUI 核心的 B...
-
【AI学习笔记】AIGC,AI绘画 ComfyUI+ComfyUI Manager安装
【AI学习笔记】ComfyUI+ComfyUI Manager安装 最近在面向BOSS直聘学习ComfyUI的使用,但是不出意外,因为学习者们迥异的电脑配置以及杂乱的AI软件工具包互相纠缠,跟人工智能相关的环境安装多少都会遇到点教程预料不到的BUG。...
-
在纯净的虚拟机上安装及使用Stable Diffusion WebUI
一、环境准备 1、创建一台纯净的虚拟机 2、安装驱动 3、下载安装Anaconda 二、部署stable-diffusion-webui 1、Linux 上的自动安装 2、导航到您想要安装 webui 的目录并执行以下命令: 3、执行...
-
打造自己的大模型|01篇LLaMA-Factory微调Llama3和其占用资源分析
面对训练好的通用的大语言模型,例如Llama3-8B,虽然在认知理解,知识问答,逻辑推理,数学,代码方面都表现很好。但是其在特定领域的知识是比较缺乏的,而且对中文问答表现也不是很好,经常出现中英文混答的问题。 所以打造一个属于自己的大模型,非常有必要!...
-
【国产异构加速卡】基于llama.cpp实现Llama3模型的guff格式转换、4bit量化以及推理加速
重要说明:本文从网上资料整理而来,仅记录博主学习相关知识点的过程,侵删。 序言 本文使用llama.cpp框架,对 Llama3-8B-Instruct 模型进行gguf格式转换,8bit量化,并在CPU和GPU上对8bit模型进行推理。 测试平台...
-
记一次:Datawhale AI夏令营-第四期-魔搭-AIGC-Task02
前言:上一篇我们按步骤跑了一遍Baseline也生成了8张故事图片,但是原理啥的都是一头雾水,因为是初学者,所以只能一点点的分析来理解消化。这篇咱们就深入的来了解一下相关的内容。根据内容自己总结理解和查询相关的一些资料。不正确的地方提出来我修改一下。 学...
-
240810-Gradio自定义Button按钮+事件函数+按钮图标样式设定
A. 最终效果 B. 参考代码 要通过自定义HTML按钮来触发Gradio自带按钮的 click 函数,你可以使用JavaScript来模拟点击Gradio的按钮。这里是一个示例代码,展示了如何实现这一点: import gradio as...
-
#Datawhale X 魔搭 AI 夏令营# AIGC文生图 Task2
1. 什么是AI生图 一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说,AI生图模型获得图片生成能力主要是通过 学习 图...
-
大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2)
系列回顾 llama factory LoRA微调qwen大模型 | 新手炼丹记录(1 -CSDN博客 大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2 -CSDN博客 olla...
-
Datawhale X 魔搭AI夏令营 第四期 AIGC文生图方向 Task2笔记
这次的笔记主要是结合了AI来辅助学习和生成提示词,和上次Task1的笔记一样,笔者会先过一遍流程,在文末再补充相应的理论知识。 通义千问(如果已经有习惯的大语言模型可以跳过这一段) 通义千问是由阿里云开发的人工智能助手,这里给出链接,大家可以自行体验...
-
AIGC绘画入门教学之stablediffusion教程
在大模型开启的 AIGC 时代,由明星 AI 初创公司 Stability AI打造的文本到图像生成模型 Stable Diffusion 可谓风靡全球。 虽然从文本到图像的生成模型并不少,但Stable Diffusion 是最受欢迎的开源模型。各路开...
-
[AI绘画] 简明原生 ComfyUI 三重超细节放大教程(附工作流)
本教程将从0构建 ComfyUI 三重细节填充放大工作流,人有多大胆,图有多大产 **(建议横屏)**鬼灭之刃 · 堕姬 & 甘露寺蜜璃 · 三重细节填充放大 · 16K(15488×8832 「四种放大」 ”潜空间“和”像素空间”,图像放...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
最新口型同步技术EchoMimic部署
EchoMimic是由蚂蚁集团推出的一个 AI 驱动的口型同步技术项目,能够通过人像面部特征和音频来帮助人物“对口型”,生成逼真的动态肖像视频。 EchoMimic的技术亮点在于其创新的动画生成方法,它不仅能够通过音频和面部关键点单独驱动图像动画,还能结...
-
Datawhale X 魔搭 第四期 AIGC文生图方向-Task03笔记
Hello,各位小伙伴们,继上一次我们精读并跑通了baseline2后,我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分,还在犹豫什么,还不快快行动起来~ 好,话不多说,今天我们就来聊聊ComfyUI和Lora微调吧~...
-
Stable Diffusion majicMIX_realistic模型的介绍及使用
一、简介 majicMIX_realistic模型是一种能够渲染出具有神秘或幻想色彩的真实场景的AI模型。这个模型的特点是在现实场景的基础上,通过加入一些魔法与奇幻元素来营造出极具画面效果和吸引力的图像。传统意义的现实场景虽然真实,但通常情况下缺乏奇幻...
-
【AI绘画】掌握AI创作神器:10分钟搞定ComfyUI和Flux大模型,零基础也能学会
大家好,我是SD教程菌。 最近大火的Flux 1.0模型,大家都去体验过没? 此模型是由SD的前员工创立的黑森林实验室推出,一经推出,业界掀起了非常大的反响,相关从业人员都感叹模型可以媲美甚至赶超SD了;现象级的成为了现在很多AI从业者的首选作图模型;...
-
基于LLaMA-Factory微调llama3成为一个角色扮演大模型,保姆级教学零基础,导出GGUF格式前篇
训练私有本地大模型需求量越来越高了, 今天就从零基础开始,不讲原理,只看结果的来完整走一遍如何训练llama3成为角色扮演,先培养兴趣,后面有需要再补充原理 (1)准备环境 推荐:使用云计算机(当然4090高配大佬请忽略) 这不是广告!不是广告!你...
-
Datawhale X魔搭 AI夏令营
Datawhale X魔搭AI夏令营 AIGC方向Task01学习笔记 (本人水平有限,文章中引用了一些大佬写的内容,引用的图片上已注明出处) 1.活动简介 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期...
-
stable diffusion的安装
stable diffusion的安装 一、前言 二、安装python环境 1、已经安装python环境,但非3.10.6版本(可以不看) 三、安装stable diffusion 四、运行 五、启动报错 1、Torch is not abl...
-
【AIGC赋能】短视频创作新纪元:一键生成,爆款不再难!
文章目录 一、AI技术的深度融入:从辅助到主导 二、实际应用场景:覆盖创作全流程 三、展望未来:AI短视频创作的无限可能 《AI短视频生成与剪辑实战108招:ChatGPT+剪映》 编辑推荐 内容简介 作者简介 目录 前言/序言 内页插图...
-
Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记
经过前两个task的学习,对于文生图的基本原理,技术支持,模型微调,工作流程等有了一定的了解,尤其是在prompt工程上面,提示词的质量决定着生成图像的流畅性和观赏性,AI大模型在这一方面为学习者们提供了非常大的帮助,通过大模型生成和优化提示词,能实现学习...
-
AI绘画又有好玩的了,玩转FLUX,手和文字不再是问题了!
Prompt: Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and col...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
AI绘画:从零开始教你玩转ComfyUI-保姆级部署教程-手把手带你ComfyUI工作流搭建!
前言 第一节:认识ComfyUI并安装 本教程专为初学者设计,详细介绍了 2024 年最新版的SD ComfyUI的使用方法。通过逐步指导,让你无需任何基础,快速学会并使用这一强大的AI绘图工具。 1、什么是comfyui ComfyUI就像...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
CoralStyleCLIP(图像编辑的协同优化区域)个人理解
一、CoralStyleCLIP介绍 论文:CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing 论文内容:本文提出了CoralStyleCLIP,它在Sty...
-
RWKV 已部署到 5 亿台 Windows 电脑?真正开源的新一代 AI 架构
2024 年 9 月 ,RWKV 社区成员发现:Office 系统在自动更新后(版本 2407 及以后)已自带 RWKV 运行库。 在 Windows 系统的 C:\Program Files\Microsoft Office\root\vfs\Pro...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
【保姆级讲解下AI绘画自动生成器有哪些?】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 🫗AI绘画自动生成器 🫗人工智能(AI 绘...
-
DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营
Task2:精读代码,实战进阶 聊聊相关:虽然现在很多的AI绘图都能被大家说“一眼鉴AI”,但随着技术日新月异的变化,我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实...