-
黄仁勋对谈扎克伯格:Llama 4或将摆脱聊天机器人形态
黄仁勋认为,Llama 2的发布是2023年最重要的AI事件。 北京时间7月30日清晨,英伟达创始人兼CEO黄仁勋与Meta创始人兼CEO马克·扎克伯格,在美国丹佛举行的第50届SIGGRAPH图形大会上完成了一场60分钟的公开对话。 上周刚刚发布...
-
#Datawhale AI夏令营第4期#AIGC方向 文生图 Task2
Task2任务:对baseline的代码有一个更加细致的理解,然后学习如何借助AI来提升我们的自学习能力. 前沿知识:了解一下 AI生图技术 的能力&局限 AI生图技术,通常指的是使用人工智能(尤其是深度学习)来生成图像的技术。这类技术可以用于...
-
Datawhale X 魔搭 AI夏令营 第四期 AIGC task3
part 1:认识comfyUI 1.初识ComfyUI 1.1什么是Comfy UI GUI是"Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。...
-
Datawhale X 魔搭AI夏令营 第四期-AIGC文生图lora方向 Task2笔记
继task01跑通baseline之后,有时候回想起实例中那些自己摸不着头脑的代码片段,确实有些好奇,task2正好用借助通用大语言模型工具精读了一下这些代码片段,并进行了实战演练一一基于话剧的连环画制作。 (这里学习文档给出的大语言模型...
-
AI绘画工具Stable Diffusion+ComfyUI的配置
ComfyUI 是一个基于图形用户界面的开源工具,用于搭建和运行复杂的图像生成和处理工作流。它主要围绕使用 Stable Diffusion 模型来生成高质量的图像。这种工具通常允许用户通过拖放不同的模块或节点,定义数据处理和生成流程,然后通过这些流程生成...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶
今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以从中学大模型的提问技巧来实现快速学习,学会如何制作一个话剧连环画...
-
Datawhale AI夏令营第四期AIGC方向Task2学习笔记
Kolors(可图)模型 Kolors是由快手团队开发的大规模文本到图像生成模型(可图 · 模型库 (modelscope.cn )根据链接的文章内容,Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面,显著优于开源和专有...
-
关于Stable diffusion的各种模型,看这篇就可以了!
前言 这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型,模型在Stable diffusion中占据着至关重要的地位,不仅决定了出图的风格,也决定了出图质量的好坏。 但在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多...
-
DALL·E 2 模型实现与运行指南
DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...
-
Datawhale X 魔搭 AI夏令营 AIGC Task2笔记
对于task2里的这几句话本人还是十分赞成的 定期关注AI生图的最新能力情况都十分重要: 对于普通人来说,可以避免被常见的AI生图场景欺骗,偶尔也可以通过相关工具绘图 对于创作者来说,通过AI生图的工具可以提效,快速制作自己所需要的内容 对...
-
Datawhale AI 夏令营 “AIGC”方向 Task1:从零入门AI生图原理&实践
Task1:从零入门AI生图原理&实践 提示:本文为对平台文档的解读注释和补充 Task1:从零入门AI生图原理&实践 Task1:从零入门AI生图原理&实践 文生图 LoRA 提示词 模型参数解读和测试...
-
介绍 Whisper 模型
介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练,并且能够执行多任务处理,包括多语言语音识别、语音翻译和语言识别。 核心方法 Whisper 使用的是 Transformer 序列到序列...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 Part1:磨刀准备一一认识通义千问 会用ChatGpt就行 Part2:精读baseline——从零入门AI生图 1. 代码的主体架构...
-
Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2
目录 认识AI助手——通义千问 操作指南 主要功能模块 精读baseline代码 分析代码的主体架构 逐行解释代码 其他疑问-向AI追问 进行实战——基于话剧的连环画制作 提示词准备 执行Task1的30分钟速通Baseline 修改...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 Task02
参考教程:Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理 使用通义千问辅助理解baseline代...
-
如何高效微调多模态Transformers模型:从入门到实践指南
多模态大模型(Multimodal Large Models)是能够处理多种类型数据(如文本、图像、音频等)的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。 目录 Transformers简介 多模态Transforme...
-
【多模态大模型】LLaMA in arXiv 2023
一、引言 论文: LLaMA: Open and Efficient Foundation Language Models作者: Meta AI代码: LLaMA特点: 该方法在Transformer的基础上增加了Pre-normalization (...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task1
小白学习笔记,如有错误请各位大佬指正 一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...
-
Datawhale Al夏令营 AIGC方向 task2
1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...
-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
使用llama factory对语言模型微调,重塑自我认知,并部署于ollama上
本文记录了从环境部署到微调模型、效果测试并部署的全过程。 一 环境 如果使用autodl租赁服务器则不需要如下步骤,但是请注意llama_factory需要python、cuda等版本满足: 首先请确报你已经安装好了conda工具...
-
Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记
大纲 一、前言 二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成(图片及对应标签) 2.4 设置data-juicer 配置文件并执行,处理metadata.jsonl文件生成result....
-
小白教程:Unsloth 打造属于自己的中文版Llama3
在定制化业务场景中,如果利用专属数据集,经过微调的大模型能够在多种任务上与GPT-4媲美,并支持本地部署,保护隐私,同时还能降低运算成本。最新推出的Llama3,作为当前性能最强的开源基础大模型,非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...
-
Positional Encoding | 位置编码【详解】
文章目录 1、位置编码的2种方案 2、位置编码 3、公式详解 : 绝对位置 、 相对位置 4、代码 4.1 代码1 4.2 代码2 1、位置编码的2种方案 transformer的作者刚开始说固定的位置编码和可学习的位置...
-
Datawhale X 魔搭 AI夏令营---AIGC Task2
目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2:精读代码,实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors(可图)模型** 1.1 精读baseline——从...
-
微调大语言模型——LLaMa-Factory平台搭建(非常详细)零基础入门到精通,收藏这一篇就够了
我们采用 LLaMA-Factory平台进行微调语言模型,详细信息可以访问github主页(https://github.com/hiyouga/LLaMA-Factory)浏览。 租赁显卡 采用AutoDL作为云平台进行微调训练。Win系统采用终端...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task02笔记
一、探探前沿:了解一下 AI生图技术 的能力&局限 1. 为什么要了解AI生图前沿? AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 学习笔记(一)
本期主要任务是了解AI文生图的原理并进行相关实践 下面是对baseline部分代码的功能介绍: 安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
Datawhale X 魔搭 AI夏令营-AIGC方向-task2知识总结
文生图背景 早期探索 (1960-1990) 最早出现于计算机视觉和图像处理。 早期图像生成技术主要依赖与规则和模板匹配,通过预定义的规则将文本转换为简单的图形。 受限于计算能力和算法,此阶段生成的图像质量较低,应用场景受限。 基于统计...
-
国产可图大模型:厚积薄发,GLM3加持质的飞跃,ComfyUI最全指南与SD3综合评比孰更强?
?大家好!我是安琪!!! Kolors大模型简 就在上周末,国内大厂快手开源了可图大模型文生图模型,这是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。 • Kolors 是在数10亿图文对下进行训练, • 在 视觉质量、复杂语...
-
Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1
一、任务要求 task1 的任务和上一期的类似,都是跑通给出的代码即可,没有太大难度。 具体要求是训练 Lora 模型,实现文生图,额外的要求是8张图片必须组成一个连贯的故事,需要一定的“写小作文”能力。 二、代码解析 下载数据集 这一步不用分析...
-
ComfyUI安装完整攻略
ComfyUI简介 ComfyUI是一种新型的Stable Diffusion用户界面,因其独树一帜的“节点式”界面,逐渐成为了AI绘画领域进阶玩家的得力武器。搭配各式各样的自定义节点与功能强大的工作流,它得以用更低的配置实现许多在WebUI等常规界面里...
-
ComfyUI零基础入门搭建教程
一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。该项目部分其它特点如下: 目前全面支持 SD1.x,SD2.x,SDX...
-
LLaMA-Factory全面指南:从训练到部署
项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案,帮助研究人员和开发者快速实现大模型的定制化需求。具体来说,LLaMA-F...
-
【LLaMA-Factory】常见报错信息及解决方法整理
1.‘llamafactory-cli’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法: cd 你路径下的\LLaMA-Factor...
-
SenseVoice多语言语音理解模型之最新部署落地经验
SenseVoice是阿里云通义实验室开发的一款多语言音频基础模型,专注于高精度多语言语音识别、情感辨识和音频事件检测。 SenseVoice支持超过50种语言的识别,并且在中文和粤语上的识别效果优于Whisper模型,提升了50%以上。 SenseV...
-
Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记
一、文生图背景 文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记 作者: 福州大学 切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活...
-
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记 经过TASK1的学习,我们都或多或少地了解了AI作图的相关知识,那么接下来我们需要学习的便是深入Prompt工程与微调,精准理解AI作图个中原理,深刻探究文生图背...
-
Whisper JAX 深度使用指南
Whisper JAX 深度使用指南 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gitcode....
-
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记
Hi,大家好,我是半亩花海。最近在尝试学习AIGC的内容,并报名参加了Datawhale举办的2024年AI第四期夏令营,主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习,很适...
-
【AIGC】ComfyUI入门-安装ComfyUI
栏目: 栏目目录里面会收录我关于AIGC相关的笔记博文,大家如果有什么不懂的可以通过阅读我的笔记进行学习。【AIGC目录】 最近自己在抽时间研究ComfyUI相关的内容,抽时间整理一下自己了解到的内容,希望可以帮到其他想要学习的小伙伴。 安装Co...
-
隆重推出 Llama 3.1: 迄今为止最强大的开源模型
The gates of heaven open: Llama 3.1 405B, the most capable models to date from Meta, is competitive with leading foundation mode...
-
「AIGC」大语言模型系列-Transformer详解
Transformer模型相对复杂,下面我将提供一个简化版的Transformer模型的Python代码示例,使用PyTorch库实现。这个示例将包括模型的基本结构,如编码器和解码器,自注意力机制,位置编码,以及前馈网络。 请注意,这个示例主要用于教...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记
(赛题链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛) (学习链接:从零入门AI生图原理&实践) 速通指南 ...
-
Stable Diffusion之最全详细图解
Stable Diffusion是一种生成模型,用于生成高质量的图像。这种模型基于扩散过程,能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解,涵盖其原理、模型结构、训练过程及应用示例。 一、Stable Diffusi...
-
微调 Whisper 语音大模型
1.准备环境 #创建环境 conda create -n whisper python=3.10 -y source activate whisper #安装环境 conda install pytorch==2.1.0...