-
LongLLaMA 项目使用教程
LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...
-
【AIGC】MimicMotion:姿态引导的高质量人体运动视频生成技术
资源 论文:https://arxiv.org/pdf/2406.19680 github:https://github.com/Tencent/MimicMotion comfyui:https://github.com/kijai/ComfyUI...
-
阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。 这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企...
-
DataWhaleX魔搭AI夏令营第四期AIGC方向task03笔记
目录 ComfyUI 简介 ComfyUI核心模块 ComfyUI图片生成流程 优势 速通安装ComfyUI 使用ComfyUI Lora微调 简介 原理 参数详情 高质量的数据集的准备 明确需求和目标 数据集来源 ta...
-
AIGC实战——多模态模型Flamingo
AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用 小结 系列链接 0. 前言 我们已经学习了文...
-
探索大模型和 Multi-Agent 在运维领域的实践
摘要:本文从智能运维面临的挑战和痛点出发,介绍企业运维领域应用 AIGC 的实践案例,基于确定性运维的实践经验,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。 本文分享自华为云社区《LLM...
-
Datawhale X 魔搭 AI夏令营 - AIGC文生图方向 task03笔记
系列文章目录 Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记-CSDN博客 Datawhale X 魔搭 AI夏令营 - AIGC文生图方向 task02笔记-CSDN博客 目录 前言 一、comf...
-
速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读
文章目录 论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...
-
记一次:Datawhale AI夏令营-第四期-魔搭-AIGC-Task03
前言:书接上回,前面说了AIGC的了解和精读baseline,那么我们可以再次的抽丝拔茧,开始了解GUI部分和微调部分。 一、ComfyUI应用部分 1、什么是GUI? 2、什么是ComfyUI? 3...
-
stable-diffusion-webui-pixelization 使用教程
stable-diffusion-webui-pixelization 使用教程 stable-diffusion-webui-pixelizationstable-diffusion-webui-pixelization项目地址:https://gi...
-
小白学大模型:LLaMA-Factory 介绍与使用
最近这一两周看到不少互联网公司都已经开始秋招提前批了。 不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。...
-
AIGC实践——asr识别FunASR手把手部署流程
💡 大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、互联网和自媒体。 FunASR是什么? FunASR 是一个基本的语音识别工具包,提供多种功能,包括语音识别 (ASR 、语音活动检测 (VAD 、标点符号恢复、语言模型...
-
Cog-Stable-Diffusion 开源项目指南
Cog-Stable-Diffusion 开源项目指南 cog-stable-diffusionDiffusers Stable Diffusion as a Cog model项目地址:https://gitcode.com/gh_mirrors/c...
-
基于whisper流式语音识别
为了实现持续监听麦克风并在检测到声音时进行转录,我们可以将流的监听时间设置为无限长。通过使用一个音量门限来检测是否有声音,然后进行转录。 安装依赖 确保安装必要的库: pip install torch torchaudio openai-whis...
-
Datawhale AI 夏令营 第四期 AIGC Task1
活动简介 活动链接:Datawhale AI 夏令营(第四期) 以及AIGC里面的本次任务说明:Task 1 从零入门AI生图原理&实践链接里的教程非常详细,很适合小白上手,从使用服务器平台到配置环境再到跑模型,手把手教! 具体细节我就不赘述了...
-
9、LLaMA-Factory项目微调介绍
1、LLaMA Factory 介绍 LLaMA Factory是一个在GitHub上开源的项目,该项目给自身的定位是:提供一个易于使用的大语言模型(LLM)微调框架,支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致...
-
OpenAI Whisper 开源项目使用手册
OpenAI Whisper 开源项目使用手册 openai-whisperA sample web app using OpenAI Whisper to transcribe audio built on Next.js. It records a...
-
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大语言模型还能向上突破,OpenAI 再次证明了自己的实力。 北京时间9月13日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task03笔记
在task02中,我们对baseline有了深度了解,我们学会了用AI工具来帮助我们学习。另外,我们制作了话剧连环画。 我们今天的任务是了解微调的基本原理,然后我们会对微调的各种参数有一个更加清楚的了解,来实现一个更好的效果,并且在这个Task中会给大家...
-
IBM中国研发裁员与AIGC浪潮下的中国IT产业新篇章:挑战、机遇与未来展望
文章目录 一、跨国公司战略调整与全球IT版图的重构 1. 跨国公司的战略考量 2. 中国IT产业的应对策略 二、人才市场的深刻变革与应对策略 1. 人才流失与再就业压力 2. 人才培养与引进策略 3. 个人职业规划与发展 三、AIGC浪...
-
分享一个AI开发者的强力助手:openMind Library
在人工智能的浪潮中,深度学习开发套件 openMind Library,以其强大的功能和易用性,逐步成为AI开发者们的强力助手。本文将通过魔乐社区近期关注挺高的大模型平台魔乐社区,深入了解openMind Library。 openMind Librar...
-
24最新Stable Diffusion 本地部署,超详细教程(手动+自动+整合包三种方式)总有一种适合你!
前言 一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence Generated Content)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至...
-
一文彻底搞懂大模型 - GPT和LlaMA的模型架构
GPT vs LlaMA GPT与LlaMA,作为大语言模型的两大巨擘,均基于Transformer架构却各有千秋。GPT系列以强大的生成能力著称,通过不断增大的参数规模引领复杂语言与推理任务的前沿;而Llama则以开源姿态,通过技术创新提升模型性能,预...
-
AIGC文生图 ComfyUI介绍与实践+Lora微调-Task3 Datawhale X 魔搭 AI夏令营第四期
目录 概要 ComfyUI介绍 ComfyUI实践 ComfyUI学习资源推荐 Lora微调 Lora数据库推荐 问题解决 说在最后 概要 今天的任务是了解微调的基本原理,然后会对微调的各种参数有一个更加清楚的阐释,来实现...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1随笔
目录 前言: 一、Datawhale AI夏令营简单介绍: 二、Datawhale AI夏令营学习课程 AIGC方向: 大模型应用开发方向: 多模态大模型(数据合成 : 三、报名二维码 Task1: 一、赛题解读: 二、文生图: 1、...
-
LLaMA-Factory仓基础功能架构及NPU/GPU环境实战演练
LLaMA-Factory 基础篇 LLaMA-Factory简介 LLaMA-Factory是一个开源的大规模语言模型微调框架,设计用于简化大模型的训练过程。它提供了一个统一的平台,支持多种大模型的微调,包括LLaMA、BLOOM、Mist...
-
如何部署Meta开源大模型Llama2,转换为Huggingface模型的权重文件
如何部署Meta开源大模型Llama2 一、申请下载权限 通过Meta AI官网(https://llama.meta.com/llama-downloads/ 申请下载权限,注意Country/Region选择这里,可能会影响审查速度吧,...
-
OpenAI神秘模型「草莓」两周内上线?数学推理暴涨,月收费200刀已有人付费
就在刚刚,The Information曝出:OpenAI的草莓将于两周内上线!收费疑似200刀一个月,最大的特色就是比其他模型多思考10到20秒。然而因为「狼来了」太多回,网友们忍不住吐槽:OpenAI现在就是个炒作公司。 最新消息,「草莓」将在两周内发...
-
【大模型】llama系列模型基础
前言:llama基于transformer架构,与GPT相似,只用了transformer的解码器部分。本文主要是关于llama,llama2和llama3的结构解读。 目录 1. llama 1.1 整体结构 1.2 RoPE 1...
-
新一代模型微调方案LLama-Pro ,快来围观!!!
❝ 大家好,我是 Bob! 😊 一个想和大家慢慢变富的 AI 程序员💸 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我,一起探索,一起破圈!💪 Y LLAMA PRO论文笔记 直达链接: 摘要 这篇论文介绍了一种名为L...
-
书单 | 大模型的书那么多,如何快速选到适合自己的那一本?来,教你!
大模型的书这么多,该怎么选呢? 本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本! 大模型基础 大模型入门不可错过的一本书,就是这本大模型界的经典畅销书**《大规模语言模型》**!系统性强,内容适合初学者,如果你想知道如何构建一个大模型...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
开源大模型再迎“历史性时刻”,Meta发布Llama 3.1
7月23日晚,Meta正式推出了最新的开源大模型系列Llama 3.1,进一步缩小了开源模型与闭源模型之间的差距。Llama 3.1系列包括8B、70B和405B三个参数规模,其中Llama 3.1-405B参数的模型在多个基准测试中超越了OpenAI的G...
-
【Datawhale X 魔搭 AI夏令营】第四期 AIGC方向 学习笔记
零基础30分钟速通文生图 一、开通阿里云PAI-DSW试用 1、开通阿里云免费试用 链接:https://free.aliyun.com/?productCode=learn 2、在魔搭社区进行授权 链接:https://www.models...
-
Datawhale X 魔搭 第四期 AIGC文生图方向-Task03笔记
Hello,各位小伙伴们,继上一次我们精读并跑通了baseline2后,我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分,还在犹豫什么,还不快快行动起来~ 好,话不多说,今天我们就来聊聊ComfyUI和Lora微调吧~...
-
“探索Flux NF4:Stable Diffusion模型的综合指南“
前言 您是否想直接在Stable Diffusion中使用Flux NF4,而不是ComfyUI界面?这是对这些调整的指南。Stable Diffusion已经成为了一个热门工具,用于创建具有非凡精度的AI生成图像。 在本指南中,我们将探讨Stabl...
-
AIGC笔记--基于PEFT库使用LoRA
1--相关讲解 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS LoRA 在 Stable Diffusion 中的三种应用:原理讲解与代码示例 PEFT-LoRA 2--基本原理...
-
Datawhale X魔搭 AI夏令营
Datawhale X魔搭AI夏令营 AIGC方向Task01学习笔记 (本人水平有限,文章中引用了一些大佬写的内容,引用的图片上已注明出处) 1.活动简介 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期...
-
本地搭建和运行Whisper语音识别模型小记
搭建本地的Whisper语音识别模型可以是一个非常有用的项目,尤其是在需要离线处理语音数据的情况下。Whisper是OpenAI开发的一个开源语音识别模型,支持多语言和高效的转录能力。以下是详细的步骤来本地搭建和运行Whisper语音识别模型: 1....
-
Llama 3.1 92页技术报告详细解读
引言 半个月前,Meta发布了他们的开源大模型Llama3.1,在社区中引起广泛关注和讨论。现在几周的时间过去了,热度逐渐退潮,舆论逐渐降温,整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1,正是理性地来审视一下这款大模型...
-
Datawhale AI 夏令营【AIGC文生图】
Datawhale AI 夏令营----AIGC文生图 一、赛事介绍 1、背景知识 2、比赛任务 3、文生图简介 4、数据集介绍 二、Task1 baseline解析 1、导入相关库 2、数据集处理 3、保存数据 4、训练模型,查看训练脚...
-
【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0
【导读】:本文是LLM模型微调第七篇,分享Meta于20240807的开源三篇文章:Methods for adapting large language models,To fine-tune or not to fine-tune,How to fin...
-
OpenAI GPT-3 Davinci:引领AI写作新纪元
本文还有配套的精品资源,点击获取 简介:OpenAI研发的GPT-3模型,尤其是其Davinci版本,代表了自然语言处理领域的重大突破,具有1750亿参数,提升了AI在理解和生成语言的能力。GPT-3的Davinci版本以顶级性能著称,在多种语...
-
浅谈AIGC的底层技术
人工智能生成内容(Artificial Intelligence Generated Content, 简称AIGC)是近年来AI技术发展的一个重要领域,它利用机器学习和自然语言处理等技术,让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...
-
Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记
经过前两个task的学习,对于文生图的基本原理,技术支持,模型微调,工作流程等有了一定的了解,尤其是在prompt工程上面,提示词的质量决定着生成图像的流畅性和观赏性,AI大模型在这一方面为学习者们提供了非常大的帮助,通过大模型生成和优化提示词,能实现学习...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
本地搭建Stable Diffusion,文生图再也不用求别人了!
前言 本地搭建Stable Diffusion,文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型,用于生成高质量的图像。它基于一种名为扩散过程的生成方法,能够在给定条件的情况下生成具有丰富细节的图像。...
-
真把自己「当个人」的AI,扫去了我的社交贫困
现代打工人,时常会因为「社交贫困」而四处碰壁,无心工作时不知找谁聊天,讨论气氛热烈时语出惊人,开口就能终结话题,周末出去玩发了朋友圈,后来发现也没有人点赞。 总之一进入社会,就感受到了世界的参差。最近这些尴尬无助的场景,全都有了解决方案。 我们刷到一段聊天...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛🔗:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...