-
ECCV2024|AIGC(图像生成,视频生成,3D生成等)相关论文汇总(附论文链接/开源代码)【持续更新】
ECCV2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-ECCV2024-AIGC 1.图像生成(Image Generation/Image Synthesis Accelerating Diffusio...
-
SenseVoice多语言语音理解模型之最新部署落地经验
SenseVoice是阿里云通义实验室开发的一款多语言音频基础模型,专注于高精度多语言语音识别、情感辨识和音频事件检测。 SenseVoice支持超过50种语言的识别,并且在中文和粤语上的识别效果优于Whisper模型,提升了50%以上。 SenseV...
-
【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
体验 Whisper ,本地离线部署自己的 ASR 语音识别服务
需求背景 最近看视频,过几天后经常忘记内容,所以有了把重点内容总结提炼到自己知识库的需求,这涉及到了提取视频中的音频数据、离线语音识别等功能。 提取视频中的音频数据,可以使用格式工厂或 FFmpeg 等工具, FFmpeg 可以使用命令 ffmpeg...
-
Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记
一、文生图背景 文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...
-
Datawhale AI夏令营第四期 AIGC方向 task01小白学习笔记
本人是信安专业的在校大学生,对AIGC方向属于小白一枚,以下是本次学习的初步成果展示。 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoR...
-
【AI绘画】FLUX:这款新的人工智能图像生成器非常善于创造人手
FLUX.1 是 Stable Diffusion 的公开重量级继承者,可将文本转化为图像。 FLUX.1 dev 生成图像:“A beautiful queen of the universe holding up her hands, face in...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记 作者: 福州大学 切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活...
-
引领编程效率革命:Llama Coder深度解读
引领编程效率革命:Llama Coder深度解读 llama-coderReplace Copilot with a more powerful and local AI项目地址:https://gitcode.com/gh_mirrors/ll/ll...
-
Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?
【新智元导读】最近的论文表明,LLM等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅8B的Llama3.1模型搜索100次,即可在Python代码生成任务上达到GPT-4o同等水平。 强化学习先驱、加拿大阿尔伯塔大学...
-
清华唐杰团队新作:一口气生成2万字,大模型开卷长输出
一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同问题下,输出结果直接从1800字增加到7800字,翻4倍。 要知道,目前大模型的生成长度普遍在2k以下。这对于内容创作、问...
-
Datawhale X 魔搭 AI夏令营第四期AIGC方向的实践学习
学习简介 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习—— 适合想 入门并实践 AIGC文生图、工作...
-
Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记
目录 前置知识 生成对抗网络(GAN) 大规模预训练模型 LoRA baseline一站式实现过程 下载baseline文件 安装环境,然后重启kernel 调整prompt 总结 前置知识 指导手册里写得很详细,这里写一...
-
Chinese-LLaMA-Alpaca-3 项目使用教程
Chinese-LLaMA-Alpaca-3 项目使用教程 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:https:/...
-
LLaMA-Factory 大模型微调超简单,从零开始玩转大模型微调
目录 LLaMA-Factory 大模型微调超简单,从零开始开始玩转大模型微调 为什么要使用LLaMA-Factory进行微调? 如何使用LLaMA-Factory进行微调? 安装 启动 数据准备 Alpaca 格式 指令监督微调数据集...
-
超越sd3!比肩Midjourney-v6?AI绘画大模型FLUX1.0详细评测与本地部署方法(附安装文件)
FLUX.1模型是什么? FLUX模型是一个开源的AI图像生成模型,由黑森林工作室研发。 堪比sd3以及Midjourney-v6 背景/backdrop 黑森林工作室(Black Forest...
-
Whisper JAX 深度使用指南
Whisper JAX 深度使用指南 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gitcode....
-
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记
Hi,大家好,我是半亩花海。最近在尝试学习AIGC的内容,并报名参加了Datawhale举办的2024年AI第四期夏令营,主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习,很适...
-
FLUX.1 实测,堪比 Midjourney 的开源 AI 绘画模型,无需本地显卡,带你免费实战
要列举 AI 绘画开源界的几个关键贡献,一定少不了 Stable Diffusion。 还记否前不久刚推出的 Stable Diffusion 3? 其背后的团队 Stability AI,真的是一波三折,其核心成员出走,成立了一个新公司:Black...
-
实操: 如何在AirBox上跑Stable Diffusion 3
以下文章来源于Radxa ,作者瑞莎 Stable Diffusion 3 Medium 是一种多模态扩散变换器 (MMDiT 文本到图像模型,在图像质量、排版、复杂提示理解和资源效率方面具有显著提升的性能。 目前瑞莎团队使用 Stab...
-
Datawhale X 魔搭 AI夏令营第四期AIGC task1
本期夏令营AIGC方向是通过参加可图Kolors-LoRA风格故事挑战赛https://tianchi.aliyun.com/competition/entrance/532254,学习并实践文生图AIGC、工作流搭建、LoRA微调等技术。 赛题内容...
-
【大模型Stable Diffusion】pip安装bitsandbytes后训练报错CUDA Setup failed despite GPU being available
系统环境 GPU: 3060 CUDA:11.6(确保CUDA、cuDNN已安装且添加好环境变量) 操作系统:Win11(Linux的朋友可以参考文末的Issues,再结合GPT相信可以解决的) 问题描述 错误:CUDA Setup fai...
-
【震撼来袭】Flux横空出世,吊打Midjourney,重塑AI艺术创作新格局!(附保姆级部署教程)
目录 一、Flux介绍 二、ComfyUI本地电脑部署 2.1、Flux模型下载 2.2、Clip模型下载 2.3、VAE模型 2.4、更新ComfyUI 2.5、导入工作流并进行测试 2.6、云服务部署并体验 一、Flux介绍...
-
【AIGC】ComfyUI入门-安装ComfyUI
栏目: 栏目目录里面会收录我关于AIGC相关的笔记博文,大家如果有什么不懂的可以通过阅读我的笔记进行学习。【AIGC目录】 最近自己在抽时间研究ComfyUI相关的内容,抽时间整理一下自己了解到的内容,希望可以帮到其他想要学习的小伙伴。 安装Co...
-
Genie完全指南:AI软件工程模型 - 使用方法教程与候补名单申请入口
探索Genie能为你带来哪些改变 为什么选择Genie? Genie不仅仅是一款产品——它是一项革命性的技术,致力于AI软件工程模型的发展。在SWE-Bench行业标准基准测试中,Genie取得了30%的评估分数,远超其他同类产品。致力于提供高效、高质量...
-
LangChain +Streamlit+ Llama :将对话式人工智能引入您的本地设备成为可能(上篇)
?️ LangChain +Streamlit?+ Llama ?:将对话式人工智能引入您的本地设备? 将开源LLMs和LangChain集成以进行免费生成式问答(不需要API密钥) 在过去的几个月中,大型语言模型(LLMs 得到了广...
-
开源项目Llama.cpp指南
开源项目Llama.cpp指南 llama.cppPort of Facebook's LLaMA model in C/C++项目地址:https://gitcode.com/gh_mirrors/ll/llama.cpp 1. 项目介绍 Ll...
-
本地部署Code Llama大模型结合Text generation Web UI远程运行LLM
???欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老 导航 檀越...
-
LLaMA-Factory微调llama3之模型的合并,并采用llama.cpp量化成ollama支持的gguf格式模型,生成api使用
上期我们已经成功的训练了模型,让llama3中文聊天版知道了自己的名字 这次我们从合并模型开始,然后使用llama.cpp量化成gguf格式,并且调用api (1 前期准备 上期链接: 基于LLaMA-Factory微调llama3成为一个角色扮演...
-
“Datawhale X 魔搭 AI夏令营”-AIGC文生图方向Task1笔记
前言 就自己学习过程对于Datawhale AI的夏令营第四期魔搭-AIGC文生图方向,做了个初级版教程,供小白参考,后期有机会也会通过自己的学习总结相关知识教程,期待和大家一起相互学习,共同进步! 正文 第一步:报名参加赛事! 点击赛事链接: :天池平...
-
使用Llama-factory微调Llama3教程
一、登录OpenBayes进行注册登录 通过以下链接,新用户注册登录 OpenBayes , 即可获得 四个小时 RTX 4090免费使用时长 !! 注册链接:https://openbayes.com/console/signup?r=zzl99_W...
-
AI 编程助手哪家强,国产AI有GitHub Copilot 的替代品吗?
距离 GitHub Copilot 首次发布,已经过去近三年的时间。如今,国产各家的编程助手也打得火热。在国际市场上,GitHub Copilot 可以说是一枝独秀,JetBrains AI、Codium 等国际AI紧追不放,但这些工具在国内,依旧是不方便...
-
AI绘画国产之光,快手的Kolors真的超级能打
theme: smartblue 点赞 + 关注 + 收藏 = 学会了 前两天,快手开源了一个AI绘画模型 Kolors,中文名叫“可图”。该模型基于数十亿图文对进行训练,支持256的上下文 token 数,支持中英双语,还支持在图片中生成...
-
免费替代Midjourney!FLUX.1使用方法大全,支持ComfyUI
一:Flux.1概述 1.1 它是什么 如果你想直接查看使用教程,MeoAI建议你直接跳到第四章:4种使用方法教程。 Flux.1是由Black Forest Labs开发的一款开源AI图像生成模型。这个模型继承了Stable Diffusion...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
不用写一行代码,只需要跟着步骤点点点,就可以完成task01! 本笔记可视作学习手册速通指南的扩充版本。 灰色的备注是关于该步骤的解释和拓展,可以先跳过,等走完所有步骤再回头看! 第一步 搭建代码环境 1.1 阿里云PAI-DSW申请...
-
Huatuo Llama Med Chinese 教程
Huatuo Llama Med Chinese 教程 Huatuo-Llama-Med-ChineseRepo for BenTsao [original name: HuaTuo (华驼 ], Instruction-tuning Large La...
-
Stable Diffusion【进阶篇】:图片的创成式填充
注:文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 所谓图片的创成式填充,就是基于原有图片进行扩展或延展,在保证图片合理性的同时实现与原图片的高度契合。是目前图像处理中常...
-
Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记
目录 分任务1:跑通baseline 第一步——搭建代码环境 第二步——报名赛事 第三步——在魔搭社区创建PAI实例 分任务2:相关知识学习以及赛题理解 赛题理解: 文生图基本认识: 1. Diffusion Model(扩散模型 2...
-
探索中文大模型的新高度:Chinese-LLaMA-Alpaca-3
探索中文大模型的新高度:Chinese-LLaMA-Alpaca-3 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:ht...
-
5分钟教你用AI做表情迁移,让一只猫萌萌哒的唱歌。
昨天在群里看到海辛发的一个视频,直接给我萌化了。 喜欢到爆炸。 视频是这样的。 猫唱歌!!!而且唱起来这么可爱这么呆萌!!! 很多人在问是怎么做的,其实真的蛮简单的,毕竟是AI,AI的东西,一般就是有手就行,你懂的。 这个项目,就是WAIC期间,快手开源...
-
IDE Plugin FAQ-ApiHug - API design Copilot
? ApiHug × {Postman|Swagger|Api...} = 快↑ 准√ 省↓ GitHub - apihug/apihug.com: All abou the Apihug apihug.com: 有爱,有温度,有质量,有信...
-
本地部署Perplexity 克隆:使用Llama 3.1实现高效搜索
最近,OpenAI宣布推出Search GPT,这基本上是Perplexity的改版,但直接由OpenAI开发。这让我非常高兴,因为与其让第三方使用他们的模型并提供封装服务,不如他们自己来做。我一直不喜欢Perplexity,因为他们声称他们做了很多事情来...
-
AIGC 文生图 DiffSynth-Studio微调lora训练案例
参考: https://github.com/modelscope/DiffSynth-Studio https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/train/kolor...
-
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。 据悉,MiniCPM-V2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...
-
微调 Whisper 语音大模型
1.准备环境 #创建环境 conda create -n whisper python=3.10 -y source activate whisper #安装环境 conda install pytorch==2.1.0...
-
记一次:Datawhale AI夏令营-第四期-魔塔-AIGC-Task01
前言:随着AI时代的来临,本人也想深入的了解一下不被时代淘汰(紧追)正好看见有夏令营这方面的,顺便来参加一下学习一下。 学习任务目录 一、赛事环境准备 二、跑通 “可图Kolors-LoRA风格故事挑战赛” 一、赛事环境准备 0、夏令营介绍...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task01笔记
目录 赛题内容 可图Kolors-LoRA风格故事挑战赛 baseline要点讲解(请配合Datawhale速通教程食用 Step1 设置算例及比赛账号的报名和授权 Step2 进行赛事报名并创建PAI实例 Step3 执行basel...
-
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。 例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一...
-
LLaMA-Factory
文章目录 一、关于 LLaMA-Factory 项目特色 性能指标 二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户: 昇腾...