-
Stable Diffusion 使用
目录 背景 最简单用法 进阶用法 高手用法 safetensor 一、概述 二、主要特点 背景 Stable Diffusion 开源后,确实比较火,上次介绍了下 Stable Diffusion 最简单的concept。今天继续介...
-
人人都能用的「AI 作画」,如何把 Stable Diffusion 装进电脑?
我从小特别羡慕会画画的伙伴,他们能绘出心中所想,而本人水平最高的肖像画是丁老头。接触 Stable Diffusion 后,我脱胎换骨,给自己贴上了「会画画」的新标签。 丁老头进化旅程 Stable Diffusion 是以文本生成图像的 AI 工...
-
AI日报:阿里云发布音频模型Qwen2-Audio;字节将推类sora模型;AI眼里13.11>13.8
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Qwen2-Audio:千问系...
-
LLaMA原理与代码实例讲解
LLaMA原理与代码实例讲解 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...
-
Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA
引言 经过几个月的期待, 阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃,拥有尖端的进步,有可能将其定位为 Meta 著名的最佳替代品 骆驼3 模型。在本次技术深入探讨中,我...
-
AIGC文生图lora微调训练案例;SD-Train界面训练stable Diffusion lora模型
lora仓库(1000多个lora微调模型分享): https://lorastudio.co/models 1、命令代码方式:文生图lora微调训练案例 主要用huggingface相关包:peft、accelerate、diffusers 参...
-
Llama-factory源码详细解读
微调 采用逐行调试的方法,细节来看SFT代码 AutoModelForCausalLM...
-
Meta Llama 3 来啦!性能算力究竟如何?
新一代大语言模型 Meta Llama 3 横空出世! 前言 就在4月19日,Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3!这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...
-
【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3
?博客主页:西瓜WiFi ?系列专栏:《大语言模型》 很多非常有趣的模型,值得收藏,满足大家的收集癖! 如果觉得有用,请三连?⭐❤️,谢谢! 长期不定时更新,欢迎watch和fork!❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...
-
腾讯混元文生图开源模型推出小显存版本,仅需6G显存即可运行
7月4日,腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门...
-
基于Python和TensorFlow实现BERT模型应用
本文分享自华为云社区《使用Python实现深度学习模型:BERT模型教程》,作者: Echo_Wish。 BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一种用...
-
OpenAI“断供”,谁才是最大赢家
“宫斗”之后,OpenAI又出“幺蛾子”了。 2024年7月9日起,OpenAI将采取额外措施严控API调用,如在中国大陆、中国香港、中国澳门等不支持地区检测到使用情况,轻则切断流量、重则封禁账号。 这意味着,国内相关开发将面临“断供”。 AI应用、行业模...
-
探索开源宝藏:LLaMA 2 模型的全面优势与实践指南
探索开源宝藏:LLaMA 2 模型的全面优势与实践指南 引言 在大型语言模型(LLM)的领域中,Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能,迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势,并提供详细的实...
-
通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)
通过ORPO对llama进行微调 前言 ORPO是一种新颖的微调技术,它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外,经验结果表明,ORPO在各种模型大小和基准测试中都超过了其他对齐方法。 在本文中,我们将...
-
Google 深夜突袭,Gemma 2 狂卷 Llama 3
整理 | Echo Tang 出品丨AI 科技大本营(ID:rgznai100) Google 挤牙膏式的创新真是令人爱恨交织。 早在一个多月前的 Google I/O 上,Google 便官宣将会在未来几周内推出开源模型 Gemma 的第二代 Ge...
-
使用 llama.cpp 在本地部署 AI 大模型的一次尝试
对于刚刚落下帷幕的2023年,人们曾经给予其高度评价——AIGC元年。随着 ChatGPT 的火爆出圈,大语言模型、AI 生成内容、多模态、提示词、量化…等等名词开始相继频频出现在人们的视野当中,而在这场足以引发第四次工业革命的技术浪潮里,人们对于人工智能...
-
AI日报:GPTs靠边站!Claude推全新功能Projects;Figma大更新!AI设计几秒成稿;阿里Qwen-2稳夺全球开源大模型榜首
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Claude推类GPTs功能P...
-
遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一
快科技6月27日消息,全球知名的开源平台Hugging Face的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。 为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利...
-
半年估值数亿,1000亿美元超级赛道跑出“AI猛兽”
去年,谷歌发布了一份忧心忡忡的内部文件:“虽然谷歌与OpenAI(在大模型上)你追我赶,但双方都没有真正的护城河,因为第三股力量正在崛起——开源社区才是谷歌和OpenAI最大的敌人。” 谷歌的担忧正逐渐变成了现实。 马斯克的开源大模型公司xAI近期完成60...
-
增强大型语言模型(LLM)可访问性:深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程
Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...
-
腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件
6月21日,腾讯混元文生图大模型(以下简称为混元 DiT 模型)宣布全面开源训练代码,同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。 这意味着,全球的企业与个人开发者、创作者们,都可以基于混元 DiT 训练代...
-
Stable Diffusion 3 如何下载安装使用及性能优化
Stable Diffusion 3 Stable Diffusion 3(SD3),Stability AI最新推出的Stable Diffusion模型系列,现在可以在Hugging Face Hub上使用,并且可以与Diffusers一起使用。...
-
面壁智能与华为云合作 开启大模型端云协同解决方案
6月22日,面壁智能与华为云达成正式合作,双方将开启大模型端云协同解决方案正式合作。 在消费电子终端端侧,大模型将能更好融入手机、PC、智能家居、穿戴式设备等,大模型也能与前沿的电动汽车、具身智能等结合,以及在传统的金融、法律、政务服务上,也能发挥效用。...
-
CSDN首发!Stable Diffusion 3 Medium 开源,AI 生图格局迎来巨变
就在刚刚,Stable Diffusion 3 Medium 如约而至。 几天前,Stability AI 在社交平台 X 上官宣,SD3 Medium 将在 6 月 12 日正式开源。 这一次,没有跳票,它是真的来了。 20 亿参数大小,笔记本...
-
AI日报:新王诞生!Runway重磅发布Gen-3 Alpha;Luma AI发布Extend功能;DeepSeek又开源了一个模型;ElevenLabs可为视频自动配音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、AI视频王者回归!Runway...
-
AI从来不是少数人的无限游戏
力大飞砖卷研发,到向下竞低卷价格,全球视野下的大模型与生成式AI已然走过创新扩散的兴趣阶段,行至社会评估其创新可行性的卡点。 正如红杉资本在“Generative AI’s Act Two”(《生成式AI的第二幕》)中指出的,目前生成式AI应用的最大问题,...
-
Python - 深度学习系列30 - 使用LLaMA-Factory微调模型
说明 最实用的一种利用大语言模型的方式是进行微调。预训练模型与我们的使用场景一定会存在一些差异,而我们又不可能重头训练。 微调的原理并不复杂,载入模型,灌新的数据,然后运行再训练,保留checkpoints。但是不同项目的代码真的不太一样,每一个都要...
-
AIGC从入门到实战:落霞与孤鹜齐飞:AIGC 汹涌而来
作者:禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
【全网瞩目】你想知道的Llama3都在这里
Meta发布了开放式生成人工智能模型 Llama 系列的最新产品: Llama 3。或者更准确地说,该公司首次发布了其新的 Llama 3 系列中的两个模型,其余模型将在未来某个不确定的日期发布。 Meta 称,与上一代 Llama 型号 Llama 2...
-
Llama 3 CPU推理优化指南
备受期待的 Meta 第三代 Llama 现已发布,我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中,我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟,但首先,让我们讨论一下 Meta Lla...
-
【Stable Diffusion】:SDXL1.0大模型的发布给SD带来全新的使用体验
1.Stable Diffusion XL模型是什么? SDXL是stabilityai公司推出的最新的图像大模型,可以使用stable diffusion生成Ai图像,SDXL模型与之前的Stable Diffusion v1-v2.1模型相比,使用...
-
LLM 评估汇总:真的吊打 LLaMA-3,媲美 GPT-4 吗?
一、背景 在过去的一年多里,国内在大模型领域的发展异常迅速,涌现出上百个大模型,许多模型已经迭代了多个版本,并且各种指标不断刷新。与此同时,我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么,国内的大模型真的已...
-
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2
距上次Karpathy AI大课更新之后,又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。 大神Karpathy新一期AI大课又上线了。 这一次,他讲的内容是——从头开始实现124M大小的GPT-2模型...
-
AIGC从入门到实战:AI 辅助写作:基于 ChatGPT 的自动创作和文本扩展
1. Background Introduction In the rapidly evolving digital age, artificial intelligence (AI has become an indispensable tool i...
-
【AIGC调研系列】llama3微调具体案例
Llama3的微调可以通过多种方式进行,具体案例包括: 使用XTuner进行微调,尝试让Llama3具有"它是SmartFlowAI打造的人工智能助手"的自我认知。这涉及到准备自我认知训练数据集,并通过脚本生成数据[2][8]。 利用Unsloth和G...
-
AI | LLaMA-Factory 一个好用的微调工具
‘’ LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。此外,它还提供了由 Hiyouga 提供的 Hugging Face 空间,可...
-
Stable Diffusion的本地部署、训练和使用
1.环境信息 显卡:NVIDIA GeForce RTX 3060 Laptop GPU 系统:Windows 11 CUDA版本:11.6 Python.exe版本:3.10.6 GPU挂载运行 2.实验内容 2.1 本地部署...
-
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单
随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。 但是,随着模型越来越大,RLHF 通常需要维持多个模型...
-
腾讯混元发布开源加速库,生图时间缩短75%
6月6日,腾讯发布针对腾讯混元文生图开源大模型(以下简称为混元DiT模型)的加速库,让推理效率大幅提升,生图时间缩短75%。 混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型能力。同时,混元DiT模型已经...
-
腾讯混元发布开源文生图大模型混元DiT加速库 生图时间缩短75%
腾讯混元发布了针对开源文生图大模型混元 DiT 的加速库,可将推理时间缩短75%,生图时间大幅缩短。 混元 DiT 模型也已部署至 Hugging Face Diffusers 通用模型库,用户可通过三行代码调用模型,无需下载原始代码。 通过知识蒸馏和 T...
-
Stability AI发布AI音频模型Stable Audio Open:支持文本生成鼓点、乐器等音效
Stability AI 今天发布了 Stable Audio Open1.0,这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名,但这只是该公司产品组合的一部分。该公司在2023年首次推出了 St...
-
【保姆级教程】Linux上部署Stable Diffusion WebUI和LoRA训练,拥有你的专属图片生成模型
0 写在前面 Stable Diffusion 是当前最火热的图像生成模型之一,目前已经广泛应用于艺术创作、游戏开发、设计模拟等领域,因其开源生态和易于使用而受到创作者的广泛关注,相比 Midjourney 而言,其最大的优势是完全免费,且拥有庞大的社...
-
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色,而且还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...
-
llama.cpp 转化 huggingface 模型失败 解决路径
问题: ./main -m ./models/book_q4_K_M -n 128 报错: terminate called after throwing an instance of 'std::out_of_range' what( :...
-
ollama部署体验Chinese-LLaMA-Alpaca-3大模型项目
前言 书接上回:快速评测已有的中文llama-3开源模型(4月25日更新)_llama3-chinese-novel-CSDN博客 虽然Llama-3大模型发布以后,中文适配模型也出了一大堆,但效果都不尽人意,参差不齐。近期,Chinese-LLaMA...
-
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
在 GPT-4o 出世后,Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5,甚至在某些方面超越了 GPT-4。这次就要闷声...
-
大型科技公司拥才有承担 AI 训练数据成本的能力
AI 的发展离不开数据,而这种数据的成本越来越高,这使得除了最富有的科技公司外,其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章,AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机...
-
快速评测已有的中文llama-3开源模型(4月25日更新)
Llama-3刚出来不到一周,就有一些中文微调模型了。 我快速的对这些模型进行了基准测试,时间仓促,没有办法面面俱到,仅供参考。 中文评测数据集选择的是C-Eval(valid),英文选择的是MMLU(valid),评测指标是准确率, 越高越好。 中...
-
欢迎 Llama 3:Meta 的新一代开源大语言模型
介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Fac...