-
10 分钟,教你如何用 LLama-Factory 训练和微调 LLama3 模型
本文将探讨于2024年3月21日发布的LLama-Factory,并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务,我们将使用 NVIDIA A4000 GPU,它被认为是功能最强大...
-
AI绘画,AI绘画大模型资料汇总,常见几个网站,搜不到答案用Edge,微软的搜索一下有时能找到解决问题的答案
第一个模型:中国镜像AI绘画模型 We'll be right back | Civitai 资料链接: Civitai中国镜像AI模型免费网站——只为造福不会魔法的炼丹师,还有五个免费模型网址整合介绍-喜好儿网 (heehel.com 第二...
-
Stable Diffusion安装指南(win+Mac)
今天我给大家带来了超强的免费AI绘画工具Stable Diffusion的保姆级安装教程,大家可以自行修炼。 首先我们先介绍一下Stable Diffusion: Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Sta...
-
AI时代CIO如何应对GPU匮乏
通过采用模型优先的心态、优化利用率和战略性地运用负载平衡,首席信息官可以缓解芯片短缺。 译自How CIOs Can Battle GPU Poverty in the Age of AI,作者 Liam Crilly。 人工智能时代的淘金热已经到来,但...
-
Stable Diffusion初级教程
一、入门篇 1. 理解基本概念 扩散模型(Diffusion Models):扩散模型是一种生成模型,通过逐步添加噪声到数据样本中,然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM :LDM是...
-
仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 大语言模型的微...
-
Llama中文大模型-模型预训练
Atom系列模型包含Atom-7B和Atom-13B,基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源,支持商用,可在Hugging Face仓库获取模型:https://huggingface.co/Flag...
-
众神听令,王者归位!Meta最强开源大模型 Llama 3 重磅来袭
整理 | 王轶群 责编 | 唐小引 出品丨AI 科技大本营(ID:rgznai100) 4月19日凌晨,Meta重磅发布了全球最大开源大模型Llama 3,一夜间重新坐稳王者之位。 模型下载链接:https://llama.meta.com/lla...
-
模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了
TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期...
-
在Mac电脑上本地部署Llama大型语言模型
Llama大型语言模型以其出色的性能和广泛的应用场景,吸引了众多NLP研究者和开发者的关注。在Mac电脑上本地部署Llama模型,可以让我们更加便捷地利用这一强大工具进行各种NLP任务。本文将详细介绍在Mac电脑上本地部署Llama模型的步骤和注意事项。...
-
Hugging Face全攻略:轻松下载Llama 3模型,探索NLP的无限可能!【实操】
Hugging Face:自然语言处理的强大开源模型库 在数字化时代,自然语言处理(NLP)技术的崛起为人工智能的发展注入了新的活力。而Hugging Face,作为这一领域的佼佼者,凭借其强大的模型仓库、易用的API以及活跃的社区支持,成为无数NL...
-
Hugging Face承诺免费提供1000万美元GPU计算资源,帮助小型开发者对抗大型AI公司
机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源,帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...
-
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了! 5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型...
-
腾讯混元文生图大模型宣布开源:首个中文原生DiT架构
今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。 腾讯混...
-
IBM向开源社区发布Granite AI模型
IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。 IBM的Granite编码模型是什么水平? Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所...
-
AI日报:干翻AI PC!苹果M4芯片首发;GoEnhance可生成粘土风格视频;DeepSeek-V2模型已在魔搭社区开源;苹果将添加AI图片擦除功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、干翻AI PC!苹果M4芯片首...
-
前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库
今年 3 月,以构建大型开源社区而闻名的 AI 初创公司 Hugging Face,挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot,引起了轰动。 Remi Cadene 在今年三月宣布结束其三年的 Tesl...
-
DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同...
-
斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用
全球首个超小型多模态AI Agent模型Octopus V3,来自斯坦福大学的NEXA AI团队,让Agent更加智能、快速、能耗及成本降低。 今年四月份初,NEXA AI推出了备受瞩目的Octopus V2,该模型在函数调用性能上超越了GPT-4,减...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。 该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度...
-
元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入
元象公司发布了首个多模态大型模型 XVERSE-V,并将其开源。这一模型支持任意宽高比的图像输入,并在多个权威评测中取得了优异的成绩。 相比其他开源和闭源模型,XVERSE-V 在综合能力上表现出色。该模型采用了融合整体和局部信息的策略,使其在识别和分析...
-
苹果OpenAI合作,力争今年生成式AI登陆iPhone
OpenAI,Google,Anthropic 齐聚 Apple 下一代操作系统,WWDC24 上,iOS 的这块蛋糕究竟花落谁家? 苹果在各国市场的 AI 领域,一直在业内寻求可靠并值得信赖的合作伙伴,以助于将各类生成式 AI 技术应用于 iPhone...
-
AI音乐生成工具AI Jukebox 输入提示词选择曲风即可创作音乐
AI Jukebox 是一个利用人工智能技术的音乐生成工具,它通过Hugging Face平台提供服务。这个工具的设计理念在于简化音乐创作过程,使其变得更加智能化和用户友好。 主要功能特点: 本地化模型加载:用户打开AI Jukebox的网页后,系统会自...
-
AI日报:最强大模型Llama 3发布;Midjourney推社交新功能Room;超强AI视频自动剪辑工具Captions;手机上可以玩大模型了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、最强大模型Llama3 正式发...
-
Parler-TTS官网体验入口 AI语音生成工具免费使用地址
Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。 来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。 最终成功展示...
-
[NLP]使用Alpaca-Lora基于llama模型进行微调教程
Stanford Alpaca 是在 LLaMA 整个模型上微调,即对预训练模型中的所有参数都进行微调(full fine-tuning)。但该方法对于硬件成本要求仍然偏高且训练低效。 [NLP]理解大型语言模型高效微调(PEFT 因此, Alpac...
-
『SD』零基础快速搭建Stable Diffusion(Windows版)
theme: smartblue 点赞 + 关注 + 收藏 = 学会了 本文简介 本文介绍如何在 Windows 安装 Stable Diffusion WebUI,不需要懂代码,只要跟着本文一步步操作就能在你电脑用AI绘画了。 只...
-
【AI】在本地 Docker 环境中搭建使用 Hugging Face 托管的 Llama 模型
目录 Hugging Face 和 LLMs 简介 利用 Docker 进行 ML 格式的类型 请求 Llama 模型访问 创建 Hugging Face 令牌 设...
-
元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。 该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果...
-
Perplexity要搞竞价排名了,大模型的尽头……就还是广告?
还记得曾经从英伟达和贝索斯们手里融了 7360 万美元,誓要以AI驱动的透明搜索体验挑战谷歌,俘获大批社区支持者的Perplexity吗? 如今,这家一直鄙视广告业务的硅谷明星AI公司,也准备开始卖广告了。 作为一款会话式答案引擎,Perplexity将聊...
-
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
大数据人工智能公司 Databricks放大招了! 3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试: https://huj...
-
集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder
Stability AI又有新动作!程序员又有危机了? 3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...
-
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
大佬出走后,第一个模型来了! 就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。 图片 要说Stability也是真的很神奇,首席执行官辞职了,Stable Diffusion其中几位作者也离开了,投资公...
-
AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画
Al Comic Factory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。 项目地址:https:/...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
元象大模型开源30款量化版本 可更低成本部署
元象大模型开源了30款量化版本,支持 vLLM 和 llama.cpp 等主流框架的量化推理,无条件免费商用。 对量化前后的模型能力、推理性能进行评估,以 XVERSE-13B-GPTQ-Int4量化版本为例,量化后模型权重压缩了72%,总吞吐提高了1.5...
-
全球下载量最大的AI绘画大模型,更新Lightning极速版
几个月前,Stable Diffusion的大模型连续推出了两中提速技术,一个是官方的Turbo,一个是清华团队的LCM。 都能在5-8步实现出图效果,把出图时间缩短了5-10倍。 但是,除了Dreamshaper等少数几个大模型坚决跟进外,大部分大模...
-
到2033年,软件开发市场中的生成式 AI 规模将达2874亿美元
软件开发中的生成式人工智能市场预计将在2033年达到2874亿美元的惊人价值,展现出强劲的年复合增长率。这种显著增长突显了生成式人工智能在颠覆传统编码实践和加速软件开发过程中的日益重要作用。这一市场的扩展可归因于多种因素,包括对软件开发流程自动化的需求、高...
-
使用GaLore在本地GPU进行高效的LLM调优
训练大型语言模型(llm ,即使是那些“只有”70亿个参数的模型,也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距,出现了低秩适应(LoRA 等参数高效方法,可以在消费级gpu上对大量模型进行微调。 G...
-
llama factory 参数体系EvaluationArguments、DataArguments、FinetuningArguments、FreezeArguments、LoraArgument
项目地址 https://github.com/hiyouga/LLaMA-Factory 模型层参数 这段代码是使用Python的dataclasses模块定义的一个数据类ModelArguments,用于管理和存储与模型微调相关的参数。这个类的设计是...
-
AMD芯片使用Stable-Diffusion
AMD芯片使用Stable-Diffusion 由于A卡的Stable Diffusion工具的逐步完善,之前只能使用CPU跑,现在已支持AMD显卡进行AI绘图。 下载 官网链接:https://github.com/AUTOMATIC11...
-
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
Stability AI 的大模型家族来了一位新成员。 昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Vi...
-
本地开启stable diffusion web-ui体验AIGC文生图,图生图
目录 准备工作 主机电脑配置检查 安装以下软件 Python Git 下载stable-diffusion-webui仓库 根据显卡属性安装CUDA 2.下载stable diffusion的训练模型 启动 问题处理 模型加载问题...
-
Stable Diffusion ControlNet 插件预览错误解决方案
在使用Stable Diffusion ControlNet 插件时,进行预处理时报错,网络上暂无详细的解决方案,故写此文。 本人软件版本: 秋叶大佬整合包v4.6.1 ControlNet v1.1 Wei UI v1.6 ...
-
Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测
本周一,Anthropic 发布了新一代大模型系列 Claude 3,遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。 Claude 3 的强大之处,不仅体现在各种基准测试上,它似乎还实现了一些神奇的突破。 昨天,Anthropic 提示工程师...
-
使用直接偏好优化策略微调Mistral-7b模型
译者 | 朱先忠 审校 | 重楼 引言 通常,经过预训练的大型语言模型(LLM)只能执行下一个标记预测,这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调,最终才能够充当真正有用的人工助理。然而,这个过程仍然可能存在...
-
Mac专属大模型框架来了!两行代码部署,能聊本地数据,还支持中文
Mac用户,终于不用羡慕N卡玩家有专属大模型Chat with RTX了! 大神推出的新框架,让苹果电脑也跑起了本地大模型,而且只要两行代码就能完成部署。 仿照Chat with RTX,框架的名字就叫Chat with MLX(MLX是苹果机器学习框...