hugging face 第4页

大型科技公司拥才有承担 AI 训练数据成本的能力

AI 的发展离不开数据，而这种数据的成本越来越高，这使得除了最富有的科技公司外，其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章，AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机...

人工智能 2024-06-03 人工智能

900阅读

快速评测已有的中文llama-3开源模型（4月25日更新）

Llama-3刚出来不到一周，就有一些中文微调模型了。我快速的对这些模型进行了基准测试，时间仓促，没有办法面面俱到，仅供参考。中文评测数据集选择的是C-Eval（valid），英文选择的是MMLU（valid），评测指标是准确率，越高越好。中...

生成式AI 2024-06-02 人工智能

1009阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

生成式AI 2024-06-02 人工智能

1058阅读

10 分钟，教你如何用 LLama-Factory 训练和微调 LLama3 模型

本文将探讨于2024年3月21日发布的LLama-Factory，并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务，我们将使用 NVIDIA A4000 GPU，它被认为是功能最强大...

大数据 2024-06-02 人工智能

1460阅读

AI绘画，AI绘画大模型资料汇总，常见几个网站，搜不到答案用Edge,微软的搜索一下有时能找到解决问题的答案

第一个模型：中国镜像AI绘画模型 We'll be right back | Civitai 资料链接： Civitai中国镜像AI模型免费网站——只为造福不会魔法的炼丹师，还有五个免费模型网址整合介绍-喜好儿网 (heehel.com 第二...

人工智能 2024-06-01 人工智能

937阅读

Stable Diffusion安装指南（win+Mac）

今天我给大家带来了超强的免费AI绘画工具Stable Diffusion的保姆级安装教程，大家可以自行修炼。首先我们先介绍一下Stable Diffusion： Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Sta...

人工智能 2024-05-31 人工智能

1061阅读

AI时代CIO如何应对GPU匮乏

通过采用模型优先的心态、优化利用率和战略性地运用负载平衡，首席信息官可以缓解芯片短缺。译自How CIOs Can Battle GPU Poverty in the Age of AI，作者 Liam Crilly。人工智能时代的淘金热已经到来，但...

AIGC 2024-05-30 人工智能

887阅读

Stable Diffusion初级教程

一、入门篇 1. 理解基本概念扩散模型（Diffusion Models）：扩散模型是一种生成模型，通过逐步添加噪声到数据样本中，然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM ：LDM是...

大数据 2024-05-29 人工智能

1101阅读

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注大语言模型的微...

AIGC 2024-05-28 人工智能

913阅读

Llama中文大模型-模型预训练

Atom系列模型包含Atom-7B和Atom-13B，基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源，支持商用，可在Hugging Face仓库获取模型:https://huggingface.co/Flag...

人工智能 2024-05-28 人工智能

916阅读

众神听令，王者归位！Meta最强开源大模型 Llama 3 重磅来袭

整理 | 王轶群责编 | 唐小引出品丨AI 科技大本营（ID：rgznai100） 4月19日凌晨，Meta重磅发布了全球最大开源大模型Llama 3，一夜间重新坐稳王者之位。模型下载链接：https://llama.meta.com/lla...

AIGC 2024-05-28 人工智能

875阅读

模块化重构LLaVA，替换组件只需添加1-2个文件，开源TinyLLaVA Factory来了

TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期...

人工智能 2024-05-27 人工智能

982阅读

在Mac电脑上本地部署Llama大型语言模型

Llama大型语言模型以其出色的性能和广泛的应用场景，吸引了众多NLP研究者和开发者的关注。在Mac电脑上本地部署Llama模型，可以让我们更加便捷地利用这一强大工具进行各种NLP任务。本文将详细介绍在Mac电脑上本地部署Llama模型的步骤和注意事项。...

大数据 2024-05-26 人工智能

1027阅读

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

Hugging Face：自然语言处理的强大开源模型库在数字化时代，自然语言处理（NLP）技术的崛起为人工智能的发展注入了新的活力。而Hugging Face，作为这一领域的佼佼者，凭借其强大的模型仓库、易用的API以及活跃的社区支持，成为无数NL...

人工智能 2024-05-24 人工智能

1463阅读

Hugging Face承诺免费提供1000万美元GPU计算资源，帮助小型开发者对抗大型AI公司

机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源，帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...

生成式AI 2024-05-17 人工智能

880阅读

首个中文原生DiT架构！腾讯混元文生图大模型全面开源，免费商用

中文 AI 社区迎来了一个好消息：与 Sora 同架构的开源文生图大模型来了！ 5 月 14 日，腾讯宣布旗下混元文生图大模型全面升级并全面开源，目前已在 Hugging Face 平台及 GitHub 上发布，包含模型权重、推理代码、模型算法等完整模型...

生成式AI 2024-05-15 人工智能

1126阅读

腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

今日，腾讯旗下引人注目的混元文生图大模型（混元DiT）宣布全面开源，这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布，包含完整的模型权重、推理代码和算法，面向全球的企业与个人开发者免费开放商用。腾讯混...

生成式AI 2024-05-14 人工智能

865阅读

IBM向开源社区发布Granite AI模型

IBM研究院最近宣布对其Granite编码基础模型开源，目标是实现高级AI工具大众化，进而推动跨行业间代码编写、维护与开发方式的全面变革。 IBM的Granite编码模型是什么水平? Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所...

生成式AI 2024-05-14 人工智能

844阅读

AI日报：干翻AI PC!苹果M4芯片首发；GoEnhance可生成粘土风格视频；DeepSeek-V2模型已在魔搭社区开源；苹果将添加AI图片擦除功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、干翻AI PC!苹果M4芯片首...

AIGC 2024-05-08 人工智能

904阅读

前特斯拉Optimus科学家跳槽HF，直接开源了一个机器人代码库

今年 3 月，以构建大型开源社区而闻名的 AI 初创公司 Hugging Face，挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot，引起了轰动。 Remi Cadene 在今年三月宣布结束其三年的 Tesl...

AIGC 2024-05-08 人工智能

956阅读

DeepSeek发布V2模型 GPT-4的性能白菜的价格

DeepSeek在开源MoE（Mixture of Experts）模型领域取得了重要进展，继今年1月份开源国内首个MoE模型后，现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现，与GPT-4等闭源模型竞争，同...

人工智能 2024-05-07 人工智能

1019阅读

斯坦福20亿参数端测多模态AI Agent模型大升级，手机汽车机器人都能用

全球首个超小型多模态AI Agent模型Octopus V3，来自斯坦福大学的NEXA AI团队，让Agent更加智能、快速、能耗及成本降低。今年四月份初，NEXA AI推出了备受瞩目的Octopus V2，该模型在函数调用性能上超越了GPT-4，减...

生成式AI 2024-05-07 人工智能

954阅读

微调大语言模型的七个步骤

译者 | 布加迪审校 | 重楼在最近一年半的时间里，自然语言处理（NLP）领域发生了显著的变化，这主要得益于OpenAI的GPT系列等大语言模型（LLM）的兴起。这些功能强大的模型已彻底改变了我们处理自然语言任务的方法，在翻译、情绪分析和文本自动...

人工智能 2024-05-07 人工智能

1337阅读

InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格

根据研究团队发表的预印本文章，InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架，能够在仅需10秒的时间内，从单个2D图像生成高质量的3D网格。该开源框架由多视图扩散模型和3D网格重建模型组成，通过使用不同角度...

生成式AI 2024-04-29 人工智能

780阅读

元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入

元象公司发布了首个多模态大型模型 XVERSE-V，并将其开源。这一模型支持任意宽高比的图像输入，并在多个权威评测中取得了优异的成绩。相比其他开源和闭源模型，XVERSE-V 在综合能力上表现出色。该模型采用了融合整体和局部信息的策略，使其在识别和分析...

AIGC 2024-04-28 人工智能

935阅读

苹果OpenAI合作，力争今年生成式AI登陆iPhone

OpenAI，Google，Anthropic 齐聚 Apple 下一代操作系统，WWDC24 上，iOS 的这块蛋糕究竟花落谁家？苹果在各国市场的 AI 领域，一直在业内寻求可靠并值得信赖的合作伙伴，以助于将各类生成式 AI 技术应用于 iPhone...

生成式AI 2024-04-28 人工智能

776阅读

AI音乐生成工具AI Jukebox 输入提示词选择曲风即可创作音乐

AI Jukebox 是一个利用人工智能技术的音乐生成工具，它通过Hugging Face平台提供服务。这个工具的设计理念在于简化音乐创作过程，使其变得更加智能化和用户友好。主要功能特点: 本地化模型加载:用户打开AI Jukebox的网页后，系统会自...

大数据 2024-04-23 人工智能

967阅读

AI日报：最强大模型Llama 3发布；Midjourney推社交新功能Room；超强AI视频自动剪辑工具Captions；手机上可以玩大模型了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、最强大模型Llama3 正式发...

AIGC 2024-04-20 人工智能

890阅读

Parler-TTS官网体验入口 AI语音生成工具免费使用地址

Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...

生成式AI 2024-04-11 人工智能

828阅读

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

继16亿轻量级Stable LM 2推出之后，12B参数的版本在今天亮相了。见状，不少网友纷纷喊话：干的漂亮！但，Stable Diffusion 3啥时候出啊？总得来说，Stable LM 2 12B参数更多，性能更强。 120亿参数版本包含了...

AIGC 2024-04-09 人工智能

810阅读

抱抱脸Open了OpenAI的秘密武器，网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF，被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline，罗列了25个关键实施细节。最终成功展示...

人工智能 2024-04-08 人工智能

831阅读

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。但该方法对于硬件成本要求仍然偏高且训练低效。 [NLP]理解大型语言模型高效微调(PEFT 因此， Alpac...

生成式AI 2024-04-08 人工智能

1118阅读

『SD』零基础快速搭建Stable Diffusion（Windows版）

theme: smartblue 点赞 + 关注 + 收藏 = 学会了本文简介本文介绍如何在 Windows 安装 Stable Diffusion WebUI，不需要懂代码，只要跟着本文一步步操作就能在你电脑用AI绘画了。只...

生成式AI 2024-04-04 人工智能

900阅读

【AI】在本地 Docker 环境中搭建使用 Hugging Face 托管的 Llama 模型

目录 Hugging Face 和 LLMs 简介利用 Docker 进行 ML 格式的类型请求 Llama 模型访问创建 Hugging Face 令牌设...

人工智能 2024-04-04 人工智能

1985阅读

元象发布 XVERSE-MoE-A4.2B 大模型可免费商用

元象发布了 XVERSE-MoE-A4.2B 大模型，采用混合专家模型架构，激活参数为4.2B，效果媲美13B 模型。该模型全开源，免费商用，可用于海量中小企业、研究者和开发者，推动低成本部署。该模型具有极致压缩和超凡性能两大优势，采用稀疏激活技术，效果...

生成式AI 2024-04-03 人工智能

921阅读

Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

还记得曾经从英伟达和贝索斯们手里融了 7360 万美元，誓要以AI驱动的透明搜索体验挑战谷歌，俘获大批社区支持者的Perplexity吗？如今，这家一直鄙视广告业务的硅谷明星AI公司，也准备开始卖广告了。作为一款会话式答案引擎，Perplexity将聊...

生成式AI 2024-04-03 人工智能

810阅读

性能强，成本低，运行快！最强开源大模型出现，超越ChatGPT和Llama！

大数据人工智能公司 Databricks放大招了！ 3月27日，该公司开源了通用大模型 DBRX，并声称该模型是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试： https://huj...

大数据 2024-04-02 人工智能

911阅读

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

Stability AI又有新动作！程序员又有危机了？ 3月26日，Stability AI推出了先进的代码语言模型Stable Code Instruct 3B，该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...

AIGC 2024-04-02 人工智能

944阅读

大佬出走后首个发布！Stability官宣代码模型Stable Code Instruct 3B

大佬出走后，第一个模型来了！就在今天，Stability AI官宣了新的代码模型Stable Code Instruct 3B。图片要说Stability也是真的很神奇，首席执行官辞职了，Stable Diffusion其中几位作者也离开了，投资公...

大数据 2024-03-29 人工智能

895阅读

AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画

Al Comic Factory是一个独特的项目，它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术，它们共同工作，根据用户提供的简单文本提示，自动创建出包含人物对话和场景描述的漫画。项目地址:https:/...

人工智能 2024-03-29 人工智能

1098阅读

Champ首发开源：人体视频生成新SOTA，5天斩获1k星，demo可玩

近日，由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星，在 Twitter 更是「火出圈」，吸引了大量博主二创，浏览量总量达到 300K。目前 Champ 已经开源...

AIGC 2024-03-29 人工智能

984阅读

元象大模型开源30款量化版本可更低成本部署

元象大模型开源了30款量化版本，支持 vLLM 和 llama.cpp 等主流框架的量化推理，无条件免费商用。对量化前后的模型能力、推理性能进行评估，以 XVERSE-13B-GPTQ-Int4量化版本为例，量化后模型权重压缩了72%，总吞吐提高了1.5...

大数据 2024-03-28 人工智能

811阅读

全球下载量最大的AI绘画大模型，更新Lightning极速版

几个月前，Stable Diffusion的大模型连续推出了两中提速技术，一个是官方的Turbo，一个是清华团队的LCM。都能在5-8步实现出图效果，把出图时间缩短了5-10倍。但是，除了Dreamshaper等少数几个大模型坚决跟进外，大部分大模...

生成式AI 2024-03-28 人工智能

1190阅读

到2033年，软件开发市场中的生成式 AI 规模将达2874亿美元

软件开发中的生成式人工智能市场预计将在2033年达到2874亿美元的惊人价值，展现出强劲的年复合增长率。这种显著增长突显了生成式人工智能在颠覆传统编码实践和加速软件开发过程中的日益重要作用。这一市场的扩展可归因于多种因素，包括对软件开发流程自动化的需求、高...

大数据 2024-03-26 人工智能

868阅读

使用GaLore在本地GPU进行高效的LLM调优

训练大型语言模型(llm ，即使是那些“只有”70亿个参数的模型，也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距，出现了低秩适应(LoRA 等参数高效方法，可以在消费级gpu上对大量模型进行微调。 G...

大数据 2024-03-25 人工智能

827阅读

llama factory 参数体系EvaluationArguments、DataArguments、FinetuningArguments、FreezeArguments、LoraArgument

项目地址 https://github.com/hiyouga/LLaMA-Factory 模型层参数这段代码是使用Python的dataclasses模块定义的一个数据类ModelArguments，用于管理和存储与模型微调相关的参数。这个类的设计是...

人工智能 2024-03-25 人工智能

1845阅读

AMD芯片使用Stable-Diffusion

AMD芯片使用Stable-Diffusion 由于A卡的Stable Diffusion工具的逐步完善，之前只能使用CPU跑，现在已支持AMD显卡进行AI绘图。下载官网链接：https://github.com/AUTOMATIC11...

大数据 2024-03-23 人工智能

1435阅读

Stable Video 3D震撼登场：单图生成无死角3D视频、模型权重开放

Stability AI 的大模型家族来了一位新成员。昨日，Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后，又为社区带来了 3D 视频生成大模型「Stable Vi...

人工智能 2024-03-20 人工智能

881阅读

本地开启stable diffusion web-ui体验AIGC文生图，图生图

目录准备工作主机电脑配置检查安装以下软件 Python Git 下载stable-diffusion-webui仓库根据显卡属性安装CUDA 2.下载stable diffusion的训练模型启动问题处理模型加载问题...

人工智能 2024-03-11 人工智能

1109阅读

Stable Diffusion ControlNet 插件预览错误解决方案

在使用Stable Diffusion ControlNet 插件时，进行预处理时报错，网络上暂无详细的解决方案，故写此文。本人软件版本：秋叶大佬整合包v4.6.1 ControlNet v1.1 Wei UI v1.6 ...

AIGC 2024-03-10 人工智能

1259阅读