hugging face 第3页

欢迎 Llama 3：Meta 的新一代开源大语言模型_meta llama guard 2

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

大数据 2024-07-20 人工智能

1332阅读

Llama - 微调

本文翻译整理自：https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...

AIGC 2024-07-19 人工智能

953阅读

微软 Phi-3.1 Mini (3.8B)：刚刚进行了疯狂升级（击败 Llama-3 和 Qwen2）

微软 Phi-3.1 Mini (3.8B ：刚刚进行了疯狂升级（击败 Llama-3 和 Qwen2）原创 Aitrainee AI进修生 2024年07月06日 15:16 湖南 Aitrainee | 公众号：AI进修生 ?这...

人工智能 2024-07-18 人工智能

996阅读

Stable Diffusion 使用

目录背景最简单用法进阶用法高手用法 safetensor 一、概述二、主要特点背景 Stable Diffusion 开源后，确实比较火，上次介绍了下 Stable Diffusion 最简单的concept。今天继续介...

生成式AI 2024-07-17 人工智能

1620阅读

人人都能用的「AI 作画」，如何把 Stable Diffusion 装进电脑？

我从小特别羡慕会画画的伙伴，他们能绘出心中所想，而本人水平最高的肖像画是丁老头。接触 Stable Diffusion 后，我脱胎换骨，给自己贴上了「会画画」的新标签。丁老头进化旅程 Stable Diffusion 是以文本生成图像的 AI 工...

人工智能 2024-07-17 人工智能

1249阅读

AI日报：阿里云发布音频模型Qwen2-Audio；字节将推类sora模型；AI眼里13.11＞13.8

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Qwen2-Audio：千问系...

生成式AI 2024-07-17 人工智能

828阅读

LLaMA原理与代码实例讲解

LLaMA原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...

AIGC 2024-07-17 人工智能

1111阅读

Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA

引言经过几个月的期待，阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃，拥有尖端的进步，有可能将其定位为 Meta 著名的最佳替代品骆驼3 模型。在本次技术深入探讨中，我...

AIGC 2024-07-16 人工智能

1455阅读

AIGC文生图lora微调训练案例；SD-Train界面训练stable Diffusion lora模型

lora仓库（1000多个lora微调模型分享）： https://lorastudio.co/models 1、命令代码方式：文生图lora微调训练案例主要用huggingface相关包：peft、accelerate、diffusers 参...

大数据 2024-07-15 人工智能

995阅读

Llama-factory源码详细解读

微调采用逐行调试的方法，细节来看SFT代码 AutoModelForCausalLM...

AIGC 2024-07-11 人工智能

1691阅读

Meta Llama 3 来啦！性能算力究竟如何？

新一代大语言模型 Meta Llama 3 横空出世！前言就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...

大数据 2024-07-09 人工智能

892阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

856阅读

腾讯混元文生图开源模型推出小显存版本，仅需6G显存即可运行

7月4日，腾讯混元文生图大模型（混元DiT）宣布开源小显存版本，仅需6G显存即可运行，对使用个人电脑本地部署的开发者十分友好，该版本与LoRA、ControlNet等插件，都已适配至Diffusers库；并新增对Kohya图形化界面的支持，让开发者可以低门...

大数据 2024-07-05 人工智能

837阅读

基于Python和TensorFlow实现BERT模型应用

本文分享自华为云社区《使用Python实现深度学习模型：BERT模型教程》，作者： Echo_Wish。 BERT（Bidirectional Encoder Representations from Transformers）是Google提出的一种用...

AIGC 2024-07-02 人工智能

1009阅读

OpenAI“断供”，谁才是最大赢家

“宫斗”之后，OpenAI又出“幺蛾子”了。 2024年7月9日起，OpenAI将采取额外措施严控API调用，如在中国大陆、中国香港、中国澳门等不支持地区检测到使用情况，轻则切断流量、重则封禁账号。这意味着，国内相关开发将面临“断供”。 AI应用、行业模...

人工智能 2024-07-01 人工智能

935阅读

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南引言在大型语言模型（LLM）的领域中，Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能，迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势，并提供详细的实...

AIGC 2024-06-30 人工智能

896阅读

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将...

生成式AI 2024-06-30 人工智能

924阅读

Google 深夜突袭，Gemma 2 狂卷 Llama 3

整理 | Echo Tang 出品丨AI 科技大本营（ID：rgznai100） Google 挤牙膏式的创新真是令人爱恨交织。早在一个多月前的 Google I/O 上，Google 便官宣将会在未来几周内推出开源模型 Gemma 的第二代 Ge...

大数据 2024-06-30 人工智能

962阅读

使用 llama.cpp 在本地部署 AI 大模型的一次尝试

对于刚刚落下帷幕的2023年，人们曾经给予其高度评价——AIGC元年。随着 ChatGPT 的火爆出圈，大语言模型、AI 生成内容、多模态、提示词、量化…等等名词开始相继频频出现在人们的视野当中，而在这场足以引发第四次工业革命的技术浪潮里，人们对于人工智能...

大数据 2024-06-29 人工智能

1053阅读

AI日报：GPTs靠边站！Claude推全新功能Projects；Figma大更新！AI设计几秒成稿；阿里Qwen-2稳夺全球开源大模型榜首

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Claude推类GPTs功能P...

AIGC 2024-06-27 人工智能

903阅读

遥遥领先！阿里Qwen-2成全球开源大模型排行榜第一

快科技6月27日消息，全球知名的开源平台Hugging Face的联合创始人兼首席执行官Clem在社交平台激动宣布，阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。为了打造一个更为公正和准确的开源大模型排名，Clem及其团队利...

人工智能 2024-06-27 人工智能

827阅读

半年估值数亿，1000亿美元超级赛道跑出“AI猛兽”

去年，谷歌发布了一份忧心忡忡的内部文件:“虽然谷歌与OpenAI（在大模型上）你追我赶，但双方都没有真正的护城河，因为第三股力量正在崛起——开源社区才是谷歌和OpenAI最大的敌人。” 谷歌的担忧正逐渐变成了现实。马斯克的开源大模型公司xAI近期完成60...

AIGC 2024-06-27 人工智能

934阅读

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...

人工智能 2024-06-26 人工智能

1421阅读

腾讯混元文生图大模型开源训练代码，发布LoRA与ControlNet插件

6月21日，腾讯混元文生图大模型（以下简称为混元 DiT 模型）宣布全面开源训练代码，同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。这意味着，全球的企业与个人开发者、创作者们，都可以基于混元 DiT 训练代...

生成式AI 2024-06-24 人工智能

856阅读

Stable Diffusion 3 如何下载安装使用及性能优化

Stable Diffusion 3 Stable Diffusion 3（SD3），Stability AI最新推出的Stable Diffusion模型系列，现在可以在Hugging Face Hub上使用，并且可以与Diffusers一起使用。...

AIGC 2024-06-24 人工智能

1319阅读

面壁智能与华为云合作开启大模型端云协同解决方案

6月22日，面壁智能与华为云达成正式合作，双方将开启大模型端云协同解决方案正式合作。在消费电子终端端侧，大模型将能更好融入手机、PC、智能家居、穿戴式设备等，大模型也能与前沿的电动汽车、具身智能等结合，以及在传统的金融、法律、政务服务上，也能发挥效用。...

AIGC 2024-06-23 人工智能

928阅读

CSDN首发！Stable Diffusion 3 Medium 开源，AI 生图格局迎来巨变

就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20 亿参数大小，笔记本...

生成式AI 2024-06-20 人工智能

879阅读

AI日报：新王诞生！Runway重磅发布Gen-3 Alpha；Luma AI发布Extend功能；DeepSeek又开源了一个模型；ElevenLabs可为视频自动配音

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、AI视频王者回归！Runway...

大数据 2024-06-18 人工智能

1798阅读

AI从来不是少数人的无限游戏

力大飞砖卷研发，到向下竞低卷价格，全球视野下的大模型与生成式AI已然走过创新扩散的兴趣阶段，行至社会评估其创新可行性的卡点。正如红杉资本在“Generative AI’s Act Two”（《生成式AI的第二幕》）中指出的，目前生成式AI应用的最大问题，...

人工智能 2024-06-18 人工智能

842阅读

Python - 深度学习系列30 - 使用LLaMA-Factory微调模型

说明最实用的一种利用大语言模型的方式是进行微调。预训练模型与我们的使用场景一定会存在一些差异，而我们又不可能重头训练。微调的原理并不复杂，载入模型，灌新的数据，然后运行再训练，保留checkpoints。但是不同项目的代码真的不太一样，每一个都要...

AIGC 2024-06-17 人工智能

1496阅读

AIGC从入门到实战：落霞与孤鹜齐飞：AIGC 汹涌而来

作者：禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...

人工智能 2024-06-17 人工智能

968阅读

五一超级课堂---Llama3-Tutorial（Llama 3 超级课堂）---第三节llama 3图片理解能力微调（xtuner+llava版）

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频： https://space.bilibili.com/3546636263360696/channel/collectiondetail?...

大数据 2024-06-16 人工智能

1084阅读

【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品： Llama 3。或者更准确地说，该公司首次发布了其新的 Llama 3 系列中的两个模型，其余模型将在未来某个不确定的日期发布。 Meta 称，与上一代 Llama 型号 Llama 2...

人工智能 2024-06-14 人工智能

941阅读

Llama 3 CPU推理优化指南

备受期待的 Meta 第三代 Llama 现已发布，我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中，我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟，但首先，让我们讨论一下 Meta Lla...

生成式AI 2024-06-14 人工智能

1038阅读

【Stable Diffusion】：SDXL1.0大模型的发布给SD带来全新的使用体验

1.Stable Diffusion XL模型是什么？ SDXL是stabilityai公司推出的最新的图像大模型，可以使用stable diffusion生成Ai图像，SDXL模型与之前的Stable Diffusion v1-v2.1模型相比，使用...

AIGC 2024-06-13 人工智能

1240阅读

LLM 评估汇总：真的吊打 LLaMA-3，媲美 GPT-4 吗？

一、背景在过去的一年多里，国内在大模型领域的发展异常迅速，涌现出上百个大模型，许多模型已经迭代了多个版本，并且各种指标不断刷新。与此同时，我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么，国内的大模型真的已...

大数据 2024-06-12 人工智能

1782阅读

Karpathy 4小时AI大课上线，小白看了都会从零构建GPT-2

距上次Karpathy AI大课更新之后，又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。大神Karpathy新一期AI大课又上线了。这一次，他讲的内容是——从头开始实现124M大小的GPT-2模型...

生成式AI 2024-06-12 人工智能

826阅读

AIGC从入门到实战：AI 辅助写作：基于 ChatGPT 的自动创作和文本扩展

1. Background Introduction In the rapidly evolving digital age, artificial intelligence (AI has become an indispensable tool i...

生成式AI 2024-06-09 人工智能

940阅读

【AIGC调研系列】llama3微调具体案例

Llama3的微调可以通过多种方式进行，具体案例包括：使用XTuner进行微调，尝试让Llama3具有"它是SmartFlowAI打造的人工智能助手"的自我认知。这涉及到准备自我认知训练数据集，并通过脚本生成数据[2][8]。利用Unsloth和G...

人工智能 2024-06-09 人工智能

1175阅读

AI | LLaMA-Factory 一个好用的微调工具

‘’ LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问，使用体验友好。此外，它还提供了由 Hiyouga 提供的 Hugging Face 空间，可...

AIGC 2024-06-08 人工智能

1464阅读

Stable Diffusion的本地部署、训练和使用

1.环境信息显卡：NVIDIA GeForce RTX 3060 Laptop GPU 系统：Windows 11 CUDA版本：11.6 Python.exe版本：3.10.6 GPU挂载运行 2.实验内容 2.1 本地部署...

大数据 2024-06-07 人工智能

1022阅读

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。但是，随着模型越来越大，RLHF 通常需要维持多个模型...

生成式AI 2024-06-06 人工智能

790阅读

腾讯混元发布开源加速库，生图时间缩短75%

6月6日，腾讯发布针对腾讯混元文生图开源大模型（以下简称为混元DiT模型）的加速库，让推理效率大幅提升，生图时间缩短75%。混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面，使用腾讯混元文生图模型能力。同时，混元DiT模型已经...

大数据 2024-06-06 人工智能

908阅读

腾讯混元发布开源文生图大模型混元DiT加速库生图时间缩短75%

腾讯混元发布了针对开源文生图大模型混元 DiT 的加速库，可将推理时间缩短75%，生图时间大幅缩短。混元 DiT 模型也已部署至 Hugging Face Diffusers 通用模型库，用户可通过三行代码调用模型，无需下载原始代码。通过知识蒸馏和 T...

大数据 2024-06-06 人工智能

775阅读

Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

Stability AI 今天发布了 Stable Audio Open1.0，这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名，但这只是该公司产品组合的一部分。该公司在2023年首次推出了 St...

AIGC 2024-06-06 人工智能

1085阅读

【保姆级教程】Linux上部署Stable Diffusion WebUI和LoRA训练，拥有你的专属图片生成模型

0 写在前面 Stable Diffusion 是当前最火热的图像生成模型之一，目前已经广泛应用于艺术创作、游戏开发、设计模拟等领域，因其开源生态和易于使用而受到创作者的广泛关注，相比 Midjourney 而言，其最大的优势是完全免费，且拥有庞大的社...

人工智能 2024-06-05 人工智能

1244阅读

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低

在大模型技术迅速发展的背景下，昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色，而且还大幅降低了推理成本，为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...

AIGC 2024-06-04 人工智能

973阅读

llama.cpp 转化 huggingface 模型失败解决路径

问题： ./main -m ./models/book_q4_K_M -n 128 报错： terminate called after throwing an instance of 'std::out_of_range' what( :...

AIGC 2024-06-03 人工智能

1948阅读

ollama部署体验Chinese-LLaMA-Alpaca-3大模型项目

前言书接上回：快速评测已有的中文llama-3开源模型（4月25日更新）_llama3-chinese-novel-CSDN博客虽然Llama-3大模型发布以后，中文适配模型也出了一大堆，但效果都不尽人意，参差不齐。近期，Chinese-LLaMA...

AIGC 2024-06-03 人工智能

1471阅读

斯坦福爆火Llama3-V竟抄袭国内开源项目，作者火速删库

在 GPT-4o 出世后，Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5，甚至在某些方面超越了 GPT-4。这次就要闷声...

AIGC 2024-06-03 人工智能

846阅读