huggingface 第3页 - AIGC资讯

字节跳动与南开联合开源 StoryDiffusion：一键生成漫画和视频故事的神器！完全免费！

大家好，我是程序员X小鹿，前互联网大厂程序员，自由职业2年+，也一名 AIGC 爱好者，持续分享更多前沿的「AI 工具」和「AI副业玩法」，欢迎一起交流~ 漫画，是多少人童年的回忆啊！记得小学时的同桌，经常支起课本，后面夹着一本漫画书在看。（哈哈...

AIGC 2024-08-21 人工智能

3575阅读

小白教程：Unsloth 打造属于自己的中文版Llama3

在定制化业务场景中，如果利用专属数据集，经过微调的大模型能够在多种任务上与GPT-4媲美，并支持本地部署，保护隐私，同时还能降低运算成本。最新推出的Llama3，作为当前性能最强的开源基础大模型，非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...

AIGC 2024-08-20 人工智能

3003阅读

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（...

人工智能 2024-08-20 人工智能

1162阅读

RWKV 发布中文小说模型，也擅长角色扮演！

大家好，RWKV 近期发布了 “RWKV-6-ChnNovel” 系列中文小说模型。相较于 RWKV-6 基底模型， RWKV-6-ChnNovel 中文小说模型在小说续写、小说扩写方面有非常好的效果。不仅如此，使用 RWKV 小说模型进行角色扮...

大数据 2024-08-20 人工智能

1947阅读

Ollama 部署本地大模型

目录前言下载安装下载模型接口调用环境变量其他模型前言工作需要，被指派对大模型做技术调研，又不想花钱买各大产商的key，所以就考虑部署本地的大模型，了解到 Ollama 开源框架，专为在本地机器上便捷部署和运行大型语言模...

人工智能 2024-08-20 人工智能

3905阅读

Mistral新旗舰决战Llama 3.1，最强开源Large 2 123B，扛鼎多语言编程全能王

【新智元导读】紧跟着Meta的重磅发布，Mistral Large 2也带着权重一起上新了，而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学和多语言等专业领域可与SOTA模型直接竞争，还支持单节点部署。昨天正式发布的Llama 3...

大数据 2024-08-19 人工智能

962阅读

从头开始微调Llama 3.1模型

在今天的科技专栏中，我们将深入探讨如何微调Llama 3.1模型，以使其更好地适应您的特定领域数据。微调大型语言模型（如Llama）的主要目的是为了在特定领域的数据上表现更好，从而生成更符合您需求的输出。以下是我们将要介绍的五个主要步骤：安装必要的软...

人工智能 2024-08-19 人工智能

1215阅读

微调大语言模型——LLaMa-Factory平台搭建（非常详细）零基础入门到精通，收藏这一篇就够了

我们采用 LLaMA-Factory平台进行微调语言模型，详细信息可以访问github主页（https://github.com/hiyouga/LLaMA-Factory）浏览。租赁显卡采用AutoDL作为云平台进行微调训练。Win系统采用终端...

人工智能 2024-08-19 人工智能

3321阅读

magic-animate_pytorch AIGC使图像中人物按照给定动作动起来

magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...

人工智能 2024-08-19 人工智能

1137阅读

【必收藏】史上最全 Meta Llama 3 相关网址资料

不要犹豫，先收藏再说，你肯定用得到！ ✅ 模型相关网址 Meta Llama 3 官网：https://llama.meta.com/llama3 Meta AI 网址：https://ai.meta.com/ 官网下载地址：https...

人工智能 2024-08-18 人工智能

1159阅读

ComfyUI系列教程(1)--Stable Diffusion基本原理

1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示，主要包括3个部分。其中1是CLIP图像文本对，将图...

大数据 2024-08-18 人工智能

1187阅读

ComfyUI报错解决：Aux集成预处理器

报错内容： Error occurred when executing AIO_Preprocessor: An error happened while trying to locate the file on the Hub and we can...

生成式AI 2024-08-18 人工智能

10590阅读

FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型

本文包含大量AI干货阅读完大约需要8分钟 1.引言在过去的两年中，第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位，一大批竞争对手（PixArt Alpha/Sigma/AuraFlow）试图效仿S...

大数据 2024-08-17 人工智能

2206阅读

LLama.cpp轻量化模型部署及量化

模型文件下载首先说一下用到的模型，这次用的是Llama3-8B-Chinese-Chat-GGUF-8bit模型，想要快速的从huggingface下载模型可以参考我的另一篇博文。从huggingface更快的下载模型 1.准备模型文件...

大数据 2024-08-17 人工智能

1812阅读

whisper+speaker.diarization.3.1实现根据说话人转文本

主要目的是复盘一下自己的第一个本地部署的代码。起因是老师布置的任务，想实现一个有关于教育场景的进行语音转录的模型。任务交给了本小白......好吧硬着头皮上，这篇博客也主要是记录自己的遇见的各种问题，以及对一些代码的改进。需要的小伙伴可以借鉴。一,语音...

AIGC 2024-08-17 人工智能

4403阅读

大模型文档神器：合合信息大模型加速器

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

生成式AI 2024-08-16 人工智能

1043阅读

EchoMimic：蚂蚁开源逼真数字人框架，表情口型更生动自然，本地部署包获取

EchoMimic：逼真的音频驱动人像动画 EchoMimic简介近日蚂蚁开源了一款名为：EchoMimic 数字人的框架。EchoMimic能够通过单独的音频文件和一张静态面部标志点的图像生成数字人像视频，也可以通过音频和选定的面部标志点的...

人工智能 2024-08-16 人工智能

1803阅读

LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式与 Llama 3.1)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/141028040 免责声明：本文来源于个人知识与公开资料，仅用于学术交...

生成式AI 2024-08-16 人工智能

4928阅读

【SD3】发布，送你3个ComfyUI工作流，轻松搞定AI绘画

这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3（简称SD3）的发布。SD3是一个多模态的 Diffusion Transformer 模型，其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。废话不多说，先给大家看看我使...

生成式AI 2024-08-15 人工智能

936阅读

超越sd3！比肩Midjourney-v6？AI绘画大模型FLUX1.0详细评测与本地部署方法（附安装文件）

FLUX.1模型是什么？ FLUX模型是一个开源的AI图像生成模型，由黑森林工作室研发。堪比sd3以及Midjourney-v6 背景/backdrop 黑森林工作室（Black Forest...

AIGC 2024-08-14 人工智能

1934阅读

【震撼来袭】Flux横空出世，吊打Midjourney，重塑AI艺术创作新格局！（附保姆级部署教程）

目录一、Flux介绍二、ComfyUI本地电脑部署 2.1、Flux模型下载 2.2、Clip模型下载 2.3、VAE模型 2.4、更新ComfyUI 2.5、导入工作流并进行测试 2.6、云服务部署并体验一、Flux介绍...

AIGC 2024-08-14 人工智能

2901阅读

Playground v2.5最新的文本到图像生成模型，官方宣称V2.5的模型优于 SDXL、Playground v2、PixArt-α、DALL-E 3 和 Midjourney

Playground v2.5介绍 Playground在去年发布Playground v2.0之后再次开源新的文生图模型Playground v2.5。新版本提升了图像的美学质量，增强了颜色和对比度、改进了多纵横比图像生成，可以生成各种比例图像以及人像...

人工智能 2024-08-13 人工智能

954阅读

开源模型应用落地-Meta-Llama-3.1-8B-Instruct与vllm-单机多卡-RTX 4090双卡（十四）

一、前言在应对业务访问量级提升的过程中，我们通过从单机单卡部署升级到单机多卡部署的方式，成功实现了VLLM模型的性能提升。在此过程中,我们遇到了一些问题和挑战，现在我将深入剖析这些经验教训，希望能够帮助大家快速上手部署可投入生产运行的环境。...

人工智能 2024-08-13 人工智能

2711阅读

微调stable diffusion

微调stable diffusion 一. 代码参考不在stable diffusion官方仓库中修改，而是到huggingface 中找到微调的文件微调stable diffusion，在其上面进行修改，二. 出现的问题： huggi...

人工智能 2024-08-13 人工智能

1409阅读

免费替代Midjourney！FLUX.1使用方法大全，支持ComfyUI

一：Flux.1概述 1.1 它是什么如果你想直接查看使用教程，MeoAI建议你直接跳到第四章：4种使用方法教程。 Flux.1是由Black Forest Labs开发的一款开源AI图像生成模型。这个模型继承了Stable Diffusion...

AIGC 2024-08-12 人工智能

2008阅读

AI绘画Stable Diffusion：超强InstantID插件—面部特征一致性风格保持与迁移，轻松搞定私人写真摄影，SDWebUI使用指南

大家好，我是设计师阿威最近经常有同学问到AI绘画Stable Diffusion 关于风格迁移IPA、Instant ID等安装和使用方法，内容虽基础但也属常用工具。因此，本文将核心介绍Instant ID 使用和墨幽人造人XL体验（这是一款可出图商用...

AIGC 2024-08-11 人工智能

2072阅读

超9000颗星，优于GPT-4V！国内开源多模态大模型

国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。据悉，MiniCPM-V2.6一共有80亿参数，在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...

人工智能 2024-08-11 人工智能

1127阅读

FLUX.1 最强AI绘画开源模型，最新本地部署教程

Stable Diffusion 作者之一 Robin Rombach 官宣创业，成立了新公司「Black Forest Labs」（黑森林实验室），并推出了最新文生图模型「FLUX.1」。Black Forest Labs 在 AI 开发方面拥有丰富的经...

人工智能 2024-08-11 人工智能

4805阅读

AI绘画Stable Diffusion：Tile HD低显存也能进行高分辨率扩图，增强细节保持构图完整

大家好，我是程序员晓晓今天给大家分享一下如何用AI绘画Stable Diffusion 进行高分辨率扩图使用。在SD中的 ControlNet Tile 模型能够在SD绘图过程中，能实现高分辨率下实现高清扩图，并且避免出现图像分身现象，以及可以调整...

大数据 2024-08-11 人工智能

2304阅读

LLaMA-Factory

文章目录一、关于 LLaMA-Factory 项目特色性能指标二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户：昇腾...

人工智能 2024-08-10 人工智能

2921阅读

FLUX.1最强AI绘画开源新模型，本地部署教程！

原文链接：FLUX.1最强AI绘画开源新模型，本地部署教程！ (chinaz.com Flux最近收到了很多模型爱好者的好评，出图质量超越SD3和MJ，许多人说Flux才是大家心目中的SD3，所以我也是非常好奇FLux的实力在这里把本地部署的过程分享给...

生成式AI 2024-08-09 人工智能

2845阅读

Llama 3.1：开源语言模型的新里程碑

大家好，最近AI领域的新闻接踵而至，让人目不暇接。就在7月（23号）晚上，Meta发布了Llama 3.1系列模型，包括8B、70B参数的版本，以及此前提到过的400B参数模型（实际上是405B）。根据Meta官方公布的数据，Llama 3.1 405...

AIGC 2024-08-08 人工智能

1130阅读

【AI绘画SD】ComfyUI-神级插件-一键高清放大，不改变原图，只做高清处理！

哈喽大家好，我是设计师阿威以前介绍的一些AI绘画放大插件都是相当于等比例重绘，这就导致了有些细节部分可能会改变，今天给大家分享一个ComfyUI的插件—ComfyUI-SUPIR，可以不改变原图，只做高清处理。下图是作者的案例效果 1、下载插件...

人工智能 2024-08-08 人工智能

2521阅读

llama_fastertransformer对话问答算法模型

LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进，并用于不同的模型，例如 PaLM。以下是与原始架构的主要区别：预归一化。为了提高...

人工智能 2024-08-08 人工智能

927阅读

[AI]如何在本地windows运行llama模型（CPU可运行）

一、为什么我们要在本地运行llama模型？想必大家已经体验过GPT， Claude，亦或是国内开源的GLM，这些强大的模型了，但是这些大模型虽然强大但有的要么收费，要么在本地部署对硬件要求高，要么就是本地部署的配置繁琐，对小白很不友好。...

生成式AI 2024-08-08 人工智能

1482阅读

Llama-2 vs. Llama-3：利用微型基准测试（井字游戏）评估大模型

编者按：如何更好地评估和比较不同版本的大语言模型？传统的学术基准测试固然重要，但往往难以全面反映模型在实际应用场景中的表现。在此背景下，本文作者别出心裁，通过让 Llama-2 和 Llama-3 模型进行井字游戏对决，为我们提供了一个新颖而有趣的模型评...

人工智能 2024-08-07 人工智能

879阅读

Stable Diffusion【应用篇】【艺术写真】：AI写真看过来，使用IP-Adapter-FaceId插件实现AI写真

目前换脸插件有很多，比较典型的有Roop,ReActor,IP-Adapter,InstantID，今天我们来看看使用IP-Adapter-FaceId插件实现AI写真的制作方法。一. IP-Adapter新模型的下载插件下载地址（文末扫码也可获取...

人工智能 2024-08-07 人工智能

1501阅读

llama-cpp-python

文章目录一、关于 llama-cpp-python 二、安装安装配置支持的后端 Windows 笔记 MacOS笔记升级和重新安装三、高级API 1、简单示例 2、从 Hugging Face Hub 中提取模型 3、聊天完成...

生成式AI 2024-08-06 人工智能

1699阅读

智谱AI刚刚把他们的Sora「清影」，正式开源了，我爱他们。

大半夜的，大洋对岸不卷，国内公司卷起来了。我真的想睡觉，真的。起因是我睡觉之前，在看Github的时候，无意间看到THUKEG这个号，更新了一个项目。 CogVideoX。网址在此:https://github.com/THUDM/CogVideo...

人工智能 2024-08-06 人工智能

1178阅读

李沐团队发布Higgs-Llama-3-70B，角色扮演专用模型

前言近年来，大语言模型（LLM）在各个领域都展现出强大的能力，尤其是其在对话、写作、代码生成等方面的应用越来越广泛。然而，想要让 LLM 真正地融入人类社会，扮演各种角色，还需要具备更强大的角色扮演能力。为了解决这一问题，李沐团队（Boson AI...

AIGC 2024-08-05 人工智能

1181阅读

AIGC工具：IPAdapter和ControlNet 指导控制生成工具

ControlNet强调对生成过程的直接控制，如通过线条、边缘、形状等信息；而IPAdapter侧重于风格迁移和内容的间接引导。 IPAdapter 它专注于通过迁移图片风格来生成新的图像内容。IPAdapter的强项在于能够将一张图片的风格迁移到另...

AIGC 2024-08-05 人工智能

1386阅读

比OpenAI的Whisper快50%，最新开源语音模型

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa，推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法，允许模型在每个推理步骤中预测多个t...

人工智能 2024-08-04 人工智能

1044阅读

Llama 3.1超大405B！AI巨浪再掀新高潮

前沿科技速递? Meta公司宣布开放的Llama 3.1系列模型，以其惊人的128K上下文长度、对八种语言的支持以及业界领先的405B开放式最前沿AI模型，瞬间吸引了全球科技界的目光。该系列模型不仅在通用知识、可控性、数学、工具使用和多语言翻译等方面表...

人工智能 2024-08-04 人工智能

907阅读

AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例

参考： https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus 代码环境安装： git clone https://github.com/Kwai-Kolors/Kolors cd Kolor...

人工智能 2024-08-04 人工智能

1110阅读

Llama 3 图片理解能力微调（XTuner+LLaVA 版）实践笔记

基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。环境、模型、数据准备 conda create -n llama3 python=3....

生成式AI 2024-08-03 人工智能

1055阅读

安装llama_factory

第一版： nvidia-smi git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory/ llamafactory-cli train examples/tr...

人工智能 2024-08-03 人工智能

972阅读

导出 Whisper 模型到 ONNX

前言在语音识别领域，Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型，导出为 ONNX 格式是一个有效的途径。ONNX（Open Neural Network Exchange）是一个开放格式...

AIGC 2024-08-03 人工智能

2052阅读

大模型llama.cp编译

一、大模型部署工具 llama.cpp 二、使用 llama.cpp 量化模型 2.1 克隆llama.cp 项目地址： https://github.com/ggerganov/llama.cpp 一般配置SSH KEY，然后采用SSH...

大数据 2024-08-01 人工智能

1372阅读

llama大模型提前停止策略，实现工具调用——以Llama3为例

在大模型的generate过程中为了实现工具调用功能，模型输出到了指定的token需要执行工具的时候，需要模型的generate停止。model.generate( 的参考链接：https://github.com/huggingface/transfor...

生成式AI 2024-08-01 人工智能

1940阅读

LLama-Factory使用教程

本文是github项目llama-factory的使用教程注意，最新的llama-factory的github中训练模型中，涉及到本文中的操作全部使用了.yaml配置。新的.yaml的方式很简洁但不太直观，本质上是一样的。新的readme中的.yam...

人工智能 2024-08-01 人工智能

2607阅读