transformer 第6页 - AIGC资讯

Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决

文章目录 Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决描述错误描述：找不到模块imageio.v3 解决：参考地址其他文章推荐：专栏：人工智能基础知识点专栏：大语言模型LL...

生成式AI 2024-07-18 人工智能

951阅读

大模型学习笔记3【大模型】LLaMA学习笔记

文章目录学习内容 LLaMA LLaMA模型结构 LLaMA下载和使用好用的开源项目[Chinese-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca Chinese-Alpaca...

人工智能 2024-07-18 人工智能

680阅读

天才程序员周弈帆 | Stable Diffusion 解读（四）：Diffusers实现源码解读

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（四）：Diffusers实现源码解读接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读（三）：原版实现源...

AIGC 2024-07-17 人工智能

1806阅读

LLaMA原理与代码实例讲解

LLaMA原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...

AIGC 2024-07-17 人工智能

772阅读

AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例

AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例学习前言什么是ComfyUI 相关地址汇总 ComfyUI EasyAnimateV3 节点例子复杂例子-以EasyAnimateV3为例节点文...

生成式AI 2024-07-17 人工智能

952阅读

“全网最全”LLM推理框架集结营 - 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国内外基于大语言模型...

大数据 2024-07-17 人工智能

1568阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（七）使用 LoRA 微调 LLM 的实用技巧

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-07-16 人工智能

1030阅读

基于MindSpore实现BERT对话情绪识别

本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》，作者：JeffDing。模型简介 BERT全称是来自变换器的双向编码器表征量（Bidirectional Encoder...

AIGC 2024-07-16 人工智能

567阅读

Java集成stable diffusion 的方法

在Java中直接集成Stable Diffusion模型（一个用于文本到图像生成的深度学习模型，通常基于PyTorch或TensorFlow）是非常具有挑战性的，因为Java本身并不直接支持深度学习模型的运行。不过，我们可以通过JNI（Java Nativ...

大数据 2024-07-16 人工智能

555阅读

AI日报：谷歌Gemini将发五个新功能；百度推文小言AI数字人社交APP；OpenAI草莓计划揭秘；亚马逊上线Rufus AI购物助手

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、谷歌Gemini即将发布五个新...

生成式AI 2024-07-15 人工智能

591阅读

LLaMA-Factory在华为显卡上的实验记录

如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。这里用目前我最常用的两个模型举例子一个是智谱的glm4-9B模型 _regi...

生成式AI 2024-07-15 人工智能

1078阅读

【人工智能】一文看懂 LLaMA 2：原理、模型与训练

LLaMA 2（Large Language Model for AI Modeling and Assistance）是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...

大数据 2024-07-15 人工智能

704阅读

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他...

人工智能 2024-07-15 人工智能

593阅读

How Stable Diffusion was built: Tips and tricks to train large AI models

How's everyone doing? Yay. Thank you for being your last session for us today. I'm sure you're waiting for your beers right now....

大数据 2024-07-14 人工智能

578阅读

Llama 3 基于知识库应用实践（一）

一、概述 Llama 3 是Meta最新推出的开源大语言模型，其8B和13B参数的模型的性能与之前的Llama 2相比实现了质的飞跃。以下是官方给出的模型性能评测对比结果（引自：https://ai.meta.com/blog/meta-llama-3/...

生成式AI 2024-07-14 人工智能

592阅读

Stable Diffusion 3架构解析

在台湾举办的台北国际电脑展上，Stability AI CTO 兼联合 CEO Christian Laforte 与 AMD CEO 苏姿丰一起宣布文本到图像生成模型 Stable Diffusion 3 将于 6 月 12 日开源。一、扩散模型的...

人工智能 2024-07-14 人工智能

863阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

583阅读

AIGC从入门到实战：ChatGPT 说自己能做什么？

背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）技术也取得了显著的进展。近年来，生成对抗网络（GAN）和序列模型（Seq2Seq）等技术的发展，使得机器学习和深度学习在语言模型方面取得了突破性进展。其中，OpenAI的ChatGPT模型是目前...

AIGC 2024-07-13 人工智能

519阅读

【Llama 2的使用方法】

Llama 2是Meta AI（Facebook的母公司Meta的AI部门）开发并开源的大型语言模型系列之一。Llama 2是在其前身Llama模型的基础上进行改进和扩展的，旨在提供更强大的自然语言处理能力和更广泛的应用场景。以下是Llama 2的一...

AIGC 2024-07-13 人工智能

567阅读

python 调用 llama

参考： https://blog.51cto.com/u_16175437/9317548 方法一：要在Python中调用Llama.ai模型来生成回答，你可以使用transformers库，它提供了调用不同的预训练模型的接口。以下是一个简单的例子，展...

大数据 2024-07-13 人工智能

648阅读

深入了解语音识别：Distil-Whisper

Distil-Whisper模型概述 1.1 Distil-Whisper的背景与意义随着语音识别技术的不断发展，模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中，对模型的效率和性能提出了更高的要求。Dist...

生成式AI 2024-07-12 人工智能

1529阅读

调研分析：LLama大模型

1. 引言在当前的自然语言处理（NLP）研究中，大规模预训练模型如BERT、GPT-3和RoBERTa已经展示了其卓越的性能和广泛的应用。随着技术的发展，新的模型不断涌现，推动了NLP领域的持续进步。本文将聚焦于LLama模型，分析其结构、预训练策略、优...

AIGC 2024-07-12 人工智能

797阅读

如何使用Whisper语音识别模型

Whisper 是一个通用语音识别模型，由 OpenAI 开发。它可以识别多种语言的语音，并将其转换为文本。Whisper 模型采用了深度学习技术，具有高准确性和鲁棒性。 1、技术原理及架构 Whisper 的工作原理：音频被分割成...

大数据 2024-07-12 人工智能

1347阅读

Stable Diffusion / huggingface 相关配置问题汇总

目录 1 `OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'.` 报错解决方法方法1——手动下载方法2——自动下载其他方法（待研究） 2 `hug...

AIGC 2024-07-12 人工智能

1768阅读

NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读

自然语言处理（NLP）领域的多个大型语言模型（如GPT-3、ChatGPT、T5、PaLM、LLaMA和GLM）在结构和功能上有显著差异。以下是对这些模型的原理和差异的深入分析： GPT-3 (Generative Pre-trained Transf...

AIGC 2024-07-12 人工智能

958阅读

Llama-factory源码详细解读

微调采用逐行调试的方法，细节来看SFT代码 AutoModelForCausalLM...

AIGC 2024-07-11 人工智能

1119阅读

国产大模型第一梯队玩家，为什么pick了CPU？

AI一天，人间一年。现在不论是大模型本身，亦或是AI应用的更新速度简直令人直呼跟不上—— Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般，虽然AIGC目前还处于起步阶段，但市场规模已初具雏形:...

生成式AI 2024-07-11 人工智能

609阅读

[大模型]Llama-3-8B-Instruct FastApi 部署调用

环境准备在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器，如下图所示镜像选择 PyTorch-->2.1.0-->3.10(ubuntu22.04 -->12.1。接下来打开刚刚租用服务器的 JupyterL...

AIGC 2024-07-11 人工智能

663阅读

一文看懂LLaMA 2：原理、模型与训练

引言人工智能领域的快速发展，带来了许多强大的语言模型。LLaMA 2 是其中之一，以其出色的性能和灵活的应用能力，吸引了广泛关注。这篇文章将带你深入了解 LLaMA 2 的原理、模型架构和训练过程，帮助你全面掌握这一前沿技术。什么是LLaMA...

AIGC 2024-07-10 人工智能

808阅读

LLaMA-Adapter：零初始注意机制的语言模型高效微调

23年6月来自上海AI实验室，香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...

生成式AI 2024-07-10 人工智能

743阅读

【Qwen2部署实战】llama.cpp：一键部署高效运行Qwen2-7B模型

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-07-10 人工智能

1043阅读

AIGC专栏12——EasyAnimateV3发布详解支持图&文生视频最大支持960x960x144帧视频生成

AIGC专栏12——EasyAnimateV3发布详解支持图&文生视频最大支持960x960x144帧视频生成学习前言项目特点生成效果相关地址汇总项目主页 Huggingface体验地址 Modelscope体验地址源...

AIGC 2024-07-09 人工智能

672阅读

【Python】科研代码学习：十六 Model架构的代码细节，附架构图：Llama 为例（v4.28.0）

【Python】科研代码学习：十六 Model与网络架构的代码细节：Llama 为例（v4.28.0）前言导入依赖 `LlamaRMSNorm`：改进的层正则化 `LlamaRotaryEmbedding`：旋转式位置编码 `Llama...

大数据 2024-07-08 人工智能

1094阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1201阅读

AI绘画模型，现在发展到哪一步？

随着人工智能技术的飞速发展，AI绘画已成为艺术创作领域的一股新势力。通过模拟人类的绘画技巧和风格，AI绘画模型能够生成令人惊叹的艺术作品。本文将介绍现阶段主流的AI绘画模型，并重点突出MJ绘画模型的优势与特点。一、AI绘画模型概述 AI绘画...

大数据 2024-07-07 人工智能

624阅读

Meta Llama 3 残差结构

Meta Llama 3 残差结构 flyfish 在Transformer架构中，残差结构（Residual Connections）是一个关键组件，它在模型的性能和训练稳定性上起到了重要作用。残差结构最早由He et al.在ResNet中提出，并...

生成式AI 2024-07-07 人工智能

780阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

806阅读

使用LLaMA-Factory微调Llama3大模型

一、基础模型下载本文的背景是微调一个基于Llama3的中文版模型Llama3-8B-Chinese-Chat，用于中文指定领域的问答下游任务 1、HuggingFace官网直接下载官网地址：https://huggingface.co/mo...

人工智能 2024-07-05 人工智能

969阅读

结合RNN与Transformer双重优点，深度解析大语言模型RWKV

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》，作者：Freedom123。一、前言 Transformer模型作为一种革命性的神经网络架构，于2017年由Vaswani等人提出，并在诸多任务中...

人工智能 2024-07-05 人工智能

781阅读

一文看懂LLaMA 2：大型多模态模型的新里程碑

一文看懂LLaMA 2：大型多模态模型的新里程碑 LLaMA 2是OpenAI继GPT-3之后推出的又一重磅模型，它不仅在文本生成方面有所突破，而且在图像处理和语音识别等领域也展现出了令人印象深刻的能力。本文将全面介绍LLaMA 2的背景、技术细节、应用...

大数据 2024-07-05 人工智能

565阅读

中国生成式AI专利38,000个，是美国6倍、超过全球总和！

7月4日，联合国（United Nations）在官网发布了一份深度调查报告:2014—2023年期间，中国在生成式AI(AIGC 申请的专利数量为38210个，是排名第二美国的6倍领先全球。全球申请生成式AI专利前10位分别是:腾讯、平安保险、百度、中...

AIGC 2024-07-05 人工智能

520阅读

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

人工智能 2024-07-04 人工智能

704阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

850阅读

开源大模型 Llama 3

开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练，使用了超...

大数据 2024-07-04 人工智能

676阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

695阅读

【AI原理解析】— 文心一言模型

目录模型架构 Transformer模型编码器-解码器结构训练过程预训练微调关键技术知识增强上下文感知个性化生成推理与生成应用场景问答系统文本生成对话系统模型架构 Trans...

人工智能 2024-07-04 人工智能

866阅读

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了? 一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情: 这场表演背后的...

生成式AI 2024-07-04 人工智能

790阅读

开源之光 Stable Diffusion 3 技术论文全解：公式占一半，实验很充分！

文章链接：https://arxiv.org/pdf/2403.03206 扩散模型通过反转数据到噪声的正向路径来从噪声中创建数据，并已成为处理高维感知数据（如图像和视频）的强大生成建模技术。Rectified flow是一种最近提出的生成模型形式，它将...

大数据 2024-07-04 人工智能

1051阅读

Stable Diffusion 3 文本生成图像在线体验原理分析

前言本文分享使用Stable Diffusion 3实现文本生成图像，可以通过在线网页中免费使用的，也有API等方式访问。同时结合论文和开源代码进行分析，理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先...

大数据 2024-07-04 人工智能

711阅读

欢迎 Stable Diffusion 3 加入 Diffusers

作为 Stability AI 的 Stable Diffusion 家族最新的模型，Stable Diffusion 3(SD3 现已登陆 Hugging Face Hub，并且可用在 ? Diffusers 中使用了。 Stable Dif...

大数据 2024-07-04 人工智能

547阅读