transformer 第2页 - AIGC资讯

使用SageMaker对Whisper模型进行微调及部署教程

使用SageMaker对Whisper模型进行微调及部署教程 amazon-sagemaker-finetune-deploy-whisper-huggingface This is a demo project showing how to fi...

AIGC 2024-09-23 人工智能

1051阅读

Black Forest Labs 的 Flux——文本转图像模型的下一个飞跃，它比 Midjourney 更好吗？

一、前言 Black Forest Labs是开创性稳定扩散模型的团队，现已发布Flux——一套最先进的模型，有望重新定义 AI 生成图像的功能。但 Flux 是否真正代表了该领域的飞跃？它与 Midjourney 等行业领导者相比如何？让我们深入...

大数据 2024-09-23 人工智能

2523阅读

Lawyer LLaMA(中文法律大模型本地部署)

Lawyer LLaMA(中文法律大模型本地部署 1.模型选择（lawyer-llama-13b-v2） 2.运行环境 1.建议使用Python 3.8及以上版本。 2.主要依赖库如下： transformers >=...

人工智能 2024-09-23 人工智能

1163阅读

Lag-Llama：时间序列大模型开源了！

之前我们介绍过TimeGPT，它是第一个时间序列的大模型，具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究，但是它是一个专有模型，只能通过API访问。如今，终于出现一个用于时间序列预测的开源大模型：Lag-Llama...

人工智能 2024-09-23 人工智能

1117阅读

LLM入门——在Colab上部署Llama2

LLM入门——在Colab上部署Llama2 2024/07/09 本文属于“LLM入门”系列，该系列是笔者自学LLM时记录的一些实践记录与心得，可能存在错误或过时的部分，请读者谅解。对于LLM入门学者，我推荐从Large Language...

大数据 2024-09-23 人工智能

1067阅读

AIGC：让生成式AI成为自己的外脑_aigc 让生成式ai成为自己的外脑 pdf 下载

二、AIGC：内容创作的新革命 AIGC是生成式AI在内容创作领域的重要应用。它利用深度学习模型，从海量数据中学习并生成各种形式的内容，包括文本、图像、音频和视频等。AIGC的出现，极大地丰富了内容创作的手段和形式，为创作者提供了更多的灵感和可能性。...

大数据 2024-09-22 人工智能

883阅读

视频模型CogVideoX开源，全民AIGC时代到来了吗？

大家好，我是飞哥！之前不少人都以为大模型只能处理文本。但自从今年 2 月 16 日 OpenAI 在其官网发布了基于文字生成视频的模型 Sora 后，让所有人都认识到了即使对对于复杂的视频信息，大模型仍然是具备对其进行理解，以及进行 AIGC...

生成式AI 2024-09-22 人工智能

1122阅读

24全网最全stable diffusion模型讲解！快来！！新手必收藏！！

前言手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出...

生成式AI 2024-09-21 人工智能

911阅读

详聊LLaMa技术细节：LLaMA大模型是如何炼成的？

本文介绍来自 Meta AI 的 LLaMa 模型，类似于 OPT，也是一种完全开源的大语言模型。LLaMa 的参数量级从 7B 到 65B 大小不等，是在数万亿个 token 上面训练得到。值得一提的是，LLaMa 虽然只使用公共的数据集，依然取得了强悍...

AIGC 2024-09-21 人工智能

1437阅读

LLAMA-FACTORY：100+语言模型的统一高效微调框架

24年3月来自北航和北大的论文“LLAMA-FACTORY: Unified Efficient Fine-Tuning of 100+ Language Models”。高效的微调对于将大语言模型 (LLM 适应下游任务至关重要。然而，在不同模型上...

人工智能 2024-09-21 人工智能

1747阅读

【HuggingFace Transformers】LlamaModel源码解析

LlamaModel源码解析 1. LlamaModel 介绍 2. LlamaModel类源码解析 3. 4维因果注意力掩码生成 1. LlamaModel 介绍 LlamaModel 是一个基于 Transformer 架构...

AIGC 2024-09-21 人工智能

2090阅读

PyTorch-LLaMA 项目使用教程

PyTorch-LLaMA 项目使用教程 pytorch-llama LLaMA 2 implemented from scratch in PyTorch 项目地址: https://gitcode.com/gh_mirrors/py/pyt...

生成式AI 2024-09-21 人工智能

910阅读

AIGC专栏15——CogVideoX-Fun详解支持图&文生视频拓展CogVideoX到256～1024任意分辨率生成

AIGC专栏15——CogVideoX-Fun详解支持图&文生视频拓展CogVideoX到256～1024任意分辨率生成学习前言项目特点生成效果相关地址汇总源码下载地址 CogVideoX-Fun详解技术储备 Dif...

大数据 2024-09-20 人工智能

1441阅读

LongLLaMA 项目使用教程

LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...

AIGC 2024-09-20 人工智能

855阅读

如何微调 Llama 3 进行序列分类？

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模...

生成式AI 2024-09-20 人工智能

924阅读

手把手带你了解和实践扩充 LLaMA 大语言模型的 tokenizer 模型（实现中文token过程）

目前，大语言模型呈爆发式的增长，其中，基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好，接下来本文将讲解如何去扩充vocab里面的词以对中文进行token化。一般的，目前比较主流的是使用sentencepiece训练中...

生成式AI 2024-09-19 人工智能

1464阅读

用Transformers库运行Llama-3.1-Minitron-4B

我的笔记本来自8年前的旧时代，勉强能运行8B模型，于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型，通过结构化权重剪枝和知识提炼技术优化而成的...

AIGC 2024-09-19 人工智能

1092阅读

AIGC实战——多模态模型Flamingo

AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用小结系列链接 0. 前言我们已经学习了文...

AIGC 2024-09-18 人工智能

1313阅读

速通LLaMA1：《LLaMA: Open and Efficient Foundation Language Models》全文解读

文章目录论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...

人工智能 2024-09-18 人工智能

1250阅读

LLaMA-QRLHF 项目使用教程

LLaMA-QRLHF 项目使用教程 llama-qrlhf Implementation of the Llama architecture with RLHF + Q-learning 项目地址: https://gitcode.com/g...

大数据 2024-09-17 人工智能

773阅读

【LLM大模型】使用QLoRa微调Llama 2

本篇文章将介绍使用PEFT库和QLoRa方法对Llama 27b预训练模型进行微调。我们将使用自定义数据集来构建情感分析模型。只有可以对数据进行微调我们才可以将这种大模型进行符合我们数据集的定制化。一些前置的知识如果熟悉Google Cola...

人工智能 2024-09-17 人工智能

851阅读

AIGC的算力与云边协同及应用创新

1）AI的新时代，生成式AI技术重新塑造AI技术的开发及应用 AI的新时代：更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改变及突破，生成式AI实际上扩大了“内容”的含义，凡是可以数字化的内容形式均为生成对象，而非传统意义下媒体环境的内容。...

AIGC 2024-09-17 人工智能

749阅读

【扩散模型（八）】Stable Diffusion 3 diffusers 源码详解2 - DiT 与 MMDiT 相关代码（下）

系列文章目录【扩散模型（一）】中介绍了 Stable Diffusion 可以被理解为重建分支（reconstruction branch）和条件分支（condition branch）【扩散模型（二）】IP-Adapter 从条件分支的视角，快...

AIGC 2024-09-17 人工智能

1329阅读

Stable Diffusion 3「精神续作」FLUX.1 源码深度前瞻解读

前言前几个月，推出了著名文生图模型 Stable Diffusion 的 Stability AI 公司曝出了核心团队集体离职的消息。一时间，AI 从业者们议论纷纷，不知道这究竟是团队出现了矛盾，还是这些员工觉得文生图模型做下去没有前途了。而近期，该...

大数据 2024-09-17 人工智能

1450阅读

rk3588使用npu加速运行whisper语音识别模型

rk3588运行whisper模型有三种方法：1.使用纯cpu运行原始pytorch模型；2.将whisper模型转成onnx格式，再转成rknn格式使用npu运行；3.利用npu提供的矩阵运算功能，结合cpu一起运行原始pytorch模型。方法1做不到实...

AIGC 2024-09-16 人工智能

3173阅读

FastAPI部署大模型Llama 3.1

项目地址：self-llm/models/Llama3_1/01-Llama3_1-8B-Instruct FastApi 部署调用.md at master · datawhalechina/self-llm (github.com 目的：使用Aut...

人工智能 2024-09-15 人工智能

1662阅读

探索Meta新发布的大模型：Llama 3.1

最近正好关注到了meta发布的新大模型llama3.1，于是抱着好奇的态度来试一下。近期，Meta发布了其最新的大模型——Llama 3.1。作为一名科技爱好者和人工智能的追随者，我迫不及待地想要了解这一新模型的性能和特点。本文将带你一起探索Llama...

AIGC 2024-09-15 人工智能

1007阅读

Whisper Web 开源项目教程

Whisper Web 开源项目教程 whisper-webML-powered speech recognition directly in your browser项目地址:https://gitcode.com/gh_mirrors/wh/whi...

生成式AI 2024-09-15 人工智能

1220阅读

揭秘AI世界：一网打尽大模型、AIGC等热门概念，快速提升你的学习力！

AI（人工智能）人工智能 (AI 是对人类智慧行为的仿真。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。本质就是帮人工作做事的工具。 AGI（通用人工智能） AGI，全称为Artificial General Inte...

人工智能 2024-09-14 人工智能

975阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

1081阅读

Llama开源代码详细解读（2）

FlashAttention if is_flash_attn_available( : # 检查flashattention的可用性 from flash_attn import flash_attn_func, flash_attn_var...

生成式AI 2024-09-13 人工智能

1521阅读

谷歌创始人重返一线投身AI！坦言当时太胆小错失先机

快科技9月13日消息，据媒体报道，谷歌联合创始人谢尔盖布林在2024年All-In峰会上接受公开采访时确认，他已重返谷歌一线工作，专注于人工智能相关研发。布林表示，当前AI技术的快速发展令人震惊，作为计算机科学家，他不愿错过这场技术革命。布林在访谈中提...

大数据 2024-09-13 人工智能

740阅读

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...

AIGC 2024-09-13 人工智能

898阅读

清华系公司强强联合，一张4090让安全大模型进入千亿时代｜长亭x趋境

AI大行其道的时代，网络安全正面临前所未有的威胁。化身黑客的AI学会了自动化攻击，还有相当高的成功率，伊利诺伊大学香槟分校研究团队的最新研究显示:GPT-4能够在阅读CVE漏洞描述后，学会利用漏洞攻击，成功率高达87%。既然攻击方都与时俱进，用上AI新...

人工智能 2024-09-13 人工智能

719阅读

【AIGC半月报】AIGC大模型启元：2024.08（下）

【AIGC半月报】AIGC大模型启元：2024.08（下）） (1 Nemotron-4-Minitron（Nvidia LLM） (2 VITA（腾讯优图多模态大模型） (3 mPLUG-Owl3（阿里巴巴多模态大模型） (4 ADA...

AIGC 2024-09-13 人工智能

890阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMa_llama模型

LLaMA详解 LLaMA（Large Language Model Meta AI）是由Meta（前身为Facebook）开发的一种大规模语言模型，旨在提高自然语言处理（NLP）任务的性能。LLaMA基于变换器（Transformer）架构，并经过大...

AIGC 2024-09-12 人工智能

854阅读

IBM中国研发裁员与AIGC浪潮下的中国IT产业新篇章：挑战、机遇与未来展望

文章目录一、跨国公司战略调整与全球IT版图的重构 1. 跨国公司的战略考量 2. 中国IT产业的应对策略二、人才市场的深刻变革与应对策略 1. 人才流失与再就业压力 2. 人才培养与引进策略 3. 个人职业规划与发展三、AIGC浪...

人工智能 2024-09-12 人工智能

801阅读

一文彻底搞懂大模型 - GPT和LlaMA的模型架构

GPT vs LlaMA GPT与LlaMA，作为大语言模型的两大巨擘，均基于Transformer架构却各有千秋。GPT系列以强大的生成能力著称，通过不断增大的参数规模引领复杂语言与推理任务的前沿；而Llama则以开源姿态，通过技术创新提升模型性能，预...

人工智能 2024-09-12 人工智能

1101阅读

【AIGC半月报】AIGC大模型启元：2024.09（上）

【AIGC半月报】AIGC大模型启元：2024.09（上） (1 OCR-2.0（旷视科技） (2 MiniCPM 3.0（面壁智能） (3 RAGLAB（RAG框架） (4 Reflection 70B（HyperWrite）...

AIGC 2024-09-12 人工智能

891阅读

LLaMA-Factory仓基础功能架构及NPU/GPU环境实战演练

LLaMA-Factory 基础篇 LLaMA-Factory简介 LLaMA-Factory是一个开源的大规模语言模型微调框架，设计用于简化大模型的训练过程。它提供了一个统一的平台，支持多种大模型的微调，包括LLaMA、BLOOM、Mist...

大数据 2024-09-11 人工智能

1165阅读

如何部署Meta开源大模型Llama2，转换为Huggingface模型的权重文件

如何部署Meta开源大模型Llama2 一、申请下载权限通过Meta AI官网(https://llama.meta.com/llama-downloads/ 申请下载权限，注意Country/Region选择这里，可能会影响审查速度吧，...

大数据 2024-09-11 人工智能

2260阅读

快速降低AIGC疑似率

标题：掌握AIGC技术，快速降低疑似率一、了解AIGC技术基础在当今数字化时代，人工智能生成内容（AIGC）技术正迅速成为创新和创造力的驱动力。AIGC技术指的是利用人工智能算法自动生成文本、图像、音频和视频等内容的技术。这项技术的应用范围广泛，从...

大数据 2024-09-11 人工智能

795阅读

【大模型】llama系列模型基础

前言：llama基于transformer架构，与GPT相似，只用了transformer的解码器部分。本文主要是关于llama，llama2和llama3的结构解读。目录 1. llama 1.1 整体结构 1.2 RoPE 1...

生成式AI 2024-09-10 人工智能

1438阅读

新一代模型微调方案LLama-Pro ，快来围观！！！

❝ 大家好，我是 Bob! ? 一个想和大家慢慢变富的 AI 程序员? 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我，一起探索，一起破圈！? Y LLAMA PRO论文笔记直达链接：摘要这篇论文介绍了一种名为L...

AIGC 2024-09-10 人工智能

848阅读

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯!相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间，来存储...

人工智能 2024-09-10 人工智能

810阅读

openai whisper使用

whisper使用介绍 Whisper是一种通用的语音识别模型。它是在大量不同音频数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 GitHub：https://github.com/openai/whisper...

生成式AI 2024-09-10 人工智能

1016阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 task01笔记

赛题内容参赛者需在可图Kolors 模型的基础上训练LoRA 模型，生成无限风格，如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事，故事内容可自定义；基于8图故事，评估LoRA风格的美感度...

AIGC 2024-09-09 人工智能

832阅读

ACL 2024 | CoCA：自注意力的缺陷与改进

近年来，在大语言模型（LLM）的反复刷屏过程中，作为其内核的 Transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 Transformer 诞生之初，被视为天然具备的长度外推能力，...

AIGC 2024-09-09 人工智能

1046阅读

【AIGC从零开始】AIGC小白学习心得第二讲：3D生成模型

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Video 3D（sv3d）二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...

大数据 2024-09-08 人工智能

1103阅读

从【人工智能】到【计算机视觉】，【深度学习】引领的未来科技创新与变革

前几天偶然发现了一个超棒的人工智能学习网站，内容通俗易懂，讲解风趣幽默，简直让人欲罢不能。忍不住分享给大家，点击这里立刻跳转，开启你的AI学习之旅吧！前言 – 人工智能教程https://www.captainbed.cn/lzx 1. 引言...

生成式AI 2024-09-07 人工智能

795阅读