transformer 第24页

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1255阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，...

AIGC 2024-01-18 人工智能

1224阅读

AIGC内容分享(十二)：AIGC探索之旅AIGC探索之旅

目录前言引言：AI时代，未来已来 AIGC简介与发展历程早期萌芽阶段（1950s－1990s）沉淀积累阶段（1990s－2010s）快速发展阶段（2010s至今）大模型与AIGC的关联大模型概述大模型的定义和特点典型大...

大数据 2024-01-18 人工智能

1038阅读

Stable Diffusion扩散模型 + Consistency一致性模型

1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史 2.1 DDPM 扩散过程（正向）去噪过程（反向）总结优化目标理论推导代码解析 2.2 Stable Diffu...

人工智能 2024-01-17 人工智能

1422阅读

书生·浦语2.0体验入口 AI聊天InternLM2模型在线使用地址

「InternLM2」书生·浦语2.0是一款面向中文和英文的大型多语言预训练语言模型，标志着自然语言处理技术的新时代。它不仅在语言理解和生成方面有着出色的表现，还能够进行多模式推理和代码理解。这种基于Transformer架构的模型通过海量数据的预训练，在...

AIGC 2024-01-17 人工智能

997阅读

【论文简介】Stable Diffusion的基础论文:2112.High-Resolution Image Synthesis with Latent Diffusion Models

稳定扩散生成模型(Stable Diffusion 是一种潜在的文本到图像扩散模型，能够在给定任何文本输入的情况下生成照片般逼真的图像 Stable Diffusion 是基于latent-diffusion 并与 Stability AI and Run...

大数据 2024-01-17 人工智能

1282阅读

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama: Towards Foundation Models for Time Series Forecasting 摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取...

生成式AI 2024-01-17 人工智能

1211阅读

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后，大型语言模型(llm 变得非常受欢迎。从那时起，这些语言模型的使用得到了爆炸式的发展，这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。计算机要处理语言，...

AIGC 2024-01-17 人工智能

913阅读

杰克逊跳舞秒变3D机器人！阿里又出新活儿，视频任何人可替换

这究竟是怎么回事？原来啊，阿里又整出新活儿—— MotionShop，能将视频中的人物角色替换成3D形象，同时又不改变其他场景和人物。比如，打工仔小猪打太极。看到这有人已经迫不及待了。目前已在ModelScope社区开放试玩。还有人建议说在Hu...

生成式AI 2024-01-17 人工智能

875阅读

AI零成本人像生成工具下载地址 FaceChain-FACT官网体验入口

FaceChain-FACT是一款先进的零成本人像生成工具，它利用最新的人工智能技术，无需用户训练LoRA模型，仅需提供一张照片即可生成定制人像。与传统的商业应用相比，FaceChain-FACT的生成速度提升了 100 倍，支持秒级图像生成，非常适合个人...

大数据 2024-01-17 人工智能

1025阅读

【AIGC】Controlnet:基于扩散模型的文生图的可控性

前言 controlnet可以让stable diffusion的生图变得可控。文章连接：https://arxiv.org/pdf/2302.05543.pdf 摘要冻结了stable diffusion的预训练模型并重用它的预训练...

AIGC 2024-01-17 人工智能

1333阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

846阅读

基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率...

人工智能 2024-01-17 人工智能

2588阅读

深入浅出解析Stable Diffusion完整核心基础知识 | 【算法兵器谱】

Rocky Ding 公众号：WeThinkIn 最新更新： Rocky也一直在更新Stable Diffusion系列的文章内容，包括最新发布的Stable Diffusion XL。Rocky都进行...

AIGC 2024-01-17 人工智能

1522阅读

复现问题记录 | Stable Diffusion(LDM) (in python3)（一）

复现环境代码 util.py 测试 Text-to-Image 直接使用网页生成记录复现LDM遇到的问题环境 conda env create -f environment.yaml 根据environment.ya...

大数据 2024-01-17 人工智能

1180阅读

数据采集新篇章：AI与大模型的融合应用

作者 | 崔皓审校 | 重楼摘要文章概述了在AIGC应用中，大型语言模型（LLM）的重要性及其在实时数据处理方面的局限性。进而介绍了通过网络爬虫技术结合LLM的方法，旨在克服这些限制，通过实时网络请求、HTML内容加载与转换，以及LLM进行的数...

生成式AI 2024-01-17 人工智能

1298阅读

不知道AIGC是什么？近屿智能OJAC第六期AIGC深度训练营，带您从入门到精通！

想赶上AIGC技术革命这波红利，赚取更多收益的朋友，现在正是大好的时机！近屿智能OJAC的“AIGC星辰大海”第六期训练营正火热招募中！上千名学员已在此实现了职业的转型和飞跃，甚至有的学员通过学习AIGC大模型课程成功搭建出了自己的AI产品，并且成...

大数据 2024-01-17 人工智能

977阅读

使用 DPO 微调 Llama 2

简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模型的输出符合人类在闲聊或安全...

生成式AI 2024-01-17 人工智能

943阅读

Stable Diffusion云服务器部署完整版教程

Stable Diffusion云服务器部署完整版教程 2023年07月04日 22:30 3607浏览 · 18喜欢 · 22评论...

人工智能 2024-01-17 人工智能

1820阅读

无需翻墙｜Stable Diffusion WebUI 安装｜AI绘画

前言最近终于有机会从围墙里往外看，了解到外面的世界已经有了天翻地覆的变化，感叹万千，笔者在本地mac，windows，linux，docker部署了不下20遍后，整理出来的linux极简避坑安装方案，供大家参考学习。注系统：linux 用...

生成式AI 2024-01-16 人工智能

1192阅读

【stable diffusion原理解读通俗易懂，史诗级万字爆肝长文，喂到你嘴里】

文章目录一、前言（可跳过）二、stable diffusion 1.clip 2.diffusion model forward diffusion （前向扩散）逆向扩散（reverse diffusion）采样图阶段小结 3....

人工智能 2024-01-16 人工智能

889阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

1443阅读

Stable Diffusion VAE：改善图像质量的原理、选型与使用指南

VAE Stable Diffusion（稳定扩散）是一种用于生成模型的算法，结合了变分自编码器（Variational Autoencoder，VAE）和扩散生成网络（Diffusion Generative Network）的思想。它通过对变分自编码器...

大数据 2024-01-16 人工智能

1519阅读

AI人像生成零成本图像处理软件下载地址 FaceChain-FACT官网体验入口

FaceChain-FACT是一个创新的零成本人像生成工具，为用户提供了一种简便、高效的方式来生成定制化的人像。这款工具的特点是用户无需训练LoRA模型，只需提供一张照片，FaceChain-FACT就能迅速生成定制人像。它集成了基于Transformer...

人工智能 2024-01-16 人工智能

1117阅读

Stable diffusion 简介

Stable diffusion 是 CompVis、Stability AI、LAION、Runway 等公司研发的一个文生图模型，将 AI 图像生成提高到了全新高度，其效果和影响不亚于 Open AI 发布 ChatGPT。Stable diffusi...

生成式AI 2024-01-16 人工智能

2388阅读

【生成模型】Stable Diffusion原理+代码

文章目录前言一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE：三、Diffusion扩散模型 1.前向过程 2.逆向过程四、多模态 cross attention 五...

生成式AI 2024-01-16 人工智能

1601阅读

互联网新时代要来了（二）什么是AIGC？

什么是AIGC？最近，又火了一个词“**AIGC”**2022年被称为是AIGC元年。那么我们敬请期待，AIGC为我们迎接人工智能的下一个时代。 TIPS:内容来自百度百科、知乎、腾讯、《AIGC白皮书》等网页什么是AIGC？ 1...

生成式AI 2024-01-16 人工智能

945阅读

Stable Diffusion五问

一，什么是Stable diffusion？ Stable Diffusion" 是一种基于扩散模型的深度学习框架，用于生成高质量的图像。它是一种生成模型，通过模拟物理扩散过程，从随机噪声中逐步生成详细和结构化的图像。Stable Diffusion因其...

AIGC 2024-01-16 人工智能

981阅读

马斯克机器人炫技引千万网友围观！

特斯拉机器人，开始干家务了。马斯克通过最新视频，晒起特斯拉擎天柱机器人叠衣服，引发大量网友围观。现在机器人叠衣服只需要3步，30秒一件。第一步，先把衣服从篮子里拿出来，直接就叠好一边袖子。第二步，丝滑调整衣服位置，对齐另外半边。最后一头一...

大数据 2024-01-16 人工智能

829阅读

超越BEVFusion！又快又好的极简BEV融合部署方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在算法开发中，激光雷达-相机3D目标检测遇到了过度拟合问题，这是由于违反了一些基本规则。在数据集构建的数据标注方面，本文参考了理论补充，并认为回归任务预测不应涉及来自...

大数据 2024-01-16 人工智能

1097阅读

使用Gradio搭建Stable Diffusion模型生成图像：简单快捷的图像生成体验

目录 0 开发环境 1 介绍 1.1 Gradio简介 1.2 Stable Diffusion模型简介 2 使用Gradio搭建基本界面 2.1 安装依赖库 2.2 加载预训练模型 2.3 解析返回的数据 2.4 构建图像字幕应用程序...

人工智能 2024-01-16 人工智能

1954阅读

AIGC｜一文梳理「AI视频生成」技术核心基础知识和模型应用

大家好，我是猫先生，AI技术爱好者与深耕者！！ 2022年是AIGC（生成式AI）元年！从这一年开始，可谓是百家争鸣，各种技术层出不穷，再次迸发出AI的活力。从DALL·E 2、Stable Diffusion、Midjourney等文生图应用点燃了大众...

人工智能 2024-01-16 人工智能

2170阅读

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

前言近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...

大数据 2024-01-16 人工智能

1174阅读

[玩转AIGC]LLaMA2训练中文文章撰写神器（数据准备，数据处理，模型训练，模型推理）

目录一、下载并加载中文数据集二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1）先将一篇篇文本拼凑到一起（只是简单的拼凑一起，用于训练tokenizer） 2）将数据集进行合并 3、数据集处理之模型（ll...

AIGC 2024-01-16 人工智能

910阅读

碎片笔记｜AIGC核心技术综述

前言：AIGC全称为AI-Generated Content，直译为人工智能内容生成。即采用人工智能技术来自动生产内容。AIGC在2022年的爆发，主要是得益于深度学习模型方面的技术创新。不断涌现的生成算法、预训练模型以及多模态等技术的融合引发了AIGC的...

人工智能 2024-01-16 人工智能

1309阅读

LLM系列 | 22 : Code Llama实战(下篇)：本地部署、量化及GPT-4对比

引言模型简介依赖安装模型inference 代码补全 4-bit版模型代码填充指令编码 Code Llama vs ChatGPT vs GPT4 小结引言青山隐隐水迢迢，秋尽江南草未凋。...

人工智能 2024-01-16 人工智能

1149阅读

AIGC for code(text-to-codeAIGC/AI生成代码/生成式AI之代码生成/AI编程工具/自动编程/自动生成代码/智能编程工具/智能编程系统)

AIGC，Artificial Intelligence Generated Content，人工智能生成内容 AIGC for code，AI生成代码 1 Github Copilot 1.1 简介 Copilot是由微软的子公司Github与o...

生成式AI 2024-01-15 人工智能

1065阅读

OpenAI Whisper论文笔记

OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个 seq2seq （语音到文本）的 Transformer 模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精...

人工智能 2024-01-15 人工智能

973阅读

AnimateDiff论文解读-基于Stable Diffusion文生图模型生成动画

文章目录 1. 摘要 2. 引言 3. 算法 3.1 Preliminaries 3.2. Personalized Animation 3.3 Motion Modeling Module 4. 实验 5.限制 6. 结论论文：...

人工智能 2024-01-15 人工智能

1098阅读

基于llama-index对embedding模型进行微调

QA对话目前是大语言模型的一大应用场景，在QA对话中，由于大语言模型信息的滞后性以及不包含业务知识的特点，我们经常需要外挂知识库来协助大模型解决一些问题。在外挂知识库的过程中，embedding模型的召回效果直接影响到大模型的回答效果，因此，在许多场景下，...

大数据 2024-01-15 人工智能

2129阅读

Transformer的无限之路：位置编码视角下的长度外推综述

在自然语言处理（Natural Language Processing，NLP）领域，Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而，Transformer 及在其基础之上的大语言模型（Large Language Model...

大数据 2024-01-15 人工智能

914阅读

大模型部署手记（13）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+LangChain+摘要问答

1.简介：组织机构：Meta（Facebook）代码仓：GitHub - facebookresearch/llama: Inference code for LLaMA models 模型：chinese-alpaca-2-7b-hf、text...

AIGC 2024-01-15 人工智能

1007阅读

Stable Diffusion XL（SDXL）核心基础知识

文章目录一、Stable Diffusion XL基本概念二、SDXL模型架构上的优化（一）SDXL的整体架构（二）VAE （三）U-Net （四）text encoder （五）refiner model 三、SDXL在训练上的技...

人工智能 2024-01-15 人工智能

2376阅读

安装stable diffusion时git clone总..errorCApath: none；更新出错：fatal: unable to access Connection was reset

安装stable diffusion的出错 https://cgexe.com/39458/ 对于安装stable diffusion来说这个视频很好，但是我在本机的c盘照着做，还是报错，所以就自己整理一下自己的错误我下载git...

AIGC 2024-01-15 人工智能

1121阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

982阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1205阅读

AIGC内容分享(十三)：2023年中国AIGC产业全景报告

目录核心摘要中国AIGC产业之“变”与"新技术变革的原始驱力：大模型层价值传递的实际落位：应用层不可忽视的资源引擎：算力层中国AIGC产业之发展趋势核心摘要古人有云：日就月将，学有缉熙于光明。人类对人工智能学的潜心钻研...

生成式AI 2024-01-15 人工智能

919阅读

如何高效部署大模型？CMU最新万字综述纵览LLM推理MLSys优化技术

在人工智能（AI）的快速发展背景下，大语言模型（LLMs）凭借其在语言相关任务上的杰出表现，已成为 AI 领域的重要推动力。然而，随着这些模型在各种应用中的普及，它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强...

人工智能 2024-01-15 人工智能

1094阅读

基于AI的事件智能分析系统建设实践

一、背景当前，随着虚拟化、云计算等新技术的广泛应用，企业数据中心内部IT基础设施规模成倍增长，计算机硬件和软件的规模不断的扩大，相应的计算机故障也频繁发生，一线运维人员迫切的需要更加专业、更加强大的运维工具。在数据中心的日常运维工作中，一般是通过...

AIGC 2024-01-15 人工智能

869阅读

拆掉英伟达护城河，细节曝光！世界最快超算用3072块AMD GPU训完超万亿参数LLM

用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室（Oak Ridge National Laboratory）的全世界最大的超算Frontier，集合了37888个MI250X GPU和9472个Epyc 7A53 C...

大数据 2024-01-15 人工智能

865阅读