transformer 第29页

LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘

微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...

人工智能 2023-12-13 人工智能

761阅读

首个GPT-4驱动的人形机器人！无需编程+零样本学习，还可根据口头反馈调整行为

让GPT-4操纵人形机器人，事先不做任何编程or训练，能搞成啥样儿？答案是：太猎奇了！这不，要求机器人表演“在昏暗电影院里狂炫爆米花，却突然发现吃的是隔壁陌生人的?”。在GPT-4的操纵下，机器人笑容凝固，“尴尬”得摇头扶额后仰：但在尴尬...

AIGC 2023-12-13 人工智能

467阅读

一张照片、一段声音秒生超逼真视频！南大等提出全新框架，口型动作精准还原

一段音频+一张照片，瞬间照片里的人就能开始讲话了。生成的讲话动画不但口型和音频能够无缝对齐，面部表情和头部姿势都非常自然而且有表现力。而且支持的图像风格也非常的多样，除了一般的照片，卡通图片，证件照等生成的效果都非常自然。再加上多语言的支持，瞬间照...

AIGC 2023-12-13 人工智能

691阅读

首次超过70% mAP！GeMap：局部高精地图SOTA再次刷新

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要，可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展，在线向量化高精地图构建逐渐兴起，代表性...

人工智能 2023-12-13 人工智能

524阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

582阅读

llama.cpp部署通义千问Qwen-14B

llama.cpp是当前最火热的大模型开源推理框架之一，支持了非常多的LLM的量化推理，生态比较完善，是个人学习和使用的首选。最近阿里开源了通义千问大语言模型，在众多榜单上刷榜了，是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...

人工智能 2023-12-13 人工智能

745阅读

训练自己的Llama 2！大模型微调技术介绍

训练自己的Llama 2！大模型微调技术介绍趋动云趋动云是面向 AI 算法工程师的开发平台，为工程师提供模型开发、模型训练、数据和代码管理等功能。近期有不少粉丝问算力君，趋动云是否支持大模型的训练？当然支持！最近大火的Llama...

AIGC 2023-12-12 人工智能

1048阅读

W.A.L.T官网体验入口 AI视频图像生成软件app免费下载地址

《W.A.L.T》是一个基于transformer的实景视频生成方法，它通过联合压缩图像和视频到一个统一的潜在空间，实现跨模态的训练和生成。使用了窗注意力机制来提高内存和训练效率，该方法在多个视频和图像生成基准测试上取得了最先进的性能。《W.A.L.T》在...

大数据 2023-12-12 人工智能

511阅读

Colab Stable Diffusion使用教程

使用网址链接： https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 记录一下跟的网上的教程遇...

AIGC 2023-12-12 人工智能

460阅读

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

一条神秘磁力链接引爆整个AI圈，现在，正式测评结果终于来了：首个开源MoE大模型Mixtral 8x7B，已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。（对，就是传闻中GPT-4的同款方案。）并且由于是稀疏模型，处理每个toke...

人工智能 2023-12-12 人工智能

457阅读

AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例

AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例学习前言源码下载地址原理解析一、先验知识二、什么是inpaint 三、Stable Diffusion中的inpaint 1、开源的inpain...

AIGC 2023-12-12 人工智能

685阅读

MiniGPT-4 and LLaMA 权重下载

MiniGPT-4 权重文件下载权重文件下载官方下载 https://huggingface.co/docs/transformers/main/model_doc/llama 填写表单，等待申请磁力下载磁力 magnet:...

AIGC 2023-12-12 人工智能

580阅读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca Introduction Chinese LLaMA Chinese Alpaca Lora-Fin...

大数据 2023-12-12 人工智能

438阅读

TTS算法笔记：MusicLM- Generating Music From Text（AI生成音乐）

1. 介绍摘要：介绍了一个以文本作为条件，生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”，MusicLM可以可以根据文本条件，生成24kHz采样率，分钟级别的连续音乐音频。从摘要中可以得知，这篇文章解决的根...

大数据 2023-12-12 人工智能

637阅读

BlueLM蓝心大模型好不好用手机AI大模型推荐

BlueLM 蓝心大模型是 vivo 研发的一种通用人工智能语言模型。它是基于 Transformer 架构的，并使用了大量的文字和代码数据进行训练。蓝心大模型软件的体验入口在哪呢，这里我们来看下蓝心大模型的官方体验入口。 >>>点击前...

AIGC 2023-12-11 人工智能

439阅读

胜率达94.08%！李开复Yi-34B最新成绩超过LLaMA2等主流大模型

近期，李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型，尤其在加州大学伯克利分校主导的LMSYS ORG排行榜中，以1102的Elo评分追平了GPT-3.5。此外，在中文SuperC...

AIGC 2023-12-11 人工智能

482阅读

LLM-SFT，新微调数据集-MWP-Instruct(多步计算 + 一、二元方程)，微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)

LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口等. 项目...

大数据 2023-12-11 人工智能

551阅读

【AIGC】Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式

【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描述，来介绍Stable Diffusion的关键原理。目前，网络上的使用教程非常多，本篇中不会介绍如何部署、使用或者微调SD模型。也会尽量精简...

AIGC 2023-12-11 人工智能

499阅读

linux部署stable diffusion

模型地址：https://github.com/CompVis/stable-diffusion 下载代码库 git clone https://github.com/CompVis/stable-diffusion.git 2.创建虚拟环境 #...

AIGC 2023-12-11 人工智能

479阅读

ChatGPT与Google Bard那个更好？

AIGC 行业最大的两个竞争对手：ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。截至目前Google Bard和ChatGPT之间最大的区别是：Bard知道ChatGPT，但ChatGPT却对Bard懵然不知。...

生成式AI 2023-12-10 人工智能

782阅读

导出LLaMA ChatGlm2等LLM模型为onnx

通过onnx模型可以在支持onnx推理的推理引擎上进行推理，从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖，获得更好的性能等优势。这篇博客（大模型LLaMa及周边项目（二） - 知乎）进行了llama导出onnx的开创性...

AIGC 2023-12-10 人工智能

725阅读

【AI绘画】AI绘画乐趣：稳定增强扩散技术展现

目录前言一、Stable Diffusion是什么？二、安装stable-diffusion-webui 1. python安装 2. 下载模型 3. 开始安装： 4. 汉化： 5. 模型使用： 6. 下载新模型： 7. 基础玩法三...

AIGC 2023-12-10 人工智能

603阅读

【原创】AIGC之ChatGPT工作原理

AIGC是什么 AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content...

人工智能 2023-12-10 人工智能

476阅读

使用Stable Diffusion进行Ai+艺术设计(以智慧灯杆为例)

目录一. 安装环境二. 配置模型 2.1 stable diffusion v1 2.2 运行并测试生成效果 Stable Diffusion 是一种以 CLIP ViT-L/14 文本编码器的（非池化）文本嵌入为条件的潜在扩散...

大数据 2023-12-10 人工智能

478阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

576阅读

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

文章目录一、背景二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...

AIGC 2023-12-09 人工智能

959阅读

stable-diffusion-webui 安装

一、安装 https://blog.csdn.net/weixin_72056722/article/details/126651703 卸载cpu版本的torch并离线安装对应的gpu版本 1、安装gpu ，速度从一小时加速到3分钟 torch...

大数据 2023-12-09 人工智能

543阅读

弥合化学反应预训练和条件分子生成之间的差距，北大&望石智慧提出「统一」模型

化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。近日，来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。受有机化学机制的启发，研究人员开发了一...

大数据 2023-12-09 人工智能

471阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

673阅读

AI作画，国风油画风随心定制~ Stable Diffusion模型使用，三步就上手

前言最近，AIGC（即AI Generated Content，是指利用人工智能技术来生成内容）真的是火出了天际。除了被挤到服务器满负荷的chatGPT，另一个也颇受瞩目的领域当属AI作画了。利用开源的一类“扩散（diffusion）”模型，你可...

生成式AI 2023-12-09 人工智能

945阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

528阅读

LLM各层参数详细分析（以LLaMA为例）

网上大多分析LLM参数的文章都比较粗粒度，对于LLM的精确部署不太友好，在这里记录一下分析LLM参数的过程。首先看QKV。先上transformer原文也就是说，当h（heads） = 1时，在默认情况下，...

大数据 2023-12-08 人工智能

622阅读

GTA6预告片播放过亿，AI三巨头也能秒变GTA匪帮

GTA 新出的游戏预告片看了吗？据说，这个预告片已经破了三项吉尼斯世界纪录，观看次数已经破亿。但如果告诉你，AI 三巨头也可以成为 GTA 里的人物，你还能认出他们吗？ AI 三巨头：Yann LeCun、Geoffrey Hinton 和 Yos...

生成式AI 2023-12-08 人工智能

564阅读

安装stable-diffusion

安装流程：下载stable-diffusion源码 <https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.2.1> 安装python &l...

AIGC 2023-12-08 人工智能

461阅读

在 Mac M1 上运行 Llama 2 并进行训练

在 Mac M1 上运行 Llama 2 并进行训练 Llama 2 是由领先的人工智能研究公司 Meta （前Facebook）开发并发布的下一代大型语言模型 (LLM 。它基于 2 万亿个公共数据 token 进行了预训练，旨在帮助开发人员和...

AIGC 2023-12-08 人工智能

556阅读

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型...

人工智能 2023-12-08 人工智能

508阅读

自动驾驶大模型论文调研与简述

最近关于大模型(LLMs, VLM 与自动驾驶相关文献调研与汇总：适合用于什么任务？答：目前基本上场景理解、轨迹预测、行为决策、运动规划、端到端控制都有在做。大家都怎么做的？对于规控任务，LLM型基本是调用+Prompt设计，集中在输入和输出设计...

生成式AI 2023-12-08 人工智能

664阅读

强大到离谱！硬核解读Stable Diffusion（完整版）

原文链接：硬核解读Stable Diffusion（完整版） 2022年可谓是AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Stable Diffusion，下半年有OpenAI的文本对话大模型Ch...

AIGC 2023-12-08 人工智能

933阅读

【AI作画】stable diffusion webui Linux虚拟机 Centos 详细部署教程

部署环境：环境：虚拟机Centos7、6处理器、8G内存+10G交换内存、没有GPU使用CPU硬解windows版本的可以直接使用整合包：看评论的转载链接自行下载，解压即可用安装Git 2.15.1 提示：这里可能source后版本是1.8...

人工智能 2023-12-07 人工智能

496阅读

【深度学习】AIGC ，ControlNet 论文，原理，训练，部署，实战，教程（三）

文章目录源码资源下载 Python环境试玩controlnet 训练数据准备选一个Stable diffusion模型开始训练第一篇：https://qq742971636.blog.csdn.net/article/...

AIGC 2023-12-07 人工智能

677阅读

使用 LoRA 进行 Stable Diffusion 的高效参数微调

LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术，主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...

生成式AI 2023-12-07 人工智能

692阅读

大语言模型分布式训练的量化分析与优秀实践,以 GPT-175B 为例

一、Transformer 大语言模型的 SOTA 训练技术 1、大语言模型的发展背景与挑战首先和大家分享下大语言模型的发展背景。过去的几年内，无论从数据量的维度还是从模型规模的维度，语言模型规模都扩大了非常多的数量级。随着数据量和模型规模的扩大，也...

AIGC 2023-12-07 人工智能

498阅读

国内AI顶会CPAL论文录用结果放出！共计30篇Oral和60篇Spotlight

大家可能还记得，今年五月份公布的，将由国内大佬马毅和沈向洋牵头办的全新首届AI学术会议CPAL。这里我们再介绍一下CPAL到底是个什么会，以防有的读者时间太久有遗忘—— CPAL（Conference on Parsimony and Learning...

生成式AI 2023-12-07 人工智能

647阅读

Stable Diffusion - Stable Diffusion WebUI 图像生成工具的环境配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131528224 Stable Diffusion WebUI 是...

大数据 2023-12-06 人工智能

711阅读

大模型LLaMA和微调LLaMA

1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens，和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化与Transf...

大数据 2023-12-06 人工智能

984阅读

AIGC产业研究报告 2023——图像生成篇

易观：今年以来，随着人工智能技术不断实现突破迭代，生成式AI的话题多次成为热门，而人工智能内容生成（AIGC）的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势，易观对AIGC产业进行了探索并将发布AIG...

AIGC 2023-12-06 人工智能

495阅读

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起...

AIGC 2023-12-06 人工智能

478阅读

Stable Diffusion 让4090满血复活的方法 30+it/s

AI绘画的生成速度会受到以下因素的制约：torch版本、transformers版本、CUDA版本和cuDNN版本。非40系显卡用户应使用最新的整合包以获得最佳速度。v3版整合包已经更新到torch 1.13.1、CUDA 11.7和transform...

人工智能 2023-12-06 人工智能

533阅读

教你文本生成图片——stablediffusion

今天来点轻松的话题，带大家玩一个用文字生成图片的模型。相信大家如果关注AIGC领域，对文本生成图片，对Stablefiffusion、DEALL.E应该不陌生。今天给大家介绍的就是基于SD2 finetune出来的一个模型（）这篇文章不会...

生成式AI 2023-12-06 人工智能

506阅读

AI实战营：生成模型+底层视觉+AIGC多模态算法库MMagic

目录环境安装黑白照片上色文生图-Stable Diffusion 文生图-Dreambooth 图生图-ControlNet-Canny 图生图-ControlNet-Pose 图生图-ControlNet Animation 训...

生成式AI 2023-12-05 人工智能

615阅读