bpe 第2页 - AIGC资讯

DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结

DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE（Auto Encoder） encoder decoder结构，AE在生成任务时只会模仿不会创造，所有有了后面的VAE VAE(Var...

AIGC 2023-12-19 人工智能

541阅读

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

里程碑式论文word2vec获得NeurIPS时间检验奖，可谓实至名归。但一作Tomas Mikolov在Facebook上发表的长篇获奖感言，却充满了失望和不满。图片论文最初被ICLR拒稿都算小事了，他还暗讽了OpenAI首席科学家Ilya Su...

大数据 2023-12-18 人工智能

490阅读

LLaMA模型之中文词表的蜕变

在目前的开源模型中，LLaMA模型无疑是一颗闪亮的⭐️，但是相对于ChatGLM、BaiChuan等国产大模型，其对于中文的支持能力不是很理想。原版LLaMA模型的词表大小是32K，中文所占token是几百个左右，这将会导致中文的编解码效率低。在将LL...

生成式AI 2023-12-16 人工智能

716阅读

stable-diffusion-webui(1.2.1版本) win10系统本地电脑部署

在安装stable-diffusion-webui(1.2.1版本之前需要确认win10本地电脑具有的环境 1.显卡类型：NVIDIA（英伟达）建议显存高于4G以上，这样512*512的还是可以运行的 2.python(版本必须最好是3.10.6...

生成式AI 2023-12-14 人工智能

633阅读

SAM&Stable-Diffusion集成进化！分割、生成一切！AI绘画新玩法

自SAM「分割一切」模型推出之后，二创潮就开始了，有想法有行动！飞桨AI Studio开发者会唱歌的炼丹师就创作出SAM进化版，将SAM、Stable Diffusion集成，实现「分割」、「生成」能力二合一，并部署为应用，支持在线使用！在线免费...

人工智能 2023-12-03 人工智能

610阅读

[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)

目录一、前言二、安装三、自己训练一个tokenizer 四、模型运行五、拓展六、补充一、前言前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）这种方式是对一个一个...

生成式AI 2023-12-02 人工智能

544阅读

文献阅读：LLaMA: Open and Efficient Foundation Language Models

文献阅读：LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...

AIGC 2023-12-01 人工智能

460阅读

【LLM系列之底座模型对比】LLaMA、Palm、GLM、BLOOM、GPT模型结构对比

LLama [GPT3] 使用RMSNorm（即Root Mean square Layer Normalization）对输入数据进行标准化，RMSNorm可以参考论文：Root mean square layer normalization。 [...

大数据 2023-12-01 人工智能

617阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

915阅读

LLaMA-2论文阅读

1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代，跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍，从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...

生成式AI 2023-11-24 人工智能

629阅读

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA，旨在让技术开发者们能够更方便地提升大语言模型训练性能，降低训练成本，并保持和LLaMA社区的兼容性。测试显示，在32卡训练上，相比HuggingFace上直接获得的...

生成式AI 2023-11-24 人工智能

555阅读

【A卡，Windows】stable diffusion webui下载安装避坑指南

观前提醒本文内容都是本人亲身经历的，一个一个安装下载测试所感，当然如果你更想用傻瓜式集成包的，那还是跳过这篇文章吧。当然我不推荐这篇文章的操作，因为我用了差不多1h才有一副图，有N卡，就用N卡，这只是无奈之举而已，方便那些像我一样暂时没有换机子打...

大数据 2023-11-23 人工智能

2285阅读

LLaMA系列 | LLaMA和LLaMA-2精简总结

文章目录 1、LLaMA 1.1、模型结构 1.2、训练方式 1.3、结论 2、LLaMA-2 2.1、相比LLaMA1的升级 2.3、模型结构 2.3.1、MHA, MQA, GQA区别与联系 2.4、训练方式 1、L...

人工智能 2023-11-13 人工智能

795阅读

语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。具体来说，研究人员提出了一个叫做LanguageBind的多模态预训练框架。用语言作为与其它模态之间的纽带，冻结语言编码器，然后用对比学习方法...

生成式AI 2023-11-13 人工智能

513阅读

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

背景随着ChatGPT迅速出圈，最近几个月开源的大模型也是遍地开花。目前，开源的大语言模型主要有三大类：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chim...

生成式AI 2023-11-11 人工智能

999阅读

多路ADC的采集——stm32

在对实际应用过程中，ADC的采集大多是多个通道同时采集的，比如同时采集多个传感器的数据，就可能需要我们配置多个通道的ADC采集了，而多通道的ADC采集大多用到了DMA，笼统的讲通过DMA来传输数据不经过CPU，可以有效的为CPU减负，我们...

AIGC 2023-11-08 大数据

1156阅读

stm32 使用ADC_DMA采集电压，并在显示屏上输出波形

红叶何时落水 DMA初始化 GPIO_InitTypeDef GPIO_InitStructure; DMA_InitTypeDef DMA_InitStructure;//结构体定义 RCC_AHBPeriphClockCmd(RCC...

AIGC 2023-11-08 大数据

473阅读

STM32——ADC采集

目录 ADC简介 ADC主要特征 ADC功能框图 ADC引脚电压输入范围通道选择单次转换模式连续转换模式转换顺序规则序列注入序列触发源转换时间中断转换结束中断模拟看门狗中断 DMA请求代码...

AIGC 2023-11-08 大数据

652阅读

STM32 定时器触发 ADC 多通道采集，DMA搬运至内存

引言 ADC 的功能是将模拟信号采样得到数字信号，而有些时候，我们需要使用到定时采样，比如在计算一个采集的波形的频率的时候，我们需要精确的知道采样频率，也就是 1 s 内采集的点数，这个时候，就需要使用到定时采集。定时采样有如下三种方法：使用定...

生成式AI 2023-11-08 大数据

567阅读

元象XVERSE开源650亿参数通用大模型XVERSE-65B

元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B，无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构，参数规模达到了650亿。模型通过训练了2....

人工智能 2023-11-06 人工智能

488阅读

最高20倍！压缩ChatGPT等模型文本提示，极大节省AI算力

在长文本场景中，ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题，微软开源了LongLLMLingua。据悉，LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩，同时又可以准确评估...

AIGC 2023-10-25 人工智能

583阅读