transformer 第28页

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境 1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4 GPU. 2、pip安装依赖python包 !pip install --upgrade accelerate !pip ins...

人工智能 2023-12-20 人工智能

861阅读

前OpenAI首席科学家Ilya: 只要能够预测下一个token，人类就能达到AGI

近日，Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」，似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...

生成式AI 2023-12-20 人工智能

818阅读

你真的会写 Prompt ? 剖析 RAG 应用中的指代消解

随着 ChatGPT 等大语言模型(LLM 的不断发展，越来越多的研究人员开始关注语言模型的应用。其中，检索增强生成（Retrieval-augmented generation，RAG）是一种针对知识密集型 NLP 任务的生成方法，它通过在生成过程中...

AIGC 2023-12-20 人工智能

846阅读

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还...

人工智能 2023-12-20 人工智能

1351阅读

AIGC大记事【2023-0625】【第五期】：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年

大咖观点：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年孙正义：我每天和ChatGPT聊天，一场巨大革命即将到来，软银“终将统治世界！” 刘慈欣谈 ChatGPT：人类的无能反而是人类最后的屏障 AI时代已来，吴恩达呼吁向每个孩...

生成式AI 2023-12-20 人工智能

957阅读

DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结

DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE（Auto Encoder） encoder decoder结构，AE在生成任务时只会模仿不会创造，所有有了后面的VAE VAE(Var...

AIGC 2023-12-19 人工智能

1119阅读

2024 年八大生成式 AI 工具类别

需要为组织的开发项目提供特定于生成式 AI 的工具？探索这些工具所属的主要类别及其功能。 ChatGPT 等生成式AI 服务的普及激发了将这些新工具应用于实际企业应用的兴趣。如今，几乎每个企业应用程序都通过生成式 AI 功能进行了增强。大多数 AI、...

生成式AI 2023-12-19 人工智能

1610阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1628阅读

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

像Pika一样的神级创业故事又要再次上演了？两位哈佛退学的年轻人，想要制造一款专用于大语言模型加速的AI加速器芯片，将于2024年第三季度交付，推理性能达H100的10倍。在今年6月份，两位创始人Gavin Uberti和Chris Zhu创立了E...

大数据 2023-12-19 人工智能

819阅读

甩英伟达几百条街？Etched AI开创新技术将Transformer架构直接“烧录”到芯片中

美国芯片初创公司Etched AI近日宣称，他们成功开创了一项新的技术，将Transformer架构直接“烧录”到了芯片中，创造出了世界上最强大的专门用于Transformer推理的服务器。据称，这项技术可以运行万亿参数的模型，甩英伟达几百条街。官网地...

AIGC 2023-12-19 人工智能

782阅读

「X」Embedding in NLP｜神经网络和语言模型 Embedding 向量入门

在「X」Embedding in NLP 进阶系列中，我们介绍了自然语言处理的基础知识——自然语言中的 Token、N-gram 和词袋语言模型。今天，我们将继续和大家一起“修炼”，深入探讨神经网络语言模型，特别是循环神经网络，并简要了解如何生成 Embe...

AIGC 2023-12-19 人工智能

877阅读

基于onnx模型和onnx runtime推理stable diffusion

直接用diffusers的pipeline: import os from diffusers import OnnxStableDiffusionPipeline, OnnxRuntimeModel from diffusers import DDIM...

人工智能 2023-12-19 人工智能

1124阅读

ChatGPT构建离不开PyTorch，LeCun言论引热议，模型厂商不开放权重原来为此

这两天，有关开源的话题又火了起来。有人表示，「没有开源，AI 将一无所有，继续保持 AI 开放。」这个观点得到了很多人的赞同，其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。想象一下，如果工业界的 AI 研究实验室仍然封闭、没有开源代码...

人工智能 2023-12-18 人工智能

883阅读

华人团队用大模型实现“读心术”：大脑活动直接变文字

NeurIPS收录的一项新研究，让大模型也学会“读心术”了！通过学习脑电波数据，模型成功地把受试者的脑电图信号翻译成了文本。而且整个过程不需要大型设备，只要一块特制的“头巾”就能实现。这项成果名为DeWave，能在不通过侵入式设备和MRI的情况下...

大数据 2023-12-18 人工智能

902阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始，多次去...

生成式AI 2023-12-18 人工智能

960阅读

保姆级讲解 Stable Diffusion

文章目录整体代码 unet解析 self.input_blocks middle_blocks self.output_blocks 保姆级讲解 Stable Diffusion： https://mp.weixin.qq.c...

大数据 2023-12-18 人工智能

838阅读

华人团队用大模型实现“读心术”：大脑活动直接变文字 | NeurIPS 2023

NeurIPS收录的一项新研究，让大模型也学会“读心术”了! 通过学习脑电波数据，模型成功地把受试者的脑电图信号翻译成了文本。而且整个过程不需要大型设备，只要一块特制的“头巾”就能实现。这项成果名为DeWave，能在不通过侵入式设备和MRI的情况下解...

AIGC 2023-12-18 人工智能

822阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

1016阅读

大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型

图1.1 GPT-2 模型结构关于训练集，其来源都是公开数据集，无任何定制数据集，保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中，LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...

AIGC 2023-12-18 人工智能

990阅读

苹果M1芯片上运行Stable Diffusion(文字作画)

1 源码下载 git clone -b apple-silicon-mps-support https://github.com/bfirsh/stable-diffusion.git cd stable-diffusion 2 修改gitee国内...

人工智能 2023-12-18 人工智能

938阅读

我们聊聊如何增强ChatGPT处理模糊问题能力

提示工程技术可帮助大语言模型在检索增强生成系统中处理代词等复杂核心参照物。译自Improving ChatGPT’s Ability to Understand Ambiguous Prompts，作者 Cheney Zhang 是 Zilliz 的一...

人工智能 2023-12-18 人工智能

955阅读

Stable Diffusion模型运算量分析

准备模型的参数量和计算量参考: ThanatosShinji/onnx-tool: ONNX model's shape inference and MACs(FLOPs counting. (github.com 这四个模型就是Stable Dif...

人工智能 2023-12-18 人工智能

1794阅读

Llama-2大模型本地部署研究与应用测试

最近在研究自然语言处理过程中，正好接触到大模型，特别是在年初chatgpt引来的一大波AIGC热潮以来，一直都想着如何利用大模型帮助企业的各项业务工作，比如智能检索、方案设计、智能推荐、智能客服、代码设计等等，总得感觉相比传统的搜索和智能化...

大数据 2023-12-18 人工智能

1035阅读

huggingface transformers库中LlamaForCausalLM

新手入门笔记。 LlamaForCausalLM 的使用示例，这应该是一段推理代码。 from transformers import AutoTokenizer, LlamaForCausalLM model = LlamaForCausalLM....

人工智能 2023-12-17 人工智能

949阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工...

人工智能 2023-12-17 人工智能

922阅读

Stable Diffusion Webui源码剖析

1、关键python依赖（1）xformers：优化加速方案。它可以对模型进行适当的优化来加速图片生成并降低显存占用。缺点是输出图像不稳定，有可能比不开Xformers略差。（2）GFPGAN：它是腾讯开源的人脸修复算法，利用预先训练号的面部GAN...

大数据 2023-12-17 人工智能

1351阅读

LLaMA-META发布单卡就能跑的大模型

2023年2月25日，Meta使用2048张A100 GPU，花费21天训练的Transformer大模型LLaMA开源了。 1.4T tokenstakes approximately 21 days 以下是觉得论文中重要的一些要点 1）...

大数据 2023-12-17 人工智能

890阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

873阅读

windows10搭建llama大模型

背景随着人工时代的到来及日渐成熟，大模型已慢慢普及，可以为开发与生活提供一定的帮助及提升工作及生产效率。所以在新的时代对于开发者来说需要主动拥抱变化，主动成长。 LLAMA介绍 llama全称：Large...

AIGC 2023-12-17 人工智能

943阅读

AIGC和ChatGPT的区别是什么？

当谈到人工智能的聊天机器人时，人们不可避免地会想到AIGC和ChatGPT这两个备受关注的模型。虽然两者都能够进行自然语言处理，但是它们之间存在一些重要的区别，我们可以从以下几个方面来进行分析：首先，AIGC采用的是基于规则的方法，而ChatGPT则是...

大数据 2023-12-17 人工智能

1179阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1830阅读

novel Ai （stable-diffusion-webui）安装

关于novel ai的本地化安装环境英伟达显卡 win11 可以连接github并下载内容安装 python 3.10.6及以上，安装并添加到path 安装cuDNN和CUDAToolKi...

AIGC 2023-12-17 人工智能

1203阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3179阅读

AIGC｜AGI究竟是什么？为什么大家都在争先入场？

一、AI大语言模型进入爆发阶段 2022年12月ChatGPT突然爆火，原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式，但是它的内容化水平非常强大，甚至在某些方面已经超过人类了，这是人工智能...

AIGC 2023-12-16 人工智能

971阅读

LLM - Chinese-Llama-2-7b 初体验

目录一.引言二.模型下载三.快速测试四.训练数据五.总结一.引言自打 LLama-2 发布后就一直在等大佬们发布 LLama-2 的适配中文版，也是这几天蹲到了一版由 LinkSoul 发布的 Chinese-Llam...

生成式AI 2023-12-16 人工智能

956阅读

LLaMA模型之中文词表的蜕变

在目前的开源模型中，LLaMA模型无疑是一颗闪亮的⭐️，但是相对于ChatGLM、BaiChuan等国产大模型，其对于中文的支持能力不是很理想。原版LLaMA模型的词表大小是32K，中文所占token是几百个左右，这将会导致中文的编解码效率低。在将LL...

生成式AI 2023-12-16 人工智能

1180阅读

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

本文来自DataLearnerAI官方网站：重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了 | 数据学习者官方网站(Datalearner https://www.datalea...

大数据 2023-12-15 人工智能

1283阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

1002阅读

如何训练一个简单的stable diffusion模型(附详细注释）

注：代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的...

大数据 2023-12-15 人工智能

1249阅读

stable-diffusion-webui(1.2.1版本) win10系统本地电脑部署

在安装stable-diffusion-webui(1.2.1版本之前需要确认win10本地电脑具有的环境 1.显卡类型：NVIDIA（英伟达）建议显存高于4G以上，这样512*512的还是可以运行的 2.python(版本必须最好是3.10.6...

生成式AI 2023-12-14 人工智能

1162阅读

六大赛道十项技术：智能体、3D生成引爆AI，空间计算开启终端变革

两千年前的古人穿越到一千年前后，需要适应的东西可能不多。而一千前的古人穿越到一百年前，变化也不至于大到难以适应。但如果一百年前的古人穿越到现在，甚至只是有人“冬眠”10年、20年，面对的现实世界的变化，恐怕会是天翻地覆。日新月异的技术进步，正不断带来颠覆...

大数据 2023-12-14 人工智能

832阅读

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每个词（token）的生成都需要进行一次前向传播，需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。近日，滑铁...

AIGC 2023-12-14 人工智能

817阅读

Stable Diffusion - SD v1.6+ 版本导致 BLIP Interrogate CLIP (CLIP 反推) 功能 RuntimeError 异常

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132994678 图像来源于麦橘写实_MajicMIX_R...

大数据 2023-12-14 人工智能

1492阅读

AI-多模态-文本-＞图像-2021：Stable Diffusion【开源】【目前开源模型中最强】

最近大火的Stable Diffusion也开源了(20220823 ; 我也本地化测试了一下效果确实比Dall-E mini强太多了，对于我们这些玩不上Dall-E2的这个简直就是就是捡钱的感觉，当然后期跑起来，稍微不注意显存就炸了。这里我写一下安...

大数据 2023-12-14 人工智能

950阅读

低代码！小白用10分钟也能利用flowise构建AIGC| 业务问答 | 文本识别 | 网络爬虫

一、与知识对话二、采集网页问答三、部署安装flowise flowise工程地址：https://github.com/FlowiseAI/Flowise flowise 官方文档：https://docs.flowiseai.co...

人工智能 2023-12-14 人工智能

960阅读

LLM__llama-7B模型试验

llama模型已经开源很久了，所以拿做小的模型做了个简单尝试一、服务器购买与配置 1.1 服务器购买因为做简单尝试并不打算长期持有，所以以便宜、够用、好退货为主要参考依据购买阿里云服务器、我看7B的模型权重大小就13GB，所以先购入一个 3...

人工智能 2023-12-13 人工智能

1088阅读

聊聊最近chatGPT对程序员的焦虑攻击

最近各种自媒体都在叛卖gpt职业焦虑，连程序圈子也不能幸免。甚至有正准备入行的同学私信我到底计算机还能不能学，研究生还能不能读。我985硕毕业，呆过大厂和小厂，现工作5年的程序员，抛开那些胡吹海谈的软文，想和大家深入聊聊chatgpt和...

AIGC 2023-12-13 人工智能

867阅读

微软小模型击败大模型：27亿参数，手机就能跑

上个月，微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源，在常识推理、语言理解和逻辑推理方面的性能显著改进。今天，微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...

人工智能 2023-12-13 人工智能

836阅读

Hugging News #0814: Llama 2 学习资源大汇总

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...

生成式AI 2023-12-13 人工智能

859阅读

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

CLIP是目前最流行的视觉基座模型，其应用场景包括但不限于：与LLM大语言模型结合成为视觉多模态大模型；作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model，实现image-to-3D；用于...

生成式AI 2023-12-13 人工智能

1081阅读