llama 第39页 - AIGC资讯

Meta 首席科学家 Yann LeCun 认为 AI 超级智能不会很快到来，对量子计算持怀疑态度

在 Meta 庆祝其基础 AI 研究团队成立 10 周年的活动中，该公司首席科学家兼深度学习先驱 Yann LeCun 表达了对当前人工智能系统发展的看法。LeCun 认为，现有 AI 系统距离达到某种程度的自我意识，具备推动其能力超越仅仅以创造性方式总结...

大数据 2023-12-04 人工智能

798阅读

本地部署中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型（本博客）博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型简介 LLaMA大部分是英文语料训练的，讲中文能...

大数据 2023-12-04 人工智能

708阅读

Meta教你5步学会用Llama2：我见过最简单的大模型教学

在这篇博客中，Meta 探讨了使用 Llama 2 的五个步骤，以便使用者在自己的项目中充分利用 Llama 2 的优势。同时详细介绍 Llama 2 的关键概念、设置方法、可用资源，并提供一步步设置和运行 Llama 2 的流程。 Meta 开源的 L...

生成式AI 2023-12-03 人工智能

675阅读

LLaMA-Adapter源码解析

LLaMA-Adapter源码解析伪代码 def transformer_block_with_llama_adapter(x, gating_factor, soft_prompt : residual =x y= zero_init_...

生成式AI 2023-12-03 人工智能

672阅读

LLaMA模型微调版本：斯坦福 Alpaca 详解

项目代码：https://github.com/tatsu-lab/stanford_alpaca 博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html Alpaca 总览 Alpaca 是 L...

AIGC 2023-12-03 人工智能

696阅读

专注图表理解，腾讯、南洋理工等开源图表羊驼大模型ChartLlama

在图像理解领域，多模态大模型已经充分展示了其卓越的性能。然而，对于工作中经常需要处理的图表理解与生成任务，现有的多模态模型仍有进步的空间。尽管当前图表理解领域中的最先进模型在简单测试集上表现出色，但由于缺乏语言理解和输出能力，它们无法胜任更为复杂的问答...

大数据 2023-12-03 人工智能

781阅读

Meta语言模型LLaMA解读：模型的下载部署与运行代码

文章目录 llama2 体验地址模型下载下载步骤准备工作什么是Git LFS 下载huggingface模型模型运行代码 llama2 Meta最新语言模型LLaMA解读，LLaMA是Facebook AI Re...

AIGC 2023-12-03 人工智能

963阅读

单个消费级GPU笔记本win电脑测试LLaMA模型

1、LLaMa模型代码： GitHub - facebookresearch/llama: Inference code for LLaMA models 不同模型对参数规模要求不同，有7B、13B、30B(33B 和65B四个...

生成式AI 2023-12-03 人工智能

630阅读

大模型入门（一）—— LLaMa/Alpaca/Vicuna

LLaMa模型是Meta开源的大模型，模型参数从7B到65B不等，LLaMa-7B在大多数基准测试上超过了GPT3-173B，而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说，LL...

大数据 2023-12-02 人工智能

693阅读

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本、安装、使用方法之详细攻略导读：2023年9月25日，Colossal-AI团队推出了开源模型Colos...

AIGC 2023-12-02 人工智能

920阅读

本地部署LLaMA-中文LoRA部署详细说明

在Ubuntu18.04 部署中文LLaMA模型环境准备硬件环境 AMD 5950X 128GB RAM RTX 3090(24G VRAM 操作系统 Ubuntu 18.04 编译环境(可选 llama...

大数据 2023-12-02 人工智能

950阅读

谷歌AI Core迎来首个更新，要为端侧大模型赋能

继全面屏和5G之后，智能手机行业缺乏新故事已经是不争的事实。好在，2023年AI大模型的浪潮似乎解了手机厂商的燃眉之急，端侧大模型近来俨然成为了诸多手机厂商挂在嘴边的词，例如OPPO端出了安第斯大模型（AndesGPT）、vivo发布了蓝心大模型、小米方面...

大数据 2023-12-02 人工智能

659阅读

LLaMA: Open and Efficient Foundation Language Models

背景用最少的计算资源，解决了LLM大模型预测问题，训练了一些列的LLaMa模型，在参数量比较少的情况下，达到业界大模型效果。主要贡献就是提升了LLM模型的训练速度和效率，在小容量的基础上，大大提升了模型的效果。同时由于模型结构更小更简单，大大提升...

AIGC 2023-12-02 人工智能

690阅读

[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)

目录一、前言二、安装三、自己训练一个tokenizer 四、模型运行五、拓展六、补充一、前言前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）这种方式是对一个一个...

生成式AI 2023-12-02 人工智能

800阅读

为什么多数情况下GPT-3.5比LLaMA 2更便宜？

本文旨在为用户选择合适的开源或闭源语言模型提供指导，以便在不同任务需求下获得更高的性价比。通过测试比较 LLaMA-2 和 GPT-3.5 的成本和时延，本文作者分别计算了二者的 1000 词元成本，证明在大多数情况下，选择 GPT...

生成式AI 2023-12-02 人工智能

733阅读

文献阅读：LLaMA: Open and Efficient Foundation Language Models

文献阅读：LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...

AIGC 2023-12-01 人工智能

709阅读

720亿参数大模型都拿来开源了！通义千问开源全家桶，最小18亿模型端侧都能跑

「Qwen-72B 模型将于 11 月 30 日发布。」前几天，X 平台上的一位网友发布了这样一则消息，消息来源是一段对话。他还说，「如果（新模型）像他们的 14B 模型一样，那将是惊人的。」有位网友转发了帖子并配文「千问模型最近表现不错」。这句话...

大数据 2023-12-01 人工智能

805阅读

280万大模型中文开发者拿到最后一块拼图

2023年5月，微软CEO纳德拉抛出一个惊人数字，未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月，但一些国内的开发者发现，从小以英文语料喂养起来的Llama，对中文世界并不友好。这未来的“10亿”开发者里会有多少中文开发者...

生成式AI 2023-12-01 人工智能

713阅读

通义千问开源720亿参数大模型Qwen-72B

通义千问在开源领域迎来重大突破，推出了一系列全家桶模型，包括参数从18亿到720亿的多款模型，涵盖了各种应用场景。其中，Qwen-72B模型的开源在性能上实现了突破，成为目前性能最强的开源模型之一。在多个权威基准测评中，Qwen-72B表现出色，超越了同规...

生成式AI 2023-12-01 人工智能

825阅读

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

1.简介：组织机构：Meta（Facebook）代码仓：https://github.com/facebookresearch/llama 模型：chinese-alpaca-2-7b-hf 下载：使用百度网盘下载硬件环境：暗影精灵7Plu...

大数据 2023-12-01 人工智能

823阅读

ChatGPT新漏洞：失控背出个人隐私泄露训练数据，OpenAI修复后依然有效

ChatGPT最新漏洞曝光，一句话就能让训练数据原封不动地泄露。只需要让它重复一个词，它就会在一定次数后“发疯”，甚至毫无防备说出某人的个人隐私信息。 DeepMind的研究人员联合华盛顿大学、康奈尔大学等高校，发现了ChatGPT的数据泄露漏洞。...

生成式AI 2023-12-01 人工智能

717阅读

使用PyTorch加速生成式 AI模型

PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT， Fast》的博文，重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。正如最近在PyTorch 开发者大会上...

生成式AI 2023-12-01 人工智能

1054阅读

【LLM系列之底座模型对比】LLaMA、Palm、GLM、BLOOM、GPT模型结构对比

LLama [GPT3] 使用RMSNorm（即Root Mean square Layer Normalization）对输入数据进行标准化，RMSNorm可以参考论文：Root mean square layer normalization。 [...

大数据 2023-12-01 人工智能

857阅读

解读Lawyer LLaMA，延申专业领域大模型微调：数据集构建，模型训练

解读Lawyer LLaMA，延申自己领域大模型微调：数据集构建，模型训练项目地址link 自己领域的大模型微调，实现思路大都和这篇文章是一样的，有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型，本文基于自己训...

人工智能 2023-12-01 人工智能

902阅读

分享：前端开发使用的各类 AI Copilot 辅助开发

前言不会现在还有哪位码农没用过AI辅助编程工具吧？网上各种当生意一样教直接使用的，但是这种方式是不合规的，这里不推荐。为了不再被封，本文会避免使用无关的关键词。虽然因为种种原因，无法直接使用。但现如今，已经有的很多合规方式可以让我们稳定使用了...

生成式AI 2023-12-01 人工智能

940阅读

用上这个工具包，大模型推理性能加速达40倍

英特尔® Extension for Transformer是什么？英特尔® Extension for Transformers[1]是英特尔推出的一个创新工具包，可基于英特尔® 架构平台，尤其是第四代英特尔® 至强® 可扩展处理器（代号Sapp...

生成式AI 2023-11-30 人工智能

944阅读

英特尔推Extension for Transformers工具包大模型推理性能提升40倍

在当前技术发展的背景下，英特尔公司推出的Extension for Transformers工具包成为一个重要创新，实现了在CPU上对大型语言模型（LLM）推理性能的显著加速。该工具包通过LLM Runtime技术，优化了内核，支持多种量化选择，提供更优的...

人工智能 2023-11-30 人工智能

701阅读

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm 已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长，推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。所以本文将在多个gpu上并行执行推理，主要包括：Accelerate库介绍，简单的方法与工...

AIGC 2023-11-30 人工智能

712阅读

ChatGPT狂吐训练数据，还带个人信息：DeepMind发现大bug引争议

如果我不停地让 ChatGPT 干一件事，直到把它「逼疯」会发生什么？它会直接口吐训练数据出来，有时候还带点个人信息，职位手机号什么的：本周三，Google DeepMind 发布的一篇论文，介绍了一项让人颇感意外的研究成果：使用大约 200 美元...

大数据 2023-11-30 人工智能

656阅读

聊一聊大模型 | 京东云技术团队

事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT，一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界，各大巨头也纷纷跟进发布了自家的大模...

生成式AI 2023-11-30 人工智能

661阅读

LLM-LLaMA：手动模型转换与合并【Step 1: 将原版LLaMA模型转换为HF(HuggingFace)格式；Step 2: 合并LoRA权重，生成全量模型权重】

准备工作运行前确保拉取仓库最新版代码：git pull 确保机器有足够的内存加载完整模型（例如7B模型需要13-15G）以进行合并模型操作。务必确认基模型和下载的LoRA模型完整性，检查是否与SHA256.md所示的值一致，否则无法进行合并...

AIGC 2023-11-30 人工智能

1034阅读

苹果前员工创立新AI公司，致力将生成式AI引入桌面

三位曾在苹果工作的前员工创立了一家名为“软件应用有限公司（Software Applications Incorporated）”的新创企业，旨在通过引入生成式人工智能，重新定义桌面计算机的使用体验。这三位创始人分别是首席执行官 Ari Weinstei...

AIGC 2023-11-30 人工智能

731阅读

使用 RLHF 训练 LLaMA 的实践指南：StackLLaMA

由于LLaMA没有使用RLHF，后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习，得到了ChatLLaMA模型，详情请参考：Meta开源的LLaMA性能真如论文所述吗？如果增加RLH...

人工智能 2023-11-30 人工智能

837阅读

LLaMA 的学习笔记

LLaMA 是一种用于自然语言处理的深度学习模型，它的全称是 Language Learning with Adaptive Multi-task Architecture。它的主要特点是能够根据不同的任务自适应地调整模型结构和参数，从而提高模型的泛化能力...

人工智能 2023-11-30 人工智能

831阅读

使用LLM插件从命令行访问Llama 2

大家好，最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2，这是一项非常重要的进展。Facebook最初的LLaMA模型于今年2月发布，掀起了开源LLM领域的创新浪潮——从微调变体到从零开始的再创造。如果在Llama 2版本...

人工智能 2023-11-30 人工智能

766阅读

Llama 2 来袭 - 在 Hugging Face 上玩转它

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！引言今天，Meta 发布了 Llama 2，其包含了一系列最先进的开放大语言模型，我们很高兴能够将其全面集成入 Hugging Face，并全力支持其发布。Llama 2...

生成式AI 2023-11-29 人工智能

710阅读

亚马逊AWS欲在GenAI领域和微软展开竞争

在周一接受VentureBeat采访时，亚马逊AWS负责数据和AI的副总裁斯瓦米·西瓦苏布拉曼尼亚负责监管所有AWS数据库、分析、ML和GenAI服务，他概述了周三上午的主旨演讲和周二上午AWS首席执行官亚当·塞利普斯基的主旨演讲。他说，围绕GenA...

生成式AI 2023-11-29 人工智能

668阅读

大模型部署实战（一）——Ziya-LLaMA-13B

❤️觉得内容不错的话，欢迎点赞收藏加关注???，后续会继续输入更多优质内容❤️ ?有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）? 博主原文链接：https://www.yo...

生成式AI 2023-11-29 人工智能

802阅读

北大最新多模态大模型开源：在混合数据集上训练，无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型，只需3天！北大和中山大学团队又出招了——在最新研究中，研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架，可以大大减少VLM（视觉语言大模型）在训练和推理过程中的开销。具体而言，团队按照提出的新框架...

人工智能 2023-11-29 人工智能

726阅读

训练130亿大模型仅3天，北大提出Chat-UniVi统一图片和视频理解

论文地址：https://arxiv.org/pdf/2311.08046.pdf GitHub 地址：https://github.com/PKU-YuanGroup/Chat-UniVi Huggingface 地址：https://huggi...

人工智能 2023-11-29 人工智能

711阅读

研究人员发布Starling-7B：基于AI反馈的大语言模型媲美GPT-3.5

UC伯克利的研究人员最近发布了Starling-7B，这是一款基于AI反馈强化学习（RLAIF）的开放式大语言模型(LLM 。该模型基于精调的Openchat3.5，并继承了Mistral-7B的特性。在RLAIF中，研究人员借助其他AI模型的反馈来训练...

AIGC 2023-11-29 人工智能

735阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1324阅读

Code Llama系列教程之微调 CodeLlama 34B 以进行聊天（打造自己的代码AI）

虽然 Meta 的 Llama2 在 AI 领域引起了广泛关注，但 34b 模型却缺席了相当长一段时间。对于许多人来说，这个 34b 模型是运行本地 LLM 的理想选择，因为它与使用 4 位量化的单个 4090 GPU 兼容。我一直在热切地等待 Meta...

人工智能 2023-11-29 人工智能

850阅读

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

AIGC 2023-11-29 人工智能

912阅读

Peft库使用技巧（一）：合并基座模型与Lora模型【使用Peft库微调基座模型（比如LLaMA-7B）后会得到Lora参数模块，将基座模型与Lora参数合并后才能得到完整的微调后的大模型】

生成式AI 2023-11-28 人工智能

804阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1083阅读

decapoda-research/llama-7b-hf 的踩坑记录

使用transformers加载decapoda-research/llama-7b-hf的踩坑记录。 ValueError: Tokenizer class LLaMATokenizer does not exist or is not curre...

生成式AI 2023-11-28 人工智能

735阅读

大模型之Bloom&LLAMA----RHLF(强化学习)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-28 人工智能

804阅读

一个提示，让Llama 2准确率飙至80.3%？Meta提出全新注意力机制S2A，大幅降低模型幻觉

2023的科技界，可以说是被大模型抢尽了风头（虚假的室温超导除外）。我们经历了和LLM对话，见证了它们逐渐进入各个领域，甚至开始感受到威胁。这一切，仅仅发生在一年之内。当然了，基于大语言模型的原理，它诞生之时就有的一些毛病到现在也没有完全改正。比...

大数据 2023-11-28 人工智能

823阅读

通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用

来自 Meta 的 Llama 2 基础模型现已在 Amazon SageMaker JumpStart 中提供。我们可以通过使用 Amazon SageMaker JumpStart 快速部署 Llama 2 模型，并且结合开源 UI 工具...

人工智能 2023-11-28 人工智能

734阅读