llama 第33页 - AIGC资讯

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

大语言模型序列长度的限制，极大地制约了其在人工智能领域的应用，比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...

人工智能 2024-01-18 人工智能

796阅读

AIGC新岗位新机会解析；GPTs万字教程；28套提示词让人物情绪饱满；爆款AI搜索引擎RAG实践分享；AI独立创始人成长手册；LangChain年度洞察 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 北京互联网法院审理全国首例「AI声音侵权案」，五被告都否认侵权补充一份背景：点击了解事件说明与当前进展 ⋙ AI生成图片著作权侵权第一案、...

AIGC 2024-01-18 人工智能

745阅读

Stability AI发布全新代码模型Stable Code 3B，媲美70亿Code Llama，没GPU也能跑

今天，Stability AI发布了自家在2024年的第一个模型——Stable Code3B。顾名思义，Stable Code3B专注于代码能力，实际的表现也是非常亮眼。在仅仅3B参数的规模之下，达到了比肩Code Llama7B的效果。相...

生成式AI 2024-01-18 人工智能

760阅读

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1006阅读

【Stable diffusion inpaiting】训练自己数据集

https://github.com/advimman/lama/tree/7dee0e4a3cf5f73f86a820674bf471454f52b74f prepare your data: 1 Create masks named as `[...

大数据 2024-01-18 人工智能

732阅读

七个值得关注的优秀大语言模型（LLM）

在LLM领域我们了解最多的很可能是OpenAI的ChatGPT，以及最近在多模态表现非常出色的Google Gemini，这些都是AI大模型的领头羊，代表着AI大模型发展的先进成果。然而，在大模型的实际应用中必须要综合考虑成本、信息安全等内容，因此，开源...

生成式AI 2024-01-17 人工智能

1573阅读

Stability AI开年首个大模型：专写代码，支持18种编程语言，上下文100K，苹果笔记本离线就能跑

Stability AI开年第一个大模型来了！名为Stable Code 3B，参数27亿，专为写代码而生。 Stable Code 3B可理解处理18种不同的编程语言，上下文长度100K token。且它对硬件要求也不高，用MacBook Air...

人工智能 2024-01-17 人工智能

676阅读

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama: Towards Foundation Models for Time Series Forecasting 摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取...

生成式AI 2024-01-17 人工智能

1006阅读

Stability AI发布全新代码模型Stable Code 3B！媲美70亿Code Llama，没GPU也能跑

今天，Stability AI发布了自家在2024年的第一个模型——Stable Code 3B。图片顾名思义，Stable Code 3B专注于代码能力，实际的表现也是非常亮眼。在仅仅3B参数的规模之下，达到了比肩Code Llama 7B的效果...

人工智能 2024-01-17 人工智能

732阅读

Stability AI发布Stable Code3B填补AI代码生成的空白

在AI领域，Stability AI公司于2024年推出了其首个新型人工智能模型:商业许可的（通过会员资格）Stable Code3B。该模型仅拥有30亿参数，专注于软件开发的代码完成能力，可在没有专用GPU的笔记本上本地运行，并在性能上具有竞争力，可与M...

人工智能 2024-01-17 人工智能

767阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

698阅读

在文心一言超越ChatGPT3.5后，我们做了大模型对比测试。

IDC发布的AI大模型评估报告中，文心一言拿下12个指标中的7个满分，综合评分第一。百度副总裁吴甜表示，新版文心一言已超越ChatGPT3.5。这是令人振奋的新闻。不过，我们还没能体验到文心一言。除了文心一言，号称超过ChatGPT3.5大模型，还有g...

大数据 2024-01-17 人工智能

686阅读

基于ChatGPT的代码解释神器：GPT Academic、GitHub Copilot

（个人推荐使用第二个GitHub Copilot） 1. GPT 学术优化 (GPT Academic 工具简介 GPT Academic是什么为ChatGPT/GLM提供实用化交互界面，特别优化论文阅读/润色/写作体验，模块化设计，支持自定...

生成式AI 2024-01-17 人工智能

1390阅读

使用 DPO 微调 Llama 2

简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模型的输出符合人类在闲聊或安全...

生成式AI 2024-01-17 人工智能

779阅读

用 llama.cpp 跑通 mixtral MoE 模型

这里是用 llama.cpp 跑通 mixtral MoE 模型视频的笔记哦。主要命令安装 huggingface_hub: pip install huggingface_hub -U 下载模型 huggingface-cli down...

生成式AI 2024-01-16 人工智能

796阅读

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。...

生成式AI 2024-01-16 人工智能

742阅读

Portkey AI Gateway：一个连接多种人工智能模型的开源工具

Portkey AI Gateway是一个开源工具，旨在连接多种人工智能模型。该工具允许开发者通过简单的API接口访问超过100种不同的大语言模型，包括OpenAI、Anthropic、Mistral、LLama2、Anyscale、Google Gemi...

AIGC 2024-01-16 人工智能

706阅读

本地搭建【文档助手】大模型版（LangChain+llama+Streamlit）

概述本文的文档助手就是：我们上传一个文档，然后在对话框中输入问题，大模型会把问题的答案返回。安装步骤先下载代码到本地 LangChain调用llama模型的示例代码：https://github.com/afaqueumer/DocQA（代...

AIGC 2024-01-16 人工智能

876阅读

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

747阅读

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

前言近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...

大数据 2024-01-16 人工智能

974阅读

[玩转AIGC]LLaMA2训练中文文章撰写神器（数据准备，数据处理，模型训练，模型推理）

目录一、下载并加载中文数据集二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1）先将一篇篇文本拼凑到一起（只是简单的拼凑一起，用于训练tokenizer） 2）将数据集进行合并 3、数据集处理之模型（ll...

AIGC 2024-01-16 人工智能

741阅读

LLM系列 | 22 : Code Llama实战(下篇)：本地部署、量化及GPT-4对比

引言模型简介依赖安装模型inference 代码补全 4-bit版模型代码填充指令编码 Code Llama vs ChatGPT vs GPT4 小结引言青山隐隐水迢迢，秋尽江南草未凋。...

人工智能 2024-01-16 人工智能

887阅读

基于llama-index对embedding模型进行微调

QA对话目前是大语言模型的一大应用场景，在QA对话中，由于大语言模型信息的滞后性以及不包含业务知识的特点，我们经常需要外挂知识库来协助大模型解决一些问题。在外挂知识库的过程中，embedding模型的召回效果直接影响到大模型的回答效果，因此，在许多场景下，...

大数据 2024-01-15 人工智能

1861阅读

GPT-5前瞻！GPT-5将具备哪些新能力？

Sam Altman在整个AI领域，乃至整个科技领域都被看作是极具影响力的存在，而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感，他甚至被《时代》杂志评为“2023年度CEO”。也正因此， Sam Altman的一条推文，...

大数据 2024-01-15 人工智能

855阅读

【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

人工智能 2024-01-15 人工智能

1718阅读

Transformer的无限之路：位置编码视角下的长度外推综述

在自然语言处理（Natural Language Processing，NLP）领域，Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而，Transformer 及在其基础之上的大语言模型（Large Language Model...

大数据 2024-01-15 人工智能

750阅读

大模型部署手记（13）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+LangChain+摘要问答

1.简介：组织机构：Meta（Facebook）代码仓：GitHub - facebookresearch/llama: Inference code for LLaMA models 模型：chinese-alpaca-2-7b-hf、text...

AIGC 2024-01-15 人工智能

840阅读

使用langchain及llama_index实现基于文档（长文本）的相似查询与询问

文章目录 1. 引言 2. 简介 3. 带关键字的查询方案 4. 不带关键字的总结询问 5. 实现代码 1. 引言在调用ChatGPT接口时，我们常常受到4096个字符（token）的限制。这种限制对于处理长文本或者需要对文档进...

大数据 2024-01-15 人工智能

902阅读

Mistral AI推出Mixtral 8x7B：一种改变机器学习的SMoE语言模型效果堪比GPT-3.5

## 划重点: 1. ? **创新模型介绍:** Mistral AI 的研究团队推出了基于 Sparse Mixture of Experts（SMoE）模型的 Mixtral8x7B 语言模型，采用开放权重。 2. ? **性能突出:** Mixtra...

人工智能 2024-01-15 人工智能

903阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

811阅读

精确指出特定事件发生时间！字节&复旦大学多模态大模型解读视频太香了

字节&复旦大学多模态理解大模型来了：可以精确定位到视频中特定事件的发生时间。比如在下面这个视频中：狗子转身看镜头时的时间戳是多少？什么时候用爪子推开滑板？在这里，视频中的宝宝什么时候推起眼镜、舒展了一下身体？又是什么时候翻的书？对...

生成式AI 2024-01-15 人工智能

704阅读

当AI变成“守法公民”，为何用户反而不爱它了

ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在，但投入AI大模型赛道的显然远远不止OpenAI一家，例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢，比如创业...

大数据 2024-01-15 人工智能

737阅读

AIGC内容分享(十三)：2023年中国AIGC产业全景报告

目录核心摘要中国AIGC产业之“变”与"新技术变革的原始驱力：大模型层价值传递的实际落位：应用层不可忽视的资源引擎：算力层中国AIGC产业之发展趋势核心摘要古人有云：日就月将，学有缉熙于光明。人类对人工智能学的潜心钻研...

生成式AI 2024-01-15 人工智能

754阅读

一文读懂 LLM 可观测性

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型可观测性，本文将继续聚焦在针对 LLM 的可观测性进行解析，使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...

生成式AI 2024-01-15 人工智能

1229阅读

LLaMA开源大模型源码分析！

Datawhale干货作者：宋志学，Datawhale成员花了一晚上照着transformers仓库的LLaMA源码，把张量并行和梯度保存的代码删掉，只留下模型基础结构，梳理了一遍LLaMA的模型结构。今年四月份的时候，我第一次...

生成式AI 2024-01-15 人工智能

1064阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1052阅读

探索AIGC未来：CPU源码优化、多GPU编程与中国算力瓶颈与发展

★人工智能；大数据技术;AIGC;Turbo;DALL·E 3;多模态大模型；MLLM；LLM；Agent；Llama2；国产GPU芯片；GPU;CPU；高性能计算机；边缘计算；大模型显存占用；5G;深度学习；A100；H100；A800；H800；L40...

生成式AI 2024-01-14 人工智能

794阅读

【AI实战】llama.cpp 量化部署 llama-33B

【AI实战】llama.cpp 量化部署 llama-33B llama.cpp 量化介绍环境配置安装 llama.cpp 拉取 llama.cpp 仓库代码编译llama.cpp 生成量化版本模型模型准备将上述.pth模型权重...

AIGC 2024-01-14 人工智能

1091阅读

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研...

大数据 2024-01-14 人工智能

867阅读

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

北大团队新作，让大模型拥有个性! 而且还是自定义那种，16种MBTI都能选。图源备注：图片由AI生成，图片授权服务商Midjourney 这样一来，即便是同一个大模型，不同性格下的回答都不一样。比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...

大数据 2024-01-14 人工智能

749阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜2＞

3.2 人类反馈强化学习（RLHF） RLHF 是一种模型训练过程，应用于微调的语言模型，以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据，人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...

大数据 2024-01-14 人工智能

859阅读

LLaMA-v2-Chat vs. Alpaca：应该在什么时候使用不同的人工智能模型？

译者 | 李睿审校 | 重楼如今，大型语言模型（LLM）正在彻底改变人们的工作和生活，从语言生成到图像字幕软件，再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具，例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...

大数据 2024-01-14 人工智能

790阅读

谷歌MIT最新研究证明：高质量数据获取不难，大模型就是归途

获取高质量数据，已经成为当前大模型训练的一大瓶颈。前几天，OpenAI被《纽约时报》起诉，并要求索赔数十亿美元。诉状中，列举了GPT-4抄袭的多项罪证。甚至，《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。一直以来，AI界多位大佬认为「合成数据」...

人工智能 2024-01-13 人工智能

673阅读

AI视野：ComfyUI Lora训练节点来了；“ChatGPT之父”结婚；Topazlabs推视频高清放大工具Topaz Video AI4；阿里云推出第八代企业级实例g8i

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 ComfyUI...

人工智能 2024-01-13 人工智能

694阅读

AIGC：阿里开源大模型通义千问部署与实战

1 引言通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代...

AIGC 2024-01-13 人工智能

1321阅读

首个国产开源MoE大模型来了！性能媲美Llama 2-7B，计算量降低60%

开源MoE模型，终于迎来首位国产选手！它的表现完全不输给密集的Llama 2-7B模型，计算量却仅有40%。这个模型堪称19边形战士，特别是在数学和代码能力上对Llama形成了碾压。它就是深度求索团队最新开源的160亿参数专家模型DeepSeek...

大数据 2024-01-13 人工智能

772阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

823阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1012阅读

Jetson Orin安装riva以及llamaspeak，使用 Riva ASR/TTS 与 Llama 进行实时交谈，大语言模型成功运行笔记

NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外，RIVA 可以构建应用程序，在本地设备（如 NVIDIA Jetson）上处理所有这些内容。 RIVA 是一个综合性库，包括：自动语音识别（ASR）文本转语音合成（TT...

生成式AI 2024-01-08 人工智能

1032阅读