transformer 第10页

【AIGC】本地部署 ollama(gguf) 与项目整合

首先，先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题，虽然代码可以跑通，但是中小型企业想通过该代码实现项目落地还是比较困难的。为此，本文将采用 GGUF 预量化大模型结合 O...

生成式AI 2024-06-03 人工智能

1232阅读

原来这才是生成式AI！

随着ChatGPT、文心一言等AI产品的火爆，生成式AI已经成为了大家茶余饭后热议的话题。可是，为什么要在AI前面加上“生成式”这三个字呢？难道还有别的AI吗？且听文档君慢慢道来~ 1.生成式AI究竟是个啥？如果将人工智能按照用途进行简单分类的话...

人工智能 2024-06-03 人工智能

952阅读

7B？13B？175B？解读大模型的参数

大模型也是有大有小的，它们的大小靠参数数量来度量。GPT-3就有1750亿个参数，而Grok-1更是不得了，有3140亿个参数。当然，也有像Llama这样身材苗条一点的，参数数量在70亿到700亿之间。这里说的70B可不是指训练数据的数量，而是指模型中...

生成式AI 2024-06-03 人工智能

1478阅读

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实...

大数据 2024-06-03 人工智能

878阅读

斯坦福爆火Llama3-V竟抄袭国内开源项目，作者火速删库

在 GPT-4o 出世后，Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5，甚至在某些方面超越了 GPT-4。这次就要闷声...

AIGC 2024-06-03 人工智能

864阅读

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现，包括GPT-4在内的10个大模型，生成达到128k甚至1M上下文长度的都有。但一番考验下来，在新指标“有效上下文”上缩水严重，能达到32K的都不多。新基准名为RULER，包含检索、多跳追踪、...

大数据 2024-06-03 人工智能

811阅读

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

改进Transformer核心机制注意力，让小模型能打两倍大的模型！ ICML 2024高分论文，彩云科技团队构建DCFormer框架，替换Transformer核心组件多头注意力模块（MHA），提出可动态组合的多头注意力（DCMHA）。 DCMHA解除...

AIGC 2024-06-03 人工智能

827阅读

时间序列分析的表示学习时代来了？

表示学习作为深度学习中的核心，近期越来越多的被应用到了时间序列领域中，时间序列分析的表示学习时代已经来了。本文为大家带来了2020年以来顶会的5篇时间序列表示学习相关的核心工作梳理。 1.Unsupervised Scalable Representa...

大数据 2024-06-03 人工智能

877阅读

知识图谱检索增强的GraphRAG(基于Neo4j代码实现）

图检索增强生成（Graph RAG）正逐渐流行起来，成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性，将数据以节点和关系的形式组织起来，从而增强检索信息的深度和上下文关联性。图在表示和存储多样化且相互关联的信息方面具有天然优势，能够轻松捕...

生成式AI 2024-06-03 人工智能

1416阅读

AIGC-音频生产十大主流模型技术原理及优缺点

音频生成(Audio Generation 指的是利用机器学习和人工智能技术，从文本、语音或其他源自动生成音频的过程。音频生成行业是AIGC技术主要渗透的领域之一。AI音频生成行业是指利用人工智能技术和算法来生成音频内容的领域。按照输入...

AIGC 2024-06-03 人工智能

1902阅读

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某...

生成式AI 2024-06-03 人工智能

856阅读

基于llama.cpp的GGUF量化与基于llama-cpp-python的部署

前言：笔者在做GGUF量化和后续部署的过程中踩到了一些坑，这里记录一下。 1.量化项目地址：llama.cpp 1.1 环境搭建笔者之前构建了一个用于实施大模型相关任务的docker镜像，这次依然是在这个镜像的基础上完成的，这里给出Dock...

人工智能 2024-06-03 人工智能

1865阅读

LLM的「母语」是什么？

大语言模型的「母语」是什么？我们的第一反应很可能是：英语。但事实果真如此吗？尤其是对于能够听说读写多种语言的LLM来说。对此，来自EPFL（洛桑联邦理工学院）的研究人员发表了下面这篇工作来一探究竟：图片论文地址：https://arxiv.or...

生成式AI 2024-06-03 人工智能

856阅读

llama_factory微调QWen1.5

GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMsUnify Efficient Fine-Tuning of 100+ LLMs. Contribute to...

生成式AI 2024-06-03 人工智能

1377阅读

探索文心一言指令：AI与自然语言处理的新篇章

引言：自然语言处理与文心一言指令的探索（1）自然语言处理的发展及其重要性自然语言处理（NLP）是人工智能（AI）的一个关键领域，致力于使机器能够理解、解释和响应人类语言的方式。自从20世纪50年代计算机科学诞生以来，NLP已经从简单的模式识...

大数据 2024-06-03 人工智能

1193阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1057阅读

时间序列模型：lag-Llama

项目地址：GitHub - time-series-foundation-models/lag-llama: Lag-Llama: Towards Foundation Models for Probabilistic Time Series Foreca...

大数据 2024-06-02 人工智能

1255阅读

首次解密Claude 3大脑！25岁Anthropic参谋长预言3年内自己将被AI淘汰

【新智元导读】Anthropic的25岁参谋长自曝因为深感AGI，未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说，Claude3模型已经初现AGI了吗? 今天，整个AI社区被这篇文章刷屏了。来自AI明星初创公司A...

AIGC 2024-06-02 人工智能

863阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

生成式AI 2024-06-02 人工智能

1071阅读

“全网最全”LLM推理框架集结营 | 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国...

人工智能 2024-06-02 人工智能

2493阅读

AIGC 技术及应用初探

ChatGPT 相关话题近一年多来被刷爆，利用 AI 技术生成内容，引起了各行各业的关注。其实，自2022 年 4 月起，OpenAI、Google、Microsoft 相继发布了文生图模型，视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也...

人工智能 2024-06-01 人工智能

884阅读

AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型轻松文生视频

AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 ?轻松文生视频学习前言源码下载地址技术原理储备（DIT/Lora/Motion Module）什么是Diffusion Transformer (DiT ...

大数据 2024-06-01 人工智能

969阅读

Llama 3 模型家族构建安全可信赖企业级AI应用之 CyberSecEval 2：量化 LLM 安全和能力的基准（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-01 人工智能

1093阅读

Sora底层技术原理：Stable Diffusion运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊...

AIGC 2024-06-01 人工智能

965阅读

LLaMA参数微调方法

1.Adapter Tuning：嵌入在transformer中新增了一个名为adapter的结构，其核心思想是保持模型其他原始参数不变，只改变adapter的参数，其结构如下图所示： 1.在每一个transformer模块最后都加入一层ada...

AIGC 2024-06-01 人工智能

959阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1039阅读

【史上最全之 ChatGPT 和文心一言对比】

ChatGPT 和文心一言哪个更好用？在当今的AI助手领域中，ChatGPT与文心一言无疑是备受瞩目的两位选手。两者分别由美国OpenAI公司和中国百度研发，均致力于提供卓越的人工智能对话体验。接下来，我们将从智能回复、语言准确性以及知识库丰富度等核...

人工智能 2024-05-31 人工智能

1099阅读

Stable Diffusion 3.0技术论文解读

前几周 AI绘画领域扔出了一颗重磅炸弹那就是Stability AI发布了备受期待的Stable Diffusion 3.0 简称SD3 一周后官方放出了一篇详尽的技术论文阐述了SD3实现突破性进展的底层原理但是同时也引发了一连串疑问...

生成式AI 2024-05-31 人工智能

969阅读

产品经理的AI秘籍：从AIGC到大模型，让你笑傲智能时代

文章目录 @[TOC](文章目录前言一、什么是AIGC？二、什么是大模型 2.1 大模型特点 2.2 大模型里程碑——Transformer的发布 2.2.1 Transformer通俗解释 2.2.2 基于Tran...

生成式AI 2024-05-31 人工智能

1095阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1609阅读

大模型应用开发之业务架构和技术架构（从AI Embedded 到 Copilot,再到Agent）

前言本文我们重点讲的就是伴随着大模型的广泛应用，这些概念是在什么体系和场景下衍生的；换句话说，基于LLM，目前大家在做的应用，他主流的业务架构和技术架构都是什么样子的，我们在了解之后，可以根据依据我们现实的业务需求，来选择自己的技术路线。技术往...

大数据 2024-05-31 人工智能

1098阅读

阅读llama源码笔记_1

文章目录总体逻辑 1 构造模型 2 定义数据 3 处理下游任务 1.构造模型 1.1构造分词器tokenizer 1.2构造Transformer 2.定义数据 3.处理下游任务 3.1分词（编码） 3.2 generate...

大数据 2024-05-30 人工智能

817阅读

Stable Diffusion文生图技术详解：从零基础到掌握CLIP模型、Unet训练和采样器迭代

文章目录概要 Stable Diffusion 底层结构与原理文本编码器（Text Encoder）图片生成器（Image Generator）那扩散过程发生了什么？ stable diffusion 总体架构主要模块分析 Un...

人工智能 2024-05-30 人工智能

1536阅读

如何将大型语言模型（LLM）转换为嵌入模型

译者 | 李睿审校 | 重楼实验证明，LLM2Vec模型在嵌入任务上具有更好的性能，它可以为组织开辟新的场所，并以非常低的成本快速创建专门的嵌入模型。嵌入模型已经成为大型语言模型(LLM 应用的重要组成部分，可以实现检测文本相似度、信息检索和聚类...

大数据 2024-05-30 人工智能

919阅读

whisper之初步使用记录

文章目录前言一、whisper是什么？二、使用步骤 1.安装 2.python调用 3.识别效果评估 4.一点封装 5.参考链接总结前言随着AI大模型的不断发展，语音识别等周边内容也再次引发关注，通过语音转文字再与大模...

人工智能 2024-05-30 人工智能

1189阅读

详解各种LLM系列｜LLaMA 2模型架构、预训练、SFT内容详解 (PART1)

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好，这里是 NewBeeNLP。之前我们分享了详解各种LLM系列｜...

生成式AI 2024-05-29 人工智能

1487阅读

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1960阅读

Meta AI的首席执行官LeCun：不要从事LLM工作

出品 | 51CTO技术栈（微信号：blog51cto）在巴黎举行的初创企业年度技术大会VivaTech上，Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM（大型语言模型）方面的工作。 “如果你是对构建下一...

AIGC 2024-05-29 人工智能

867阅读

通俗易懂的Stable Diffusion模型结构介绍

目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器文本向量输入Unet VAE模型总结图 SD的发展历程 Stab...

AIGC 2024-05-29 人工智能

1345阅读

MIT最新力作：用GPT-3.5解决时间序列异常检测问题

今天给大家介绍一篇MIT上周发表的文章，使用GPT-3.5-turbo解决时间序列异常检测问题，初步验证了LLM在时间序列异常检测中的有效性。整个过程没有进行finetune，直接使用GPT-3.5-turbo进行异常检测，文中的核心是如何将时间序列转换...

生成式AI 2024-05-29 人工智能

1021阅读

Stable Diffusion AI绘画：从提示词到模型出图的全景指南

? 个人网站:【摸鱼游戏】【神级代码资源网站】【工具大全】 ? 一站式轻松构建小程序、Web网站、移动应用：?注册地址 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流，摸鱼划水的小伙伴，请点击【全栈技术交流群】 Stable...

大数据 2024-05-29 人工智能

858阅读

【AIGC】Mac Intel 本地 LLM 部署经验汇总（CPU Only）

书接上文，在《【AIGC】本地部署 ollama(gguf 与项目整合》章节的最后，我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型，在非 Stream 模式下需要 89 秒才完成一轮问答，响应速度实在是太...

人工智能 2024-05-29 人工智能

1721阅读

使用 LLaMA Factory 微调 Llama-3 中文对话模型

原文：https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing#scrollTo=gf60HoT633NY 请申请一个免费 T4 GPU 来...

人工智能 2024-05-29 人工智能

1792阅读

在树莓派上运行语音识别和LLama-2 GPT!

目前，绝大多数大模型运行在云端服务器，终端设备通过调用api的方式获得回复。但这种方式有几个缺点：首先，云api要求设备始终在线，这对于部分需要在无互联网接入的情况运行的设备很不友好；其次，云api的调用需要消耗流量费，用户可能不想支付这部分费用；最后，如...

人工智能 2024-05-28 人工智能

1120阅读

适应多形态多任务，最强开源机器人学习系统「八爪鱼」诞生

在机器人学习方面，一种常用方法是收集针对特定机器人和任务的数据集，然后用其来训练策略。但是，如果使用这种方法来从头开始学习，每一个任务都需要收集足够数据，并且所得策略的泛化能力通常也不佳。原理上讲，从其它机器人和任务收集的经验能提供可能的解决方案，能让...

生成式AI 2024-05-28 人工智能

900阅读

国产开源Sora上新：全面支持国产AI算力，可用ReVideo视频编辑，北大-兔展团队出品

北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan，今起可以生成最长约21秒的视频了! 生成的视频水平，如下展示。先看这个长一点的，9.2s: 当然了，老规矩，这一次的所有数据、代码和模型，继续开源。目前，Open-Sora-Plan在...

人工智能 2024-05-28 人工智能

857阅读

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注大语言模型的微...

AIGC 2024-05-28 人工智能

929阅读

实战whisper语音识别第一天，部署服务器，可远程访问，实时语音转文字（全部代码和详细部署步骤）

Whisper是OpenAI于2022年发布的一个开源深度学习模型，专门用于语音识别任务。它能够将音频转换成文字，支持多种语言的识别，包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下（如不同的背景噪声水平、说话者的口音...

人工智能 2024-05-28 人工智能

1242阅读

Llama 3 安装使用方法

Llama3简介： llama3是一种自回归语言模型，采用了transformer架构，目前开源了8b和70b参数的预训练和指令微调模型，400b正在训练中，性能非常强悍，并且在15万亿个标记的公开数据进行了预训练，比llama2大了7倍，距离llam...

生成式AI 2024-05-28 人工智能

1296阅读

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自华为云社区《使用Python实现深度学习模型：注意力机制（Attention）》，作者：Echo_Wish。在深度学习的世界里，注意力机制（Attention Mechanism）是一种强大的技术，被广泛应用于自然语言处理（NLP）和计算机视...

AIGC 2024-05-28 人工智能

865阅读