嵌入向量 - AIGC资讯

万字长文｜LLM大模型基础入门（非常详细）从入门到精通系列之：（三）Transformer 架构

...

生成式AI 2024-09-24 未命名

1144阅读

24全网最全stable diffusion模型讲解！快来！！新手必收藏！！

前言手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出...

生成式AI 2024-09-21 人工智能

1117阅读

llama神经网络的结构，llama-3-8b.layers=32 llama-3-70b.layers=80； 2000汉字举例说明

AI大模型全套学习资料 “最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识...

大数据 2024-09-16 人工智能

1070阅读

第十届Sky Hackathon参赛作品——rag在工业上的运用

一、赛事简介 NVIDIA Sky Hackathon是由NVIDIA主办的一场全球性技术盛会，旨在推动深度学习技术的创新和应用。本届比赛以“基于RAG技术创新构建智能对话机器人”为核心议题，鼓励参赛者运用RAG（Retrieval-Augmented...

AIGC 2024-09-14 人工智能

1207阅读

使用PyTorch从零构建Llama 3

我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后，有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了，本文将详细指导如何从零开始构建完整的Llama 3模型架构，并在自定义数据集上执行训练和推理。 [图1]：Llama...

人工智能 2024-09-05 人工智能

921阅读

【扩散模型（六）】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分

系列文章目录【扩散模型（一）】中介绍了 Stable Diffusion 可以被理解为重建分支（reconstruction branch）和条件分支（condition branch）【扩散模型（二）】IP-Adapter 从条件分支的视角，快...

生成式AI 2024-09-04 人工智能

1809阅读

AIGC学习笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言提示：这里可以添加本文要记录的大概内容：记录一下学习AIGC，参考链接: 爆火的AIGC到底是什么提示：以下是本篇文章正文内容，下面案例可供参考一、stab...

AIGC 2024-08-21 人工智能

887阅读

超详细高质量图解 Stable Diffusion

最近有一篇国外博主分享的图解Stable Diffusion 博客写的非常的好，让你从零开始彻底搞懂图像生成模型的原理，我在这里给大家专业翻译整理一下。正文开始人工智能图像生成是最新的人工智能功能，令人惊叹不已（包括我的）。从文本描述中创造出...

人工智能 2024-07-31 人工智能

826阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1253阅读

AI绘画：多种XP一次满足（Stable Diffusion进阶篇：模型训练）

前言今天，是一个比较特殊的日子。从我开始学习AI绘画开始到现在AI工具相关的笔记我已经写了50篇了，其中估摸着得近40篇都是关于Stable Diffusion的。在这一天天的学习中我感受到了对知识的疲倦，是时候给自己来点奖励了！所以...

大数据 2024-07-20 人工智能

951阅读

Stable Diffusion模型训练 — Embeddings（附Demo）

文本反演提到文本反演你可能会比较陌生，但它产出的模型类型Embeddings（词嵌入）一定是你出图过程里经常会使用到的，它是一种轻量、小巧的微调模型格式，文件名后缀一般为.pt（或.safetensor），每个Embeddings文件的大小在几KB到几...

大数据 2024-07-20 人工智能

1342阅读

Llama 3-V：以100倍小的模型和500美元匹敌GPT4-V视觉模型

概述 Llama3 的横空出世震惊了世界，它在几乎所有基准测试中都超越了 GPT-3.5，并在一些方面超越了 GPT-4。随后，GPT-4o 的出现凭借其多模态能力再次夺回了王座。今天，我们发布了一个改变现状的产品：Llama3-V，这是首个基于 Ll...

AIGC 2024-06-25 人工智能

1269阅读

Llama 3-V: 比GPT4-V小100倍的SOTA

大模型技术论文不断，每个月总会新增上千篇。本专栏精选论文重点解读，主题还是围绕着行业实践和工程量产。若在某个环节出现卡点，可以回到大模型必备腔调重新阅读。而最新科技（Mamba，xLSTM,KAN）则提供了大模型领域最新技术跟踪。若对于如果构建生成级别的A...

人工智能 2024-06-25 人工智能

1149阅读

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

1398阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMa

LLaMA详解 LLaMA（Large Language Model Meta AI）是由Meta（前身为Facebook）开发的一种大规模语言模型，旨在提高自然语言处理（NLP）任务的性能。LLaMA基于变换器（Transformer）架构，并经过大...

生成式AI 2024-06-09 人工智能

1286阅读

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也称为文本反转，是在 Stable Diffusion 中控制图像样式的另一种方法。在这篇文章中，我们将学习什么是嵌入，在哪里可以找到它们，以及如何使用它们。什么是嵌入embeddin...

人工智能 2024-06-08 人工智能

855阅读

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码的简介、核心思路梳理导读：这篇论文实现了transformer网络的llama3模型...

AIGC 2024-06-05 人工智能

2245阅读

大规模语言模型--LLaMA 家族

LLaMA 模型集合由 Meta AI 于 2023 年 2 月推出，包括四种尺寸(7B 、13B 、30B 和 65B 。由于 LLaMA 的开放性和有效性，自从 LLaMA 一经发布，就受到了研究界和工业界的广泛关注。LLaMA 模型在开放基准...

大数据 2024-06-04 人工智能

1466阅读

详解各种LLM系列｜LLaMA 2模型架构、预训练、SFT内容详解 (PART1)

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好，这里是 NewBeeNLP。之前我们分享了详解各种LLM系列｜...

生成式AI 2024-05-29 人工智能

1466阅读

手撕Llama3第1层: 从零开始实现llama3

一、Llama3的架构在本系列文章中，我们从头开始实现llama3。 Llama3的整体架构：图片 Llama3的模型参数：让我们来看看这些参数在LlaMa 3模型中的实际数值。图片 [1] 上下文窗口（context-window）在实例化Lla...

人工智能 2024-05-27 人工智能

1914阅读

Hinton万字访谈：用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近，图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。视频链接：https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 在访谈中，Hi...

生成式AI 2024-05-22 人工智能

954阅读

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。 LangCell的数据集中包...

生成式AI 2024-05-16 人工智能

933阅读

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。主题是：自动检测大模型中那些会导致“故障”的token。图片简单来说，由于大模型tokenizer的创建和模型训练是分开的，可能导致某些token在训练中很少...

人工智能 2024-05-13 人工智能

817阅读

一文读懂 LLM 的构建模块：向量、令牌和嵌入

在当今信息爆炸的时代，我们不断面临着海量文本数据的挑战。为了有效地处理和理解这些数据，自然语言处理（NLP）领域的研究者们一直在不断探索和创新。而其中一个重要的研究方向就是语言模型（Language Model）。在这篇文章中，我们将一起探索和理解...

大数据 2024-04-24 人工智能

1022阅读

超越BEVFormer！CR3DT：RV融合助力3D检测&跟踪新SOTA（ETH）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解本文介绍了一种用于3D目标检测和多目标跟踪的相机-毫米波雷达融合方法（CR3DT）。基于激光雷达的方法已经为这一领域奠定了一个高标准，但是其高算力、高成本的缺陷制约了...

生成式AI 2024-04-24 人工智能

989阅读

教育领域大模型技术与应用

苏喻博士，高级工程师，合肥人工智能研究院副研究员，原科大讯飞AI 教育研究院副院长，中国科学技术大学博士后，安徽省青少年信息学教育专委会秘书长，CCF 大专委-通讯委员，合肥市 D 类人才。苏喻博士一直在智慧教育方向深耕，聚焦于青少年编程。面对数据稀疏...

大数据 2024-04-02 人工智能

1354阅读

AI绘画Imagen大力出奇迹生成图像

AI绘画Imagen大力出奇迹生成图像介绍 Imagen是一个文本到图像的扩散模型，由Google大脑团队研究所开发。 Imagen通过创新的设计，摈弃了需要预训练视觉-语言模型的繁琐步骤，直接采用了T5等大规模语言模型作为文...

大数据 2024-03-29 人工智能

1002阅读

ChatGPT参数规模被扒：只有7B

ChatGPT惨遭攻击，参数规模终于被扒出来了—— 很可能只有7B（70亿）。消息来自南加州大学最新研究，他们使用一种攻击方法，花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。果然，OpenAI不Open，自有别人帮他...

AIGC 2024-03-19 人工智能

766阅读

万字带你了解ChatGLM

本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题（第二期）-第一课：ChatGLM》，作者：愚公搬代码。前言 1.昇思MindSpore 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动...

大数据 2024-03-13 人工智能

1133阅读

【复现】FreeU以及结合stable diffusion

code：GitHub - ChenyangSi/FreeU: FreeU: Free Lunch in Diffusion U-Net 目录代码分析模型复现问题效果总结 FreeU + Diffusers 才发现Ani...

生成式AI 2024-03-08 人工智能

1229阅读

详解各种LLM系列｜（2）LLaMA 2模型架构、预训练、SFT内容详解 (PART-1)

一、引言 Llama 2是Meta在LLaMA基础上升级的一系列从 7B到 70B 参数的大语言模型。Llama2 在各个榜单上精度全面超过 LLaMA1，Llama 2 作为开源界表现最好的模型之一，目前被广泛使用。为了更深入地理解Llama 2的...

大数据 2024-02-27 人工智能

1431阅读

用python实现调用百度文心一言

要使用Python调用百度文心一言，你需要使用百度提供的API。具体步骤如下：前往百度AI开放平台官网，注册并创建一个应用。在创建应用时，你需要填写相关信息，并选择你要使用的API服务。在创建应用后，你会获得一个API密钥。这个密钥是用来验证你的应...

人工智能 2024-02-20 人工智能

998阅读

如何免费访问和使用Gemini API？

Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本，获得几乎完美的答案。我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各种Python API函数，包括文本生成和图像理解。 Gemini A...

大数据 2024-02-18 人工智能

2305阅读

用通俗易懂的方式讲解：十分钟读懂 Stable Diffusion 运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊艳其出色表...

大数据 2024-02-11 人工智能

1451阅读

详解各种LLM系列｜LLaMA 1 模型架构、预训练、部署优化特点总结

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』，加入 NewBee讨论组 LLaMA 是Meta在2...

生成式AI 2024-02-10 人工智能

1917阅读

AIGC 语言大模型研究报告

AIGC 研究报告这份报告可以被划分为两大部分。第一部分集中于ChatGPT的发展和运作原理，为了增强理解，我们将先探讨自然语言处理的历史发展。第二部分主要聚焦于由大模型引领的新的研究领域，并深入介绍在每个领域中可以进行的具体研究工作及思...

生成式AI 2024-02-10 人工智能

1061阅读

stable diffusion实践操作-SD原理

系列文章目录本文专门开一节写SD原理相关的内容，在看之前，可以同步关注：stable diffusion实践操作文章目录系列文章目录前言一、原理说明 1.1、出图原理 1.1.1 AI画画不是和人一样，从0开始，而是一...

AIGC 2024-02-08 人工智能

931阅读

全网最全stable diffusion模型讲解！快来！！小白必收藏！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出人们的预期...

人工智能 2024-02-08 人工智能

1383阅读

【AI绘画】stable diffusion原理解读，通俗易懂，直接喂到你嘴里！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）文章目录一、前言（可跳过）二、stable diffusion 1.clip 2...

AIGC 2024-02-04 人工智能

1099阅读

图领域首个通用框架来了！入选ICLR'24 Spotlight，任意数据集、分类问题都可搞定

能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性，又能够给出社交网络的朋友推荐？或者既能预测不同作者的论文引用，还可以发现基因网络中的人类衰老机制？你还真别说，被ICLR 2024接收为Spotlight的“One for All（OFA）...

生成式AI 2024-02-04 人工智能

888阅读

Textual Inversion、DreamBooth、LoRA、InstantID：从低成本进化到零成本实现IP专属的AI绘画模型

2023年7月份国内有一款定制写真AI工具爆火。一款名为妙鸭相机的AI写真小程序，成功在C端消费者群体中出圈，并在微信、微博和小红书等平台迅速走红，小红书上的话题Tag获得了330多万的浏览量，相关微信指数飙升到了1800万以上。其他能够提供类似功能例...

生成式AI 2024-02-01 人工智能

1109阅读

Stable Diffusion（SD）核心基础知识——（文生图、图生图）

文章目录一、Stable Diffusion核心基础原理（一）Stable Diffusion模型工作流程（二）Stable Diffusion模型核心基础原理（三）Stable Diffusion的训练过程（四）其他主流生成式模型...

生成式AI 2024-02-01 人工智能

1723阅读

2024年1月17日Arxiv最热论文推荐：清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台（saibomaliang.com）上的智能体「AI论文解读达人」提供。如需查看其他热门论文，欢迎移步 ...

AIGC 2024-01-29 人工智能

1258阅读

【AIGC】从零手写一个GPT

手写一个GPT 在GPT，确切的说是Transformer，出现之前，一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。比如我们有两句话我喜欢你吾中意你它们作为句子内容并不一样，但是表达的含义却...

人工智能 2024-01-29 人工智能

1014阅读

十分钟读懂Stable Diffusion运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊...

生成式AI 2024-01-29 人工智能

969阅读

从零手搓MoE大模型，大神级教程来了

传说中GPT-4的“致胜法宝”——MoE（混合专家）架构，自己也能手搓了！ Hugging Face上有一位机器学习大神，分享了如何从头开始建立一套完整的MoE系统。这个项目被作者叫做MakeMoE，详细讲述了从注意力构建到形成完整MoE模型的过程。...

人工智能 2024-01-29 人工智能

831阅读

GPT-4「变懒」bug被修复，价格暴降80%！OpenAI连更5款新模型，性能狂飙

GPT-4又双叒叕变强了！今天，OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。不仅大幅改善了模型「偷懒」的情况，而且还极大地提升了代码生成的能力。图片与此同时，OpenAI还发布了一系列模型和API...

大数据 2024-01-26 人工智能

895阅读

AIGC：文生图模型Stable Diffusion

1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型，它通过LAION-5B子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文...

生成式AI 2024-01-26 人工智能

1017阅读

Video-LLaMA 论文精读

Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding video-LLaMA 一种用于视频理解的指令调整视听语言模型引言 ...

大数据 2024-01-22 人工智能

1008阅读

番外篇Diffusion&Stable Diffusion扩散模型与稳定扩散模型

文章目录 Diffusion&Stable Diffusion扩散模型与稳定扩散模型摘要 Abstract Diffusion Model扩散模型 Forward Diffusion Process正向扩散过程噪声图像的分布...

生成式AI 2024-01-19 人工智能

1185阅读