transformer 第13页

一文了解大语言模型（LLM）

人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备，激光雷达可以实现自动驾驶。当2023年，OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时，大语言模型的概念出现在我们面前。在自然语言处理领域的大语言模型（La...

AIGC 2024-04-23 人工智能

932阅读

这个AI赛道，一个月内融资4笔，一大半的创始人是华人

声明:本文来自微信公众号“白鲸出海”（ID:baijingapp），作者:张凯然，授权站长之家转载发布。仅在2024年3月一个月，就有三个华人创立的 AI 视频生成创企获得了融资，而且融资额都过了千万美金。 1、3月7日，总部位于英国伦敦的Haiper宣...

人工智能 2024-04-23 人工智能

920阅读

超越BEVFusion！DifFUSER：扩散模型杀入自动驾驶多任务（BEV分割+检测双SOTA）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解目前，随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多，工业界和学术界非常希望一个理想的感知算法模型，可以同时完成如3D目标检测以及基于BEV空间的语义分...

AIGC 2024-04-22 人工智能

899阅读

4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Fo...

人工智能 2024-04-22 人工智能

896阅读

如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征？

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人理解自动驾驶的基础任务之一是三维目标检测，而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合，又或者是毫米波雷达和相机融合，其最主要的目的就是...

大数据 2024-04-20 人工智能

966阅读

自回归超越扩散！北大、字节 VAR 范式解锁视觉生成 Scaling Law

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...

大数据 2024-04-20 人工智能

953阅读

JS 的 AI 时代来了

近几年，技术飞速发展，AI 正以前所未有的速度改变着我们的生活。而在这一浪潮中，JS 作为前端开发的基石，也正在迎来其 AI 时代的新篇章。本文将分享几个引领 JS 迈向 AI 时代的机器学习库，探索这些库的魅力，携手迎接 JS 的 AI 时代吧！ T...

AIGC 2024-04-12 人工智能

944阅读

轨迹预测系列 | HiVT之进化版QCNet到底讲了啥？

本文经自动驾驶之心公众号授权转载，转载请联系出处。 HiVT的进化版（不先看HiVT也能直接读这篇），性能和效率上大幅提升。文章也很容易阅读。【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...

AIGC 2024-04-12 人工智能

1728阅读

等等我还没上车！LLM赋能端到端全新范式LeGo-Drive，车速拉满

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人理解这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹，实现了从导航指令到目标位置的端到端闭...

人工智能 2024-04-12 人工智能

975阅读

InternLM2官网体验入口中文AI聊天机器人模型使用地址

InternLM2是一个面向中文和英文的大型多语言预训练语言模型。它具有语言理解、自然语言生成、多模式推理、代码理解等强大的能力。模型采用Transformer架构并进行海量数据的预训练，在长文本理解、对话、数学运算等多个方向上都达到了业界领先水平。该系列...

AIGC 2024-04-12 人工智能

904阅读

扩散模型如何帮助创建更好的强化学习系统

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名，它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...

生成式AI 2024-04-12 人工智能

923阅读

国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦效果惊艳

【新智元导读】国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后，整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路，他们赌赢了:比OpenAI提前押中了Sora架构，并且首次在业内公开技术图。最近几周的震...

大数据 2024-04-11 人工智能

1003阅读

从AIGC到AGI，为什么我们需要更多的“技术信仰派”？

整理 | 伊风采访 | 张晓楠嘉宾 | 巴川、朱雷、肖然出品 | 51CTO技术栈（微信号：blog51cto）作为AIGC应用落地元年，2024开年就抛给我们一些不太好回答的问题：在以探索AGI为长期目标时，我们该坚守技术信仰吗？除了复制...

人工智能 2024-04-11 人工智能

848阅读

大模型的学习 LLaMa和ChatGLM，minichatgpt4

LLaMa和ChatGLM，minichatgpt4 什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？答：Bert 的模型由多层双向的Transformer编码器组成，由12层组成，768隐藏单元，12个head，总参数量...

大数据 2024-04-11 人工智能

965阅读

十个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...

生成式AI 2024-04-11 人工智能

1137阅读

AIGC实战——StyleGAN(Style-Based Generative Adversarial Network)

AIGC实战——StyleGAN 0. 前言 1. StyleGAN 1.1 映射网络 1.2 合成网络 1.3 自适应实例归一化层 1.4 风格混合 1.5 随机变化 2. StyleGAN 生成样本 3. StyleGAN2 3.1...

生成式AI 2024-04-11 人工智能

1734阅读

2024-03-26 AIGC-大模型学习路线

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

大数据 2024-04-11 人工智能

2369阅读

开源模型首胜GPT-4！竞技场最新战报引热议，Karpathy：这是我唯二信任的榜单

能打得过GPT-4的开源模型出现了！大模型竞技场最新战报： 1040亿参数开源模型Command R+攀升至第6位，与GPT-4-0314打成平手，超过了GPT-4-0613。图片这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。大模型竞...

大数据 2024-04-10 人工智能

801阅读

RAG 修炼手册｜一文讲透 RAG 背后的技术

在之前的文章中《RAG 修炼手册｜RAG敲响丧钟？大模型长上下文是否意味着向量检索不再重要》，我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性，也回顾了如何借助向量数据库提升 RAG 实战效果。今天我们继续剖析 RAG，将为大家大家详细介绍...

AIGC 2024-04-10 人工智能

924阅读

每周AI新闻（2024年第11周）Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布

这里是陌小北，一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的，背诗的里面最会写段子的，写段子的里面代码写得最好的…厨子。每周日解读每周AI大事件。欢迎关注同名公众号【陌北有棵树】，关注AI最新技术与资讯。大厂动向 M...

生成式AI 2024-04-10 人工智能

879阅读

AIGC-Stable Diffusion发展及原理总结

目录一. AIGC介绍 1. 介绍 2. AIGC商业化方向 3. AIGC是技术集合 4. AIGC发展三要素 4.1 数据 4.2 算力 4.3 算法 4.3.1 多模态模型CLIP 4.3.2 图像生成模型二. Stable...

生成式AI 2024-04-10 人工智能

1209阅读

【总结】在嵌入式设备上可以离线运行的LLM--Llama

文章目录 Llama 简介运用另一种：MLC-LLM 一个令人沮丧的结论在资源受限的嵌入式设备上无法运行LLM（大语言模型）。一丝曙光：tinyLlama-1.1b（10.1亿参数，需要至少2.98GB的RAM） Llam...

大数据 2024-04-10 人工智能

1313阅读

RWKV 模型启动工具 RWKV Runner 进阶教程（下）

在 RWKV Runner 教程的上篇（新手教程），我们讲述了如何使用 RWKV Runner 本地部署并运行 RWKV 模型： RWKV模型启动工具RWKV Runner新手教程（上）而在今天发布的教程下篇，我们将主要介绍 RWKV Runner...

大数据 2024-04-09 人工智能

1132阅读

OpenAI创始大神手搓千行C代码训练GPT，附PyTorch迁移教程

大神卡帕西（Andrej Karpathy）刚“复工”，立马带来神作：纯C语言训练GPT，1000行代码搞定！，不用现成的深度学习框架，纯手搓。发布仅几个小时，已经揽星2.3k。它可以立即编译和运行，和PyTorch完全兼容。卡帕西使用的示例是...

大数据 2024-04-09 人工智能

805阅读

五种常用于LLM的令牌遮蔽技术介绍以及Pytorch的实现

本文将介绍大语言模型中使用的不同令牌遮蔽技术，并比较它们的优点，以及使用Pytorch实现以了解它们的底层工作原理。令牌掩码Token Masking是一种广泛应用于语言模型分类变体和生成模型训练的策略。BERT语言模型首先使用，并被用于许多变体(Ro...

AIGC 2024-04-09 人工智能

882阅读

深入探索AI写作：从困惑度到爆发度的挑战与机遇

大家好，小发猫降重今天来聊聊深入探索AI写作：从困惑度到爆发度的挑战与机遇，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：深入探索AI写作：从困惑度到爆发度的挑战与机遇在AI技术飞速发展的...

AIGC 2024-04-09 人工智能

956阅读

深度学习架构的超级英雄——BatchNorm2d

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文旨在探索2D批处理规范化在深度学习架构中的关键作用，并通过简单的例子来解释该技术的内部工作原理。由作者本人创建的图像深度学习...

AIGC 2024-04-09 人工智能

1036阅读

大模型技术实践（二）｜关于Llama 2你需要知道的那些事儿

在上期文章中，我们简要回顾了Llama模型的概况，本期文章我们将详细探讨【关于Llama 2】，你需要知道的那些事儿。 01-Llama 2的性能有多好？作为Meta新发布的SOTA开源大型语言模型，Llama 2是Llama模型的延续和升级。Lla...

生成式AI 2024-04-08 人工智能

856阅读

GPT-4推理能力为0？开发者悬赏1万美金被打脸，神秘提示正确率直冲100%

【新智元导读】小孩子都会的脑筋急转弯推理题，GPT-4和Claude3做不出?国外一位开发者小哥坚称这一观点，认为GPT模型在训练集外毫无推理能力，无法实现AGI，甚至悬赏1万美元，发起比赛。然而，他当天就被光速打脸了!网友用高能的prompt，让GPT-...

人工智能 2024-04-08 人工智能

835阅读

AIGC实战——ProGAN(Progressive Growing Generative Adversarial Network)

AIGC实战——ProGAN 0. 前言 1. ProGAN 2. 渐进式训练 3. 其他技术 3.1 小批标准差 3.2 均等学习率 3.3 逐像素归一化 4. 图像生成小结系列链接 0. 前言我们已经学习了使用生成对...

人工智能 2024-04-08 人工智能

1659阅读

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。但该方法对于硬件成本要求仍然偏高且训练低效。 [NLP]理解大型语言模型高效微调(PEFT 因此， Alpac...

生成式AI 2024-04-08 人工智能

1139阅读

CS25官网体验入口斯坦福大学深度学习AI课程免费在线使用地址

CS25是斯坦福大学提供的一门课程，主要探讨深度学习模型Transformers，该模型在全球范围内产生了巨大影响。课程邀请了Transformers研究领域的前沿人物，讨论从GPT和Gemini等LLM架构到创造性应用（如DALL-E和Sora）在内的最...

AIGC 2024-04-08 人工智能

925阅读

阿里刚开源32B大模型，我们立马测试了“弱智吧”

阿里的通义千问（Qwen），终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。话不多说，直接来看“成绩单”。这次官方pick同台竞技的“选手”是Mixtral 8x7B模型和同为Qwen 1.5系列的72B模型。从结果上...

生成式AI 2024-04-08 人工智能

890阅读

无需服务器！浏览器上直接运行近 700 个 AI 模型！

本文阿宝哥将介绍 Github 上一个超强的开源项目 —— transformers.js[1]。有了它，你可以直接在浏览器中运行 Transformers，无需服务器！利用它提供的超能力，你可以在浏览器上直接运行不同的 AI 模型，实现很多非常有用的...

生成式AI 2024-04-08 人工智能

1176阅读

JS 的 AI 时代来了！

JS-Torch 简介 JS-Torch[1] 是一个从零开始构建的深度学习 JavaScript 库，其语法与 PyTorch[2] 非常接近。它包含一个功能齐全的张量对象（可跟踪梯度）、深度学习层和函数，以及一个自动微分引擎。图片 PyTorch...

人工智能 2024-04-08 人工智能

950阅读

攻陷短视频后，Sora将需要72万块H100 GPU

OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频，吸引了全世界的目光。近日，投资机构 factorial funds 发表了一篇博文，深入探讨了 Sora 背后的一些技术细节，并对这些视频模型可能产生影响进行了探讨。最后，文中还...

人工智能 2024-04-08 人工智能

880阅读

CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 物体姿态估计对于各种应用至关重要，例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据，并且不能应用于测试时未...

大数据 2024-04-08 人工智能

972阅读

stable-diffusion-webui踩坑指南

过年刷资讯AI的信息铺天盖地，准备研究研究。最后选择从AI绘画的stable diffusion入手。本地安装了最新的Python（13.12.2）然后直接克隆GitHub - Stability-AI/stablediffusion: High-Reso...

生成式AI 2024-04-08 人工智能

967阅读

CVPR 2024录用结果出炉！2719篇论文被接收，录用率23.6%

想了解更多AIGC的内容：请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了！刚刚，CVPR官方发文称，今年共提交了11532份有效论文，2719篇论文被接收，录用率为23...

大数据 2024-04-07 人工智能

917阅读

ICCV 2023 | 最全AIGC梳理，5w字30个diffusion扩散模型方向，近百篇论文！

30个方向130篇！CVPR 2023最全AIGC论文 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2...

大数据 2024-04-07 人工智能

1679阅读

[论文笔记]LLaMA: Open and Efficient Foundation Language Models

引言今天带来经典论文 LLaMA: Open and Efficient Foundation Language Models 的笔记，论文标题翻译过来就是 LLaMA:开放和高效的基础语言模型。 LLaMA提供了不可多得的大模型开发思路，为很多国...

AIGC 2024-04-07 人工智能

1473阅读

小白也能微调大模型：LLaMA-Factory使用心得

大模型火了之后，相信不少人都在尝试将预训练大模型应用到自己的场景上，希望得到一个垂类专家，而不是通用大模型。目前的思路，一是RAG(retrieval augmented generation ，在模型的输入prompt中加入尽可能多的“目标领域”的相...

大数据 2024-04-07 人工智能

2648阅读

谷歌更新Transformer架构，更节省计算资源！50%性能提升

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。最新发布的Mixture-of-Depths（MoD），改变了以往Transformer计...

大数据 2024-04-07 人工智能

919阅读

AIGC在广告创意上的实践

1 引言 1.1 背景随着抖音、小红书等新媒体的快速崛起，新媒体广告需求日益增大。而新媒体广告投放的图片和文案创意占用了运营工作者大量的精力和时间。文案、图片、视频广告创意制作难度大、效率低、成本高、周期长的问题日益凸显。如何快速的完成广告创意，...

AIGC 2024-04-06 人工智能

1106阅读

音乐ChatGPT 2.0来了！AI作曲家被踢馆，亲测周杰伦爆款大翻车

【新智元导读】200名音乐人联名信抗议的消息刚出，Stability AI的新音乐工具就来了!刚刚发布的Stable Audio2.0，可以创作长达3分钟的音乐，哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望…… 200多名音乐...

大数据 2024-04-05 人工智能

877阅读

【小白】一文读懂AIGC模型之Stable Diffusion模型

目录模型简介模型结构 VAE变分编码器 VAE结构 VAE模型训练与损失函数 U-Net结构 CLIP Text Encoder 模型工作流程参考模型简介 Stable Diffusion（SD）模型是一种基于...

AIGC 2024-04-05 人工智能

1404阅读

【AI】在本地 Docker 环境中搭建使用 Hugging Face 托管的 Llama 模型

目录 Hugging Face 和 LLMs 简介利用 Docker 进行 ML 格式的类型请求 Llama 模型访问创建 Hugging Face 令牌设...

人工智能 2024-04-04 人工智能

2000阅读

Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台 Stability.ai 在官网正式发布了音频模型 Stable Audio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。相较于之前的版本，Stable Audio2.0采用了 Dif...

人工智能 2024-04-04 人工智能

785阅读

【Python】科研代码学习：十五 configuration，tokenization 的代码细节：Llama 为例

【Python】科研代码学习：十五 tokenizer的代码细节：Llama_Tokenization 为例前言 `LlamaConfig`：网络参数配置 `LlamaTokenizer`：分词工具前言对于 HF 的 Tr...

生成式AI 2024-04-04 人工智能

1173阅读

AIGC学习笔记——DALL-E2详解+测试

它主要包括三个部分：CLIP，先验模块prior和img decoder。其中CLIP又包含text encoder和img encoder。（在看DALL·E2之前强烈建议先搞懂CLIP模型的训练和运作机制,之前发过CLIP博客）论文地址：https...

AIGC 2024-04-04 人工智能

1379阅读